Skip to content
Back to Blog
format-comparisons

CSV vs. XLSX vs. JSON: Das richtige Datenformat auswählen

2026-05-17 9 Min. Lesezeit

Warum die Wahl deines Formats wirklich zählt

Das falsche Datenformat zu wählen, führt zu echtem, vermeidbarem Ärger. Stundenlanges Bereinigen fehlerhafter Importe, Herumschlagen mit Kodierungsfehlern oder das Erklären gegenüber einem verblüfften Kollegen, warum seine Tabellenkalkulationsformeln plötzlich nicht mehr funktionieren. Das ist kein seltenes technisches Problem; es ist die tägliche Reibung, die Projekte für Analysten, Entwickler und Ops-Teams zermürbt. Du wirst fast immer mit einem von drei Formaten arbeiten: CSV, XLSX oder JSON. Oberflächlich sehen sie ähnlich aus, aber sie lösen völlig unterschiedliche Probleme. CSV ist ein 50 Jahre altes Arbeitstier im reinen Textformat, das fast jedes Tool auf der Welt lesen kann. XLSX ist Microsofts leistungsstarker Container für Tabellenkalkulationen, der weit mehr als nur Rohdaten enthält. JSON ist die Muttersprache des Webs und treibt APIs und moderne Anwendungen an. Keines ist „besser“ als die anderen. Ein Produktkatalog mit 10 Spalten von Shopify? Exportiere ihn als CSV und er landet in 30 Sekunden ohne Drama in Google Sheets. Derselbe Katalog, über eine API geliefert? Das muss JSON sein. Und wenn dein Finanzteam Pivot-Tabellen, bedingte Formatierungen und benannte Bereiche benötigt, wird nur XLSX die Aufgabe erfüllen. Dieser Leitfaden gibt dir einen praktischen Rahmen, um das richtige Format für die Aufgabe zu wählen, die du tatsächlich erledigst, und nicht basierend auf einer abstrakten technischen Debatte.

CSV: Stärken, Schwächen und wann es die richtige Wahl ist

CSV, oder Comma-Separated Values, ist so einfach, wie Datenformate nur sein können. Jede Zeile ist nur eine Textzeile, und die Felder werden durch ein Komma (oder manchmal ein Tabulator oder Semikolon) getrennt. Keine Formeln, keine Schriftarten, keine Datentypen. Nur Text. Diese radikale Einfachheit ist sowohl seine größte Stärke als auch seine frustrierendste Schwäche. Die Stärke ist unbestreitbar. CSV-Dateien sind winzig. Ein Datensatz mit 500.000 Zeilen, der als XLSX 45 MB beansprucht, kann auf nur 8 MB als CSV schrumpfen. Besser noch: Alles kann es lesen. Der COPY-Befehl von PostgreSQL, das eingebaute csv-Modul von Python, read.csv() von R – sie alle verarbeiten CSV nativ, ohne spezielle Bibliotheken. Für ETL-Jobs, Datenmigrationen oder Massen-Uploads in Tools wie Salesforce oder Mailchimp ist CSV der unangefochtene Champion. Aber die Schwächen sind sehr real. CSV hat keine Ahnung, was ein „Datentyp“ ist. Eine Postleitzahl wie 00147 wird zu 147, es sei denn, dein Import-Tool ist schlau genug, sie als Text zu behandeln. Datumsangaben sind ein Albtraum; jeder, der versucht hat, Daten aus US- (MM/TT/JJJJ) und europäischen (TT.MM.JJJJ) Quellen zusammenzuführen, kennt diesen Schmerz. Ist der 04.05.2026 der 5. April oder der 4. Mai? Bei CSV ist es ein Glücksspiel. Dann gibt es das Chaos mit eingebetteten Kommas oder Zeilenumbrüchen, die eine perfekte Anführung erfordern, die viele Exporter einfach nicht richtig hinbekommen. Und vergiss nicht die Zeichenkodierung, bei der eine Nichtübereinstimmung zwischen UTF-8 und Windows-1252 den berüchtigten verstümmelten Text erzeugt. Also, hier ist die Regel: Verwende CSV, wenn deine Daten eine einfache, flache Tabelle sind, du maximale Kompatibilität benötigst oder die Dateigröße entscheidend ist. Wenn du Formatierungen beibehalten, Datentypen erzwingen oder verschachtelte Daten verarbeiten musst, schau dich woanders um.

XLSX: Mehr als eine Tabelle, weniger als eine Datenbank

XLSX ist seit 2007 das Standardformat für Microsoft Excel und wird fließend von Google Sheets, LibreOffice Calc und jedem ernsthaften BI-Tool gesprochen. Hier ein lustiger Fakt: Eine XLSX-Datei ist eigentlich ein ZIP-Archiv voller XML-Dateien. Du kannst es selbst beweisen, indem du eine .xlsx-Datei in .zip umbenennst und ihren Inhalt erkundest. Diese Architektur verleiht XLSX seine Stärke. Im Gegensatz zum „Alles ist Text“-Ansatz von CSV speichert XLSX echte Datentypen. Ein Datum wird als Seriennummer (wie 46188 für den 17. Mai 2026) mit einem separaten Formatcode gespeichert, sodass es für den Benutzer immer korrekt angezeigt wird. Zahlen sind Zahlen, mit bis zu 15 signifikanten Stellen Genauigkeit. Booleans sind TRUE/FALSE, keine mehrdeutigen Zeichenketten. Darüber hinaus bietet XLSX Unterstützung für mehrere Blätter, benannte Bereiche, Formeln, Diagramme, Pivot-Tabellen und Datenvalidierungsregeln – alles in einer einzigen Datei. Für jeden Bericht, der an einen nicht-technischen Kollegen weitergegeben wird – insbesondere im Finanz- oder Betriebsbereich – ist XLSX die einzig professionelle Wahl. Ihnen eine CSV zu schicken, bedeutet nur, ihnen Arbeit zu machen. Aber es ist keine Datenbank. Das programmgesteuerte Parsen einer XLSX-Datei mit 200.000 Zeilen mit pandas kann 10–15 Sekunden dauern, während dieselben Daten im CSV-Format in unter zwei Sekunden geladen werden. Und sei gewarnt: XLSX hat eine harte Grenze von 1.048.576 Zeilen pro Blatt. Wenn du einen größeren Datensatz exportierst, wird er stillschweigend abgeschnitten. Die Komplexität des Formats mit Dingen wie verbundenen Zellen und ausgeblendeten Zeilen kann auch für automatisierte Skripte zu großen Kopfschmerzen führen. Wähle XLSX, wenn dein Publikum ein Mensch ist, der Tabellenkalkulationssoftware verwendet, du umfangreiche Formatierungen oder mehrere Blätter benötigst und Datentypen ohne Aufwand perfekt erhalten bleiben sollen.

JSON: Der Standard für Entwickler und seine wahren Kompromisse

JSON, oder JavaScript Object Notation, ist die Sprache des modernen Webs. Es ist das Standardformat für REST-APIs, Konfigurationsdateien und NoSQL-Datenbanken wie MongoDB. Sein Killer-Feature und der Grund für seine Dominanz ist die Fähigkeit, verschachtelte, hierarchische Daten nativ darzustellen. Ein einziges JSON-Objekt kann eine Bestellung beschreiben, die ein Array von Positionen enthält, wobei jede Position ihre eigene Liste von Produktattributen hat. Der Versuch, dies in CSV abzubilden, würde mindestens drei separate Dateien und eine Menge Verknüpfungsschlüssel erfordern. Deshalb erhältst du JSON, wenn du Daten von Stripe, Twilio oder der Google Maps API bekommst. Wenn du Daten an einen Webhook sendest, sendest du JSON. Es ist aus gutem Grund der Standard. JSON bewahrt auch Datentypen sauber: Zeichenketten stehen in Anführungszeichen, Zahlen nicht, Booleans sind true/false und null ist ein eigener, eindeutiger Wert. Es gibt keine Mehrdeutigkeit. Aber diese Stärke hat ihren Preis, besonders bei einfachen tabellarischen Daten. Eine flache Tabelle mit 100.000 Zeilen, die als JSON-Array von Objekten gespeichert wird, wiederholt jeden einzelnen Feldnamen 100.000 Mal. Diese Aufblähung bedeutet, dass eine 4-MB-CSV-Datei leicht zu einer 18-MB-JSON-Datei werden kann. Es ist auch für Menschen in großem Maßstab zutiefst unfreundlich; ein minifizierter JSON-Blob ist nur eine Wand aus Text. Obwohl Excel und Google Sheets JSON importieren können, ist der Prozess mühsam. Du musst dich durch Menüs navigieren (Daten → Daten abrufen → Aus Datei → Aus JSON) und dich dann mit dem Power Query-Editor herumschlagen, um die Struktur abzuflachen. Es ist ein Chaos. Verwende JSON für APIs, hierarchische Daten und JavaScript-zentrierte Workflows. Für flache Daten, die sich eine Person ansehen muss, ist es fast immer das falsche Werkzeug für den Job.

Direktvergleich: Eine praktische Entscheidungshilfe

Stellen wir diese Formate anhand der Kriterien gegenüber, die in der Praxis wirklich zählen. Wenn es um Dateigröße und Leistung geht, sind die Unterschiede frappierend. Für eine Tabelle mit 100.000 Zeilen und 15 Spalten kann eine CSV-Datei 12–20 MB groß sein. Das entsprechende JSON könnte aufgrund wiederholter Schlüssel 25–50 MB umfassen, während das XLSX zwischen 8–25 MB liegen könnte und dank seiner internen ZIP-Komprimierung manchmal sogar CSV schlägt, wenn die Daten hauptsächlich numerisch sind. Bei der Verarbeitungsgeschwindigkeit in Python ist CSV der klare Gewinner und lädt 2–5x schneller als XLSX. JSON liegt irgendwo in der Mitte. In Bezug auf universelle Tool-Kompatibilität übertrifft nichts CSV. Es ist der kleinste gemeinsame Nenner im bestmöglichen Sinne. XLSX ist ein knapper Zweiter, unterstützt von allen Tabellenkalkulations- und BI-Tools, erfordert aber dedizierte Bibliotheken für den programmatischen Zugriff. JSON ist nativ im Web und in JavaScript, fühlt sich aber in Tabellenkalkulationsanwendungen klobig und fremd an. Was ist mit der Datenstruktur? Wenn deine Daten hierarchisch sind, mit Objekten in Objekten, ist JSON deine einzig wirkliche Wahl. CSV und XLSX sind fundamental flach. Um Datentypen ohne jegliche Konfiguration zu erhalten, sind sowohl XLSX als auch JSON hervorragend geeignet, da sie Zahlen, Zeichenketten und Booleans eindeutig speichern. CSV hingegen behandelt alles als Zeichenkette und überlässt die Interpretation dem empfangenden Tool. Mein ehrlicher Rat? Im Zweifelsfall beginne mit CSV. Es ist der Universalspender des Datenaustauschs. Irgendetwas, irgendwo wird es immer lesen können.

Konvertierung zwischen Formaten: Was CocoConvert kann und wo es an seine Grenzen stößt

CocoConvert bietet direkte Zwei-Wege-Konvertierungen zwischen CSV, XLSX und JSON. Für standardmäßige tabellarische Daten ist unser Tool schnell und zuverlässig. Du kannst eine CSV mit 50.000 Zeilen hochladen und erhältst in weniger als 10 Sekunden eine perfekt strukturierte XLSX-Datei zurück. Wir decken alle sechs Konvertierungspfade ab: CSV→XLSX, CSV→JSON, XLSX→CSV, XLSX→JSON, JSON→CSV, JSON→XLSX. Die größte Herausforderung bei der Konvertierung liegt in der Komplexität von JSON. Unsere Konverter von JSON zu CSV und JSON zu XLSX sind für die häufigste API-Ausgabe konzipiert: ein Array von flachen Objekten. Wenn dein JSON ein paar Verschachtelungsebenen hat, wird CocoConvert versuchen, es für dich abzuflachen. Bei tief verschachtelten oder unregelmäßigen Strukturen (wie Arrays in Arrays in Objekten) könnte die Ausgabe jedoch unvollständig sein. In diesen fortgeschrittenen Fällen erzielst du sauberere Ergebnisse, indem du die Datei selbst mit einem Kommandozeilen-Tool wie jq vorverarbeitest (z. B. jq '.[] | {id: .id, name: .customer.name, total: .order.total}' input.json > flat.json), bevor du sie hochlädst. Es gibt einige weitere formatspezifische Verhaltensweisen zu beachten. Bei der Konvertierung von XLSX zu CSV exportiert CocoConvert nur das aktive Blatt. Wenn deine Arbeitsmappe fünf Blätter hat, musst du fünf Konvertierungen durchführen. Außerdem werden XLSX-Formeln zu ihrem zuletzt berechneten Wert ausgewertet; die Formeln selbst bleiben im resultierenden CSV oder JSON nicht erhalten. Das ist zu erwarten, aber ein häufiger Punkt der Verwirrung. Schließlich gehen Anzeigefunktionen wie Diagramme, Pivot-Tabellen und bedingte Formatierungen verloren, da sie kein Äquivalent in CSV oder JSON haben. Wenn du eine XLSX-Datei umstrukturieren und dabei alle ihre Funktionen beibehalten musst, ist CocoConvert nicht die richtige Wahl – ein Makro oder ein Python-Skript mit openpyxl ist besser. Wir glauben daran, offen über die Grenzen unseres Tools zu sprechen, damit du deine Zeit nicht verschwendest.

Die endgültige Entscheidung treffen: Eine Checkliste für die Formatwahl

Also, wie triffst du die endgültige Entscheidung? Hör auf, über abstrakte „Best Practices“ nachzudenken, und stelle ein paar gezielte Fragen zu deiner spezifischen Aufgabe. Zuerst und vor allem: Wer oder was wird diese Datei verwenden? Wenn die Antwort eine Person ist, die in Excel oder Google Sheets lebt, sende ihr eine XLSX-Datei, es sei denn, die Datei ist sehr groß. Wenn sie für einen Entwickler, eine automatisierte Pipeline oder eine Web-API bestimmt ist, sind CSV oder JSON deine besten Optionen. Als Nächstes schau dir die Struktur deiner Daten an. Ist es ein einfaches, flaches Raster, bei dem jede Zeile die gleichen Spalten hat? CSV und XLSX sind perfekt. Hat es verschachtelte Strukturen, wie eine Liste von Tags für jeden Blogbeitrag? Dann brauchst du unbedingt JSON. Berücksichtige dann die praktischen Aspekte. Muss die Datei in einem einfachen Texteditor lesbar sein? Nimm CSV. Musst du spezielle Formatierungen, Formeln oder mehrere Blätter in einer Arbeitsmappe beibehalten? Das ist ein Job für XLSX und nur für XLSX. Was ist, wenn die Dateigröße ein Hauptanliegen ist? Bei wirklich riesigen Datensätzen (500.000+ Zeilen) ist CSV oft am einfachsten zu handhaben. JSON wird aufgebläht sein, und XLSX könnte an seine harte Zeilengrenze stoßen. Zuletzt eine Frage für die Entwickler: Wird diese Datei in einem Git-Repository leben? Reintextformate (CSV, JSON) sind für die Versionskontrolle weitaus überlegen, da ihre Änderungen leicht nachzuverfolgen sind. Eine binäre XLSX-Datei ist ein Albtraum beim Vergleichen von Versionen (Diffing). Sobald du diese Fragen beantwortet hast, ist die richtige Wahl normalerweise offensichtlich. Die Grabenkämpfe um Formate sind eine Ablenkung. Jedes dieser Tools hat einen klaren Zweck, und der Trick besteht einfach darin, das Werkzeug auf deinen Workflow abzustimmen.