Analysieren Sie einen CSV/JSON-Dump, indem Sie ihn in SQLite laden
Wann einsetzen: Jemand hat Ihnen eine CSV-Datei mit 200.000 Zeilen und der Frage „Welches Segment konvertiert am besten?“ gesendet. — zu groß für Tabellenkalkulationen, zu klein für eine echte Datenbank.
Voraussetzungen
- Quelldatei auf der Festplatte — Speichern Sie als .csv oder .json in einem Arbeitsordner
- Ein leerer SQLite-Dateipfad — Wählen Sie einen Speicherort wie /tmp/analysis.db; Der MCP wird es erstellen
Ablauf
-
Erstellen Sie die Tabelle und laden Sie sieErstellen Sie eine Tabelle „signups“ in /tmp/analysis.db, die den Spalten von /data/signups.csv entspricht. Alle Zeilen laden. Sagen Sie mir die Anzahl der Zeilen.✓ Kopiert→ Tabelle erstellt, Zeilenanzahl stimmt mit der Datei überein
-
Erkunden Sie das SchemaWelche Spalten gibt es? Wie ist jeweils die Werteverteilung (die fünf wichtigsten eindeutigen Werte für kategoriale Werte; Min./Max./Durchschnitt für Zahlen)?✓ Kopiert→ Profil pro Spalte
-
Beantworten Sie die eigentliche FrageGruppieren Sie nach signup_source. Berechnen Sie für jeden: Gesamtzahl der Anmeldungen, Conversion-Rate (Anmeldungen mit abgeschlossenem_onboarding=true/gesamt). Sortieren Sie nach Conversion-Rate.✓ Kopiert→ Entscheidungstabelle mit der angezeigten SQL
Ergebnis: Vertretbare Antworten in 5 Minuten, mit einer .db-Datei, die Sie erneut abfragen können, wenn neue Fragen auftauchen.
Fallstricke
- CSV-Spalten automatisch falsch eingegeben (Zahlen als TEXT) — Führen Sie nach dem Laden „PRAGMA table_info(signups)“ und CAST aus oder erstellen Sie bei Bedarf Spalten mit expliziten Typen neu
- Datumszeichenfolgen werden nicht korrekt als TEXT sortiert/vergleicht — Speichern Sie Daten als ISO 8601 (JJJJ-MM-TTTHH:MM:SSZ), also lexikographisch = chronologisch; oder verwenden Sie „julianday()“ für Mathematik