Analise um dump CSV/JSON carregando-o no SQLite
Quando usar: Alguém lhe enviou um CSV com 200k linhas e a pergunta 'qual segmento converte melhor?' — muito grande para planilhas, muito pequeno para um DB real.
Pré-requisitos
- Arquivo de origem no disco — Salve como .csv ou .json em uma pasta de trabalho
- Um caminho de arquivo SQLite vazio — Escolha um local como /tmp/analysis.db; a MCP irá criá-lo
Fluxo
-
Criar a tabela e carregarCrie uma tabela
signupsem /tmp/analysis.db correspondendo às colunas de /data/signups.csv. Carregue todas as linhas. Me diga a contagem de linhas.✓ Copiado→ Tabela criada, contagem de linhas corresponde ao arquivo -
Explorar o esquemaQuais colunas existem? Para cada uma, qual é a distribuição de valores (top 5 valores distintos para categóricas; min/max/avg para numéricas)?✓ Copiado→ Perfil por coluna
-
Responda a pergunta realAgrupe por signup_source. Para cada um, calcule: total de inscrições, taxa de conversão (inscrições com completed_onboarding=true / total). Classifique por taxa de conversão.✓ Copiado→ Tabela com qualidade de decisão com o SQL mostrado
Resultado: Respostas defensáveis em 5 minutos, com um arquivo .db que você pode re-consultar quando surgem novas perguntas.
Armadilhas
- Colunas CSV tipadas automaticamente de forma errada (números como TEXT) — Após carregar, execute
PRAGMA table_info(signups)e CAST ou recrie colunas com tipos explícitos se necessário - Strings de data não classificam/comparam corretamente como TEXT — Armazene datas como ISO 8601 (YYYY-MM-DDTHH:MM:SSZ) para que lexicográfico = cronológico; ou use
julianday()para cálculos