تحليل ملف CSV/JSON بتحميله في SQLite
متى تستخدمه: أرسل لك شخص ملف CSV يحتوي على 200 ألف صف والسؤال 'أي قطاع يحول الأفضل؟' — كبير جداً لجداول البيانات، صغير جداً لقاعدة بيانات حقيقية.
المتطلبات الأساسية
- ملف المصدر على القرص — احفظ كـ .csv أو .json في مجلد عمل
- مسار ملف SQLite فارغ — اختر موقعاً مثل /tmp/analysis.db؛ سينشئه MCP
الخطوات
-
إنشاء الجدول والتحميلأنشئ جدول
signupsفي /tmp/analysis.db مطابقاً لأعمدة /data/signups.csv. حمّل جميع الصفوف. أخبرني بعدد الصفوف.✓ تم النسخ→ جدول تم إنشاؤه، عدد الصفوف يطابق الملف -
استكشاف المخططما الأعمدة الموجودة؟ لكل واحد، ما توزيع القيم (أعلى 5 قيم متميزة للفئات؛ الحد الأدنى/الحد الأقصى/المتوسط للأرقام)؟✓ تم النسخ→ ملف تعريف لكل عمود
-
الإجابة على السؤال الفعليجمّع حسب signup_source. لكل واحد، احسب: إجمالي التسجيلات ومعدل التحويل (التسجيلات مع completed_onboarding=true / الإجمالي). رتّب حسب معدل التحويل.✓ تم النسخ→ جدول على مستوى القرار مع SQL معروض
النتيجة: إجابات قابلة للدفاع عن في 5 دقائق، مع ملف .db يمكنك الاستعلام عنه مجدداً عند ظهور أسئلة جديدة.
المزالق
- أعمدة CSV تُكتب الأنواع تلقائياً بشكل خاطئ (الأرقام كـ TEXT) — بعد التحميل، قم بتشغيل
PRAGMA table_info(signups)و CAST أو أعد إنشاء الأعمدة بأنواع صريحة إذا لزم الأمر - سلاسل التواريخ لا ترتب/تقارن بشكل صحيح كـ TEXT — خزّن التواريخ بصيغة ISO 8601 (YYYY-MM-DDTHH:MM:SSZ) بحيث يكون المعجم = الترتيب الزمني؛ أو استخدم
julianday()للحسابات