كيفية إجراء تحليل استكشافي للبيانات باستخدام Claude + Jupyter
متى تستخدمه: لديك مجموعة بيانات جديدة وتريد استكشافها دون كتابة خلايا نموذجية بنفسك.
المتطلبات الأساسية
- تشغيل JupyterLab مع مصادقة الرموز — jupyter lab --no-browser؛ انسخ الرمز من عنوان URL
- متغيرات البيئة JUPYTER_URL + JUPYTER_TOKEN — اضبطها على عنوان lab والرمز الخاص بك
الخطوات
-
تحميل الدفتر والبياناتاستخدم use_notebook لفتح analysis.ipynb. أدرج خلية تحمل ./data/events.parquet إلى DataFrame باسم df.✓ تم النسخ→ تنفذ الخلية؛ يتم إرجاع معاينة df.head()
-
التكرار على التحليلكيف يبدو توزيع event_type؟ ارسمه لي وأظهر لي الصورة.✓ تم النسخ→ تم عرض صورة الرسم البياني في الدردشة
-
حفظ دفتر نظيفنظف الدفتر: احذف خلايا الأخطاء، أضف رؤوس markdown، أعد التشغيل والتشغيل الكامل للتحقق من تشغيله من البداية إلى النهاية.✓ تم النسخ→ دفتر يعيد إنتاج التسلسل النهائي
النتيجة: دفتر قابل للنشر يحتوي على سرد ورسوم بيانية وقابلية تكرار مثبتة.
المزالق
- حالة kernel تنجرف عن ترتيب خلايا الدفتر — استخدم notebook_run-all-cells بعد التعديلات لاكتشاف أخطاء الحالة المخفية
- ملفات البيانات غير مرئية للـ kernel — مجلد العمل الحالي للـ kernel هو مجلد الدفتر وليس المكان الذي بدأت فيه Jupyter — استخدم المسارات المطلقة