Claude + Jupyterでの探索的データ分析の実行方法
使うタイミング: 新しいデータセットがあり、ボイラープレートセルを自分で書かずに操作したいときに使用します。
前提条件
- トークン認証でJupyterLabを実行 — jupyter lab --no-browser を実行して、URLからトークンをコピー
- JUPYTER_URL + JUPYTER_TOKEN 環境変数 — ラボのURLとトークンに設定
フロー
-
ノートブックとデータを読み込むuse_notebook を使用して analysis.ipynb を開きます。./data/events.parquet を DataFrame df に読み込むセルを挿入してください。✓ コピーしました→ セルが実行され、df.head() プレビューが返される
-
分析を反復event_type の分布はどのような様子ですか?プロットして、画像を表示してください。✓ コピーしました→ ヒストグラム画像がチャットに表示される
-
クリーンなノートブックを保存ノートブックをクリーンアップしてください:エラーセルを削除し、マークダウンヘッダーを追加し、restart-run-all で上から下まで実行されることを確認してください。✓ コピーしました→ 最初から最後まで再現できるノートブック
結果: ナラティブ、チャート、検証済みの再現性を備えた公開可能なノートブック。
注意点
- カーネル状態がノートブックのセル順序からずれる — 編集後に notebook_run-all-cells を使用して、隠された状態のバグをキャッチする
- データファイルがカーネルに見えない — カーネルのCWDはJupyterを開始した場所ではなく、ノートブックのディレクトリです。絶対パスを使用してください。