/ 目錄 / 演練場 / csv-data-summarizer-claude-skill
● 社群 coffeefuelbump ⚡ 即開即用

csv-data-summarizer-claude-skill

作者 coffeefuelbump · coffeefuelbump/csv-data-summarizer-claude-skill

丟入 CSV,立即獲得摘要統計、缺失資料標記與快速圖表——無需撰寫 pandas 程式碼。

一個專注的 Claude 技能,可自動對 CSV 檔案啟動:對欄位進行剖析(資料型別、空值百分比、唯一值數量),列印摘要統計,標記缺失資料模式,並使用 pandas 和 matplotlib 產生幾張快速視覺化圖表。設計為深入分析前的第一眼檢視工具。

為什麼要用

核心特性

即時演示

實際使用效果

csv-data-summarizer-claude-skill.replay ▶ 就緒
0/0

安裝

選擇你的客戶端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "csv-data-summarizer-claude-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/coffeefuelbump/csv-data-summarizer-claude-skill",
        "~/.claude/skills/csv-data-summarizer-claude-skill"
      ],
      "_inferred": true
    }
  }
}

開啟 Claude Desktop → Settings → Developer → Edit Config。儲存後重啟應用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "csv-data-summarizer-claude-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/coffeefuelbump/csv-data-summarizer-claude-skill",
        "~/.claude/skills/csv-data-summarizer-claude-skill"
      ],
      "_inferred": true
    }
  }
}

Cursor 使用與 Claude Desktop 相同的 mcpServers 格式。專案級設定優先於全域。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "csv-data-summarizer-claude-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/coffeefuelbump/csv-data-summarizer-claude-skill",
        "~/.claude/skills/csv-data-summarizer-claude-skill"
      ],
      "_inferred": true
    }
  }
}

點擊 Cline 側欄中的 MCP Servers 圖示,然後選 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "csv-data-summarizer-claude-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/coffeefuelbump/csv-data-summarizer-claude-skill",
        "~/.claude/skills/csv-data-summarizer-claude-skill"
      ],
      "_inferred": true
    }
  }
}

格式與 Claude Desktop 相同。重啟 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "csv-data-summarizer-claude-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/coffeefuelbump/csv-data-summarizer-claude-skill",
        "~/.claude/skills/csv-data-summarizer-claude-skill"
      ]
    }
  ]
}

Continue 使用伺服器物件陣列,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "csv-data-summarizer-claude-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/coffeefuelbump/csv-data-summarizer-claude-skill",
          "~/.claude/skills/csv-data-summarizer-claude-skill"
        ]
      }
    }
  }
}

加入 context_servers。Zed 儲存後熱重載。

claude mcp add csv-data-summarizer-claude-skill -- git clone https://github.com/coffeefuelbump/csv-data-summarizer-claude-skill ~/.claude/skills/csv-data-summarizer-claude-skill

一行命令搞定。用 claude mcp list 驗證,claude mcp remove 移除。

使用場景

實戰用法: csv-data-summarizer-claude-skill

如何在不撰寫 pandas 程式碼的情況下快速瀏覽一份新的 CSV

👤 資料分析師、PM,以及任何接手別人資料的人 ⏱ ~10 min beginner

何時使用: 當你拿到一份 CSV,需要在做任何事之前先了解其內容。

前置條件
  • Python 3.10+ 搭配 pandas 與 matplotlib — pip install pandas matplotlib
  • 技能已複製 — git clone https://github.com/coffeefuelbump/csv-data-summarizer-claude-skill ~/.claude/skills/csv-data-summarizer-claude-skill
步驟
  1. 將 Claude 指向該檔案
    Summarize data/sales_2024.csv — columns, nulls, and basic stats.✓ 已複製
    → 各欄位資料型別、空值百分比、最小/最大值或最常見值
  2. 要求缺失資料診斷
    Which columns have systematic nulls? Any row-level patterns?✓ 已複製
    → 列出具體欄位,而非模糊的「有些空值」
  3. 要求快速視覺化圖表
    Save histograms for all numeric columns into ./charts/.✓ 已複製
    → PNG 檔案已儲存至磁碟

結果: 在 5 分鐘內建立對該資料集的整體認識。

注意事項
  • 超大 CSV 會耗盡 token 預算 — 讓 Claude 讀取樣本(nrows=10000)進行探索,完整檔案的統計則在 Python 中執行
  • 資料型別推斷錯誤(日期被讀為字串) — 告知 Claude 哪些欄位是日期——使用 pandas parse_dates 可協助處理
搭配使用: filesystem

將摘要工具作為資料管線中的資料品質閘門

👤 驗證輸入 CSV 的資料工程師 ⏱ ~30 min intermediate

何時使用: 當你每天收到一份 CSV,並希望在進入下游步驟前標記異常。

步驟
  1. 建立預期格式的基準線
    Record the summary for last week's file as the baseline.✓ 已複製
    → 基準線 JSON 已儲存
  2. 將今天的資料與基準線比對
    Compare today's CSV to the baseline — flag null-rate shifts >5%, new/missing columns, dtype changes.✓ 已複製
    → 包含具體異常的差異報告
  3. 發現問題時明確報錯
    If any flags are critical, exit non-zero so CI fails.✓ 已複製
    → 非零結束碼 + 可讀的原因說明

結果: 在不良資料汙染資料倉儲前攔截問題。

注意事項
  • 閾值過於敏感導致頻繁誤報 — 在強制執行前先用 30 天的基準線進行校準
搭配使用: github

組合

與其他 MCP 搭配,撬動十倍槓桿

csv-data-summarizer-claude-skill + filesystem

對目錄下的所有 CSV 執行,並將每份報告儲存在對應檔案旁

For every CSV under data/, save a matching *_profile.md file summarizing it.✓ 已複製
csv-data-summarizer-claude-skill + jupyter

將剖析結果放入 Notebook 以便進一步探索

Take the profile and create a Jupyter notebook with the loaded DataFrame and starter cells.✓ 已複製

工具

此 MCP 暴露的能力

工具輸入參數何時呼叫成本
csv-profile path to CSV 處理任何新 CSV 的第一步 pandas runtime
missing-data-report profile 剖析完成後執行 0
quick-charts profile + output dir 當你想要在統計數據旁邊附上視覺化圖表時 matplotlib runtime

成本與限制

運行它的成本

API 配額
none
每次呼叫 Token 數
每份 CSV 約 2–5k tokens(加上 Claude 讀取的資料樣本)
費用
free
提示
傳入 nrows 並縮小欄位清單——不要把整個 50MB 的檔案餵給 Claude

安全

權限、密鑰、影響範圍

憑證儲存: 無需儲存任何憑證
資料出站: 無資料外傳——僅在本機執行 pandas

故障排查

常見錯誤與修復

ModuleNotFoundError: pandas

在 Claude Code 執行腳本的環境中執行 pip install pandas matplotlib。

驗證: python -c 'import pandas, matplotlib; print(pandas.__version__)'
UnicodeDecodeError on load

告知 Claude 檔案編碼(例如 'encoding=latin-1'),或事先對檔案進行正規化處理。

驗證: file -I path/to.csv
Charts look off for skewed data

要求使用對數刻度或截斷的直方圖

替代方案

csv-data-summarizer-claude-skill 對比其他方案

替代方案何時用它替代權衡
jupyter你需要完整的互動式分析,而不只是資料剖析較為繁重;需要啟動 kernel
excel資料更適合在 Excel 中處理(樞紐分析表、公式)較難自動化

更多

資源

📖 閱讀 GitHub 上的官方 README

🐙 查看未解決的 issue

🔍 瀏覽全部 400+ MCP 伺服器和 Skills