/ 目錄 / 演練場 / SciAgent-Skills
● 社群 jaechang-hits ⚡ 即開即用

SciAgent-Skills

作者 jaechang-hits · jaechang-hits/SciAgent-Skills

197 項生物資訊與生命科學技能——RNA-seq、單細胞、藥物探索、蛋白質體學——在 BixBench 達到 92% 準確率,為 OmicsHorizon 平台提供支援。

SciAgent Skills 是一個龐大的生命科學技能函式庫,適用於 Claude Code 及其他 AI 代理:涵蓋 RNA-seq 與 scRNA-seq 工作流程、藥物探索管線、蛋白質體學分析、序列比對,以及常見的濕實驗室周邊任務。在 BixBench 上達到 92.0% 的準確率,專為希望代理能遵循標準生物資訊分析模式的研究人員設計。

為什麼要用

核心特性

即時演示

實際使用效果

sciagent-skill.replay ▶ 就緒
0/0

安裝

選擇你的客戶端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "sciagent-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/jaechang-hits/SciAgent-Skills",
        "~/.claude/skills/SciAgent-Skills"
      ],
      "_inferred": true
    }
  }
}

開啟 Claude Desktop → Settings → Developer → Edit Config。儲存後重啟應用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "sciagent-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/jaechang-hits/SciAgent-Skills",
        "~/.claude/skills/SciAgent-Skills"
      ],
      "_inferred": true
    }
  }
}

Cursor 使用與 Claude Desktop 相同的 mcpServers 格式。專案級設定優先於全域。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "sciagent-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/jaechang-hits/SciAgent-Skills",
        "~/.claude/skills/SciAgent-Skills"
      ],
      "_inferred": true
    }
  }
}

點擊 Cline 側欄中的 MCP Servers 圖示,然後選 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "sciagent-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/jaechang-hits/SciAgent-Skills",
        "~/.claude/skills/SciAgent-Skills"
      ],
      "_inferred": true
    }
  }
}

格式與 Claude Desktop 相同。重啟 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "sciagent-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/jaechang-hits/SciAgent-Skills",
        "~/.claude/skills/SciAgent-Skills"
      ]
    }
  ]
}

Continue 使用伺服器物件陣列,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "sciagent-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/jaechang-hits/SciAgent-Skills",
          "~/.claude/skills/SciAgent-Skills"
        ]
      }
    }
  }
}

加入 context_servers。Zed 儲存後熱重載。

claude mcp add sciagent-skill -- git clone https://github.com/jaechang-hits/SciAgent-Skills ~/.claude/skills/SciAgent-Skills

一行命令搞定。用 claude mcp list 驗證,claude mcp remove 移除。

使用場景

實戰用法: SciAgent-Skills

如何執行大量 RNA-seq 差異表現分析

👤 手邊有 FASTQ 檔案、需要 DE 結果的生物學家與生物資訊分析師 ⏱ ~120 min advanced

何時使用: 您有成對末端 FASTQ 檔案、參考基因組,以及樣本條件對照表。

前置條件
  • Skill installed — git clone https://github.com/jaechang-hits/SciAgent-Skills ~/.claude/skills/sciagent-skills
  • Conda/mamba + compute — Use a Linux server or HPC; macOS fine for small datasets
步驟
  1. 規劃分析管線
    Plan a bulk RNA-seq DE workflow for 2 conditions x 3 reps with salmon + tximport + DESeq2. Output expected files per step.✓ 已複製
    → 包含工具與中間輸出檔案的步驟清單
  2. 執行定量分析
    Run salmon quant for each sample; produce a script.✓ 已複製
    → 含 salmon 指令的 Bash 腳本
  3. 差異表現分析
    Load quants via tximport, run DESeq2, produce MA + volcano plots and a top-50 gene table.✓ 已複製
    → R 腳本與輸出檔案

結果: 可直接交給 PI 或合作者的差異表現結果表格與圖表。

注意事項
  • 參考基因組與 GTF 註解版本不一致 — 明確確認版本號;版本不符時 salmon 與 DESeq2 可能會在 ID 錯配的情況下默默執行完成
  • 低表現量過濾去除了有生物意義的訊號 — 使用獨立過濾或逐步調高閾值,避免一刀切式的過濾

單細胞 RNA-seq 品質控制與叢集分析基礎流程

👤 從 10x 輸出結果開始進行 scRNA 分析的研究人員 ⏱ ~90 min advanced

何時使用: 您有 cellranger 輸出目錄,需要進行初步的 Seurat 或 Scanpy 分析。

步驟
  1. 載入資料與品質控制
    Load 10x data from cellranger output, do QC (pct.mt, counts, features), filter, normalize.✓ 已複製
    → 品質控制圖表與過濾後的物件
  2. 執行叢集分析
    Run PCA, find neighbors, cluster at resolution 0.5, and UMAP.✓ 已複製
    → 叢集標籤與 UMAP 圖
  3. 標誌基因分析
    Find cluster markers, produce a top-5-per-cluster heatmap.✓ 已複製
    → 標誌基因表格與熱圖

結果: 已標注的 UMAP 圖與標誌基因表格,可供進一步生物學詮釋使用。

注意事項
  • 以預設解析度導致過度分群 — 嘗試 0.2-1.0 的掃描範圍,依據輪廓係數與生物合理性來選擇最佳解析度

從全基因組定序資料進行胚系變異位點偵測

👤 負責偵測 SNP 與 indel 的基因體學團隊 ⏱ ~180 min advanced

何時使用: 您有已比對的 BAM 檔案,需要依最佳實踐(GATK)流程產生 VCF 檔案。

步驟
  1. 規劃分析管線
    Plan GATK best-practices germline pipeline from aligned BAMs: BQSR, HaplotypeCaller, joint genotyping with GenomicsDBImport.✓ 已複製
    → 包含預估執行時間的管線概要
  2. 產生分析腳本
    Produce Snakemake rules for each step.✓ 已複製
    → 含規則與設定的 Snakefile

結果: 一條可重現的 Snakemake 管線,可直接在您的叢集上執行。

注意事項
  • 在小型樣本群中略過 BQSR 步驟 — 仍應執行 BQSR——GATK 的下游過濾步驟預設輸入為已重新校正品質分數的資料

篩選高通量篩選中的小分子活性化合物

👤 負責篩選 HTS 結果的藥物化學團隊 ⏱ ~60 min advanced

何時使用: 您有候選化合物清單,需要依藥物相似性與新穎性進行排序。

步驟
  1. 依 Lipinski 規則與 PAINS 過濾
    Compute Lipinski and PAINS flags on this SMILES list, output a filtered table.✓ 已複製
    → 基於 RDKit 的腳本與過濾後的 CSV 檔案
  2. 與已知藥物的相似度比對
    For remaining hits, compute Tanimoto similarity to ChEMBL approved drugs; flag >0.85 as known-scaffold.✓ 已複製
    → 含標記的相似度比對表格

結果: 經過排序、優先供後續追蹤研究的候選化合物清單。

工具

此 MCP 暴露的能力

工具輸入參數何時呼叫成本
Bulk RNA-seq workflow FASTQ + design 標準差異表現分析 compute
scRNA-seq workflow 10x output 單細胞分析基礎流程 compute
Variant calling BAMs WGS/WES 樣本群分析 compute
Proteomics analysis MS data 質譜儀蛋白質體學分析 compute
Drug discovery triage SMILES list 活性化合物篩選與排序 compute

成本與限制

運行它的成本

API 配額
技能層級無配額限制
每次呼叫 Token 數
每次管線設計約 10-50k token
費用
技能本身免費;運算成本依資料集大小而定
提示
先將管線規劃為腳本再執行;在長時間運算期間無需讓 Claude 持續介入。

安全

權限、密鑰、影響範圍

憑證儲存: 無需憑證
資料出站: 管線設計內容與程式碼片段會傳送至 Claude。實際的病患資料應保留在符合 HIPAA 規範的運算環境中。

故障排查

常見錯誤與修復

tximport fails on missing transcript-to-gene mapping

使用與建立 salmon 索引時相同的 GTF 檔案重新產生 tx2gene 對應表;版本不符通常是主要原因。

Seurat object too large for available RAM

對資料進行次抽樣,或改用 BPCells 或 DelayedArray 後端的 Seurat 進行磁碟儲存式分析

替代方案

SciAgent-Skills 對比其他方案

替代方案何時用它替代權衡
Galaxy / nf-core您需要經過審核的社群標準管線,而非 LLM 生成的腳本互動性較低;自訂調整的速度較慢

更多

資源

📖 閱讀 GitHub 上的官方 README

🐙 查看未解決的 issue

🔍 瀏覽全部 400+ MCP 伺服器和 Skills