/ 目录 / 演练场 / paper-search-mcp
● 社区 openags ⚡ 即开即用

paper-search-mcp

作者 openags · openags/paper-search-mcp

在 arXiv、PubMed、bioRxiv、Semantic Scholar 和 20+ 其他来源跨平台搜索和下载学术论文——优先免费策略

openags/paper-search-mcp 是一个 Python MCP,统一了预印本服务器、生物医学数据库、元数据提供商和开放获取资源库的学术论文搜索和下载。提供付费源(IEEE、ACM)支持,只需提供你的密钥。

为什么要用

核心特性

实时演示

实际使用效果

paper-search.replay ▶ 就绪
0/0

安装

选择你的客户端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "paper-search": {
      "command": "uvx",
      "args": [
        "paper-search-mcp"
      ],
      "_inferred": true
    }
  }
}

打开 Claude Desktop → Settings → Developer → Edit Config。保存后重启应用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "paper-search": {
      "command": "uvx",
      "args": [
        "paper-search-mcp"
      ],
      "_inferred": true
    }
  }
}

Cursor 使用与 Claude Desktop 相同的 mcpServers 格式。项目级配置优先于全局。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "paper-search": {
      "command": "uvx",
      "args": [
        "paper-search-mcp"
      ],
      "_inferred": true
    }
  }
}

点击 Cline 侧栏中的 MCP Servers 图标,然后选 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "paper-search": {
      "command": "uvx",
      "args": [
        "paper-search-mcp"
      ],
      "_inferred": true
    }
  }
}

格式与 Claude Desktop 相同。重启 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "paper-search",
      "command": "uvx",
      "args": [
        "paper-search-mcp"
      ]
    }
  ]
}

Continue 使用服务器对象数组,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "paper-search": {
      "command": {
        "path": "uvx",
        "args": [
          "paper-search-mcp"
        ]
      }
    }
  }
}

加入 context_servers。Zed 保存后热重载。

claude mcp add paper-search -- uvx paper-search-mcp

一行命令搞定。用 claude mcp list 验证,claude mcp remove 卸载。

使用场景

实战用法: paper-search-mcp

如何从提示词创建文献综述参考文献

👤 研究人员、研究生 ⏱ ~30 min intermediate

何时使用: 新课题,需要一个包含 20-50 篇论文的初始集合

前置条件
  • uv — brew install uv
步骤
  1. 广泛搜索
    search_papers 'mechanistic interpretability attention heads' 跨 arXiv、Semantic Scholar、OpenAlex 搜索。返回按引用数排名前 30 的论文。✓ 已复制
    → 来自多个源的列表,包含标题、作者、引用计数
  2. 下载最优论文
    对引用数最多的前 10 篇,使用 download_with_fallback 下载到 /papers/interp/✓ 已复制
    → 已保存 PDF
  3. 提取摘要
    读取每个 PDF 的摘要并生成分组总结。✓ 已复制
    → 分组的参考文献列表

结果: 你能实际阅读的初始参考文献列表

注意事项
  • 来自不同源的重复条目 — 在排名前按 DOI 去重
  • 无开放获取版本的付费论文 — 使用 download_with_fallback,它会首先尝试 OA 镜像(arXiv、Unpaywall)
搭配使用: filesystem

如何从某个日期后查找某个主题的最新论文

👤 追踪快速发展领域的研究人员 ⏱ ~20 min beginner

何时使用: 每周/每月扫描

步骤
  1. 按日期限制的搜索
    search_arxiv 'constitutional AI' 在 2026-01-01 后提交。按日期降序排序。✓ 已复制
    → 最近的列表
  2. 阅读新摘要
    对每篇新论文,获取摘要并标记:确认先前工作 / 扩展 / 矛盾 / 无关。✓ 已复制
    → 带标签的分类

结果: 不需要浏览整个源就能获得最新视图

搭配使用: notion

如何在 PubMed + Europe PMC 中交叉核实临床声明

👤 临床医生、生物技术研究人员 ⏱ ~25 min intermediate

何时使用: 面向患者的文档提出声明,你想验证它

步骤
  1. 搜索 PubMed
    search_pubmed 'metformin cognitive decline'——仅限随机对照试验(RCT),2020 年后✓ 已复制
    → 随机对照试验列表
  2. 如需要,从 Europe PMC 获取完整上下文
    对排名前 5 的论文,检查 Europe PMC 是否有全文(OA)✓ 已复制
    → 可用的全文

结果: 有来源支撑的验证

注意事项
  • 不要仅依赖摘要做出临床决策 — 引用前读取实际的方法论

组合

与其他 MCP 搭配,撬动十倍杠杆

paper-search + markdownify

将下载的 PDF 转换为 markdown 以供 RAG 摄取

对 /papers/interp/ 中的每个 PDF,运行 pdf-to-markdown 并保存到 /kb/papers/✓ 已复制
paper-search + deep-research

针对 arXiv 交叉核实深度研究报告的来源

给定这份深度研究报告,找出引用中缺失的任何 2024-2026 年 arXiv 论文。✓ 已复制
paper-search + notion

维护研究阅读日志

向 Notion 的 'Reading Log' 数据库中添加每篇新下载的论文,包括标题、作者、DOI 和 3 行摘要。✓ 已复制

工具

此 MCP 暴露的能力

工具输入参数何时调用成本
search_papers query, sources?: str[], limit?: int, year_min?: int 多源搜索 free (public APIs)
download_with_fallback doi_or_arxiv_id, dest_dir 通过最佳可用路线获取 PDF free
search_arxiv query, sort?, year_min? arXiv 特定搜索 free
download_arxiv arxiv_id, dest_dir 获取 arXiv PDF free
search_pubmed query, filters? 生物医学搜索 free
search_semantic_scholar query 引用感知搜索 free
search_biorxiv query 生物学预印本 free

成本与限制

运行它的成本

API 配额
公共 API 有基于 IP 的速率限制(arXiv 3 请求/秒,PubMed 无密钥时 3 请求/秒)
每次调用 Token 数
搜索元数据:每篇论文 200-1000 token;PDF 是基于文件的(无 token 成本)
费用
公开源免费;付费源(IEEE、ACM)需要自己的密钥
提示
获取免费的 NCBI API 密钥以获得 10 倍的 PubMed 速率;arXiv 无密钥但要遵守 3 请求/秒的限制

安全

权限、密钥、影响范围

最小权限: 对下载目录的文件系统写入 付费源的可选密钥
凭据存储: 可选 API 密钥的环境变量
数据出站: 访问你启用的公开学术 API
切勿授予: 没有破坏性操作——全都是读取/下载

故障排查

常见错误与修复

429 速率限制

限流——arXiv 最多 3 请求/秒,PubMed 无密钥时 3 请求/秒。退避

download_with_fallback 对限制获取的 DOI 失败

不存在合法的免费源。使用你的图书馆订阅;此工具只使用 OA 路由

搜索返回的结果比源网站上的结果少

某些 API 的索引比其 UI 更窄。使用具有广泛覆盖范围的 search_semantic_scholar 进行交叉检查

PDF 已下载但无法读取

源可能返回 HTML 启动页面而不是 PDF;检查文件类型并通过问题跟踪器报告

验证: file path/to/downloaded.pdf

替代方案

paper-search-mcp 对比其他方案

替代方案何时用它替代权衡
arxiv-mcp你只需要 arXiv,不需要其他仅单源
deep-research MCP你想要合成,不仅仅是检索LLM 成本;不同的形式

更多

资源

📖 阅读 GitHub 上的官方 README

🐙 查看未解决的 issue

🔍 浏览全部 400+ MCP 服务器和 Skills