/ ディレクトリ / プレイグラウンド / arXiv
● コミュニティ blazickjp ⚡ 即起動

arXiv

作者 blazickjp · blazickjp/arxiv-mcp-server

arXivを検索し、論文をダウンロードして、Claudeに読解・要約させる — 最新プレプリントのための軽量リサーチアシスタントです。

arxiv-mcp-serverを使うと、Claudeがキーワード・カテゴリ・日付でarXivを検索し、PDFをダウンロードしてテキストを抽出し、チャット内で閲覧できます。APIキーは不要で、arXivは完全に公開されています。文献調査、論文要約、急速に進化するML・物理・CS分野のキャッチアップに最適です。

なぜ使うのか

主な機能

ライブデモ

実際の動作

arxiv.replay ▶ 準備完了
0/0

インストール

クライアントを選択

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Claude Desktop → Settings → Developer → Edit Config を開く。保存後、アプリを再起動。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cursor は Claude Desktop と同じ mcpServers スキーマを使用。プロジェクト設定はグローバルより優先。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cline サイドバーの MCP Servers アイコンをクリックし、"Edit Configuration" を選択。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Claude Desktop と同じ形式。Windsurf を再起動して反映。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "arxiv",
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  ]
}

Continue はマップではなくサーバーオブジェクトの配列を使用。

~/.config/zed/settings.json
{
  "context_servers": {
    "arxiv": {
      "command": {
        "path": "uvx",
        "args": [
          "arxiv-mcp-server"
        ]
      }
    }
  }
}

context_servers に追加。保存時に Zed がホットリロード。

claude mcp add arxiv -- uvx arxiv-mcp-server

ワンライナー。claude mcp list で確認、claude mcp remove で削除。

ユースケース

実用的な使い方: arXiv

ニッチなトピックのミニ文献調査を作成する

👤 研究者、大学院生、知的好奇心旺盛なエンジニア ⏱ ~25 min intermediate

使うタイミング: あるトピック(例:「speculative decoding」)について調査を始めたいとき、関連性の高い最新論文10本とその要約が欲しい場合に使います。

前提条件
  • ローカルキャッシュディレクトリが書き込み可能であること — デフォルトはユーザーホームディレクトリ配下。ARXIV_STORAGE_PATHで変更可能
フロー
  1. 戦略的に検索する
    Search arXiv for 'speculative decoding' in cs.CL or cs.LG, last 12 months, sort by relevance. Top 20.✓ コピーしました
    → arXiv IDとタイトルとアブストラクトの一覧
  2. 上位候補をダウンロードする
    Download the top 10 papers locally.✓ コピーしました
    → 論文がキャッシュされ、ローカルパスが返される
  3. 各論文を1段落で要約する
    For each downloaded paper, extract text and write a 4-line summary: problem, method, result, limitations. Preserve the arxiv id.✓ コピーしました
    → 引用付きの構造化された要約

結果: 関連研究セクションやブログ記事にそのまま使える10本の論文サーベイ表が完成します。

注意点
  • arXivの関連性ソートは精度が低く、別の並び順に重要な論文が埋もれる可能性がある — submittedDate降順でも検索し、Semantic Scholar / Google Scholarの被引用数と照合して補完する
組み合わせ: filesystem · qdrant

1本の論文を深く読み込み、Q&Aで理解する

👤 難解な論文を読む必要があるすべての人 ⏱ ~20 min beginner

使うタイミング: 特定の論文(例:FlashAttention-3の論文)があり、PDF全文を一人で読まずに内容を理解したいときに使います。

フロー
  1. 論文をダウンロードする
    Download arxiv paper 2405.12345. Report number of pages and total word count.✓ コピーしました
    → ファイルがキャッシュされ、統計情報が返される
  2. セクションごとに要約する
    Read the paper. Give me a section-by-section summary. For each section: goal, key points, any equations worth understanding (in plain English).✓ コピーしました
    → 構造化されたウォークスルー
  3. 的を絞った質問をする
    Specific Q: [your question]. Answer only from the paper; cite the section and any equation numbers.✓ コピーしました
    → 引用に基づいた根拠のある回答

結果: 2時間かかる論文理解を20分で達成できます。

注意点
  • PDF抽出で数式や表が崩れることがある — 数式が多い論文の場合、Claudeに「数式の抽出は不正確な可能性があります」と注記させ、重要な数式はPDFと照合する

自分の分野の新着論文ウィークリーダイジェスト

👤 研究者、サブフィールドを追うMLエンジニア ⏱ ~15 min beginner

使うタイミング: 月曜の朝に「cs.CLでこの1週間に投稿された読むべき論文は?」と確認したいときに使います。

フロー
  1. 最近の投稿を取得する
    Search arXiv cs.CL submissions in the last 7 days. Return top 50 by relevance or arbitrary.✓ コピーしました
    → 最近の論文リスト
  2. 関心のあるキーワードでフィルタリングする
    Keep only papers whose title or abstract mentions [your keywords]. Dedupe.✓ コピーしました
    → 絞り込まれたショートリスト
  3. アブストラクトダイジェストを作成する
    For each kept paper, generate 2-line 'why it might matter' from the abstract. Mark 3 as must-reads.✓ コピーしました
    → ウィークリーダイジェスト

結果: arxiv-sanityを延々とスクロールすることなく、厳選されたウィークリーリーディングリストが得られます。

注意点
  • アブストラクトは誇張されがちで、「必読」タグが不正確な場合がある — タグは鵜呑みにせず、自分でアブストラクトを読むきっかけとして活用する
組み合わせ: notion

組み合わせ

他のMCPと組み合わせて10倍の力を

arxiv + qdrant

セマンティック検索が可能な論文ライブラリを構築する

Download the top 30 papers on 'mixture of experts'. Index each chunk into Qdrant collection papers_moe. Later answer: 'what tricks do MoE papers use for load balancing?'✓ コピーしました
arxiv + filesystem

インライン引用付きのMarkdownサーベイファイルを作成する

Download 10 papers on topic X, save summaries to /research/survey-X.md with [arxiv:id] links.✓ コピーしました
arxiv + notion

ウィークリー論文ダイジェストをNotionのリサーチDBに投稿する

Run the weekly digest for cs.CL, create a Notion page with the 5 must-reads as rows.✓ コピーしました

ツール

このMCPが提供する機能

ツール入力呼び出すタイミングコスト
search_papers query: str, category?, max_results?, date_range? クエリ・カテゴリ・日付で関連論文を検索する free
download_paper paper_id テキスト抽出のためにPDFをローカルにキャッシュする free
read_paper paper_id キャッシュ済み論文からテキストを抽出して読解・Q&Aに使う free
list_papers ダウンロード済みの論文を確認して再取得を避ける free

コストと制限

運用コスト

APIクォータ
arXivクエリAPIは約3秒に1リクエストを推奨しており、それ以上のレートではスロットリングされる可能性があります
呼び出しあたりのトークン
検索: 500〜2,000トークン。論文テキスト: 1論文あたり5k〜30kトークン。
金額
無料
ヒント
積極的にキャッシュを活用してください。ダウンロード済み論文の抽出テキスト再読は無料です。

セキュリティ

権限、シークレット、影響範囲

認証情報の保管: 不要
データ送信先: export.arxiv.orgへのクエリ送信、arxiv.orgからのPDFダウンロード

トラブルシューティング

よくあるエラーと対処法

Empty search results:明らかに存在するトピックなのに検索結果が空になる

arXivの検索は引用符付き文字列に対してキーワード完全一致です。より広い用語を試し、正しいカテゴリプレフィックス(cs.CL vs cs.AI)を指定してください。

Download failed / PDF unavailable:ダウンロード失敗またはPDFが利用不可

非常にまれですが、取り下げられた論文は404になることがあります。arxiv.org/abs/<id>でIDを確認してください。

Extracted text is garbled:抽出テキストが文字化けしている

数式が多い論文は非標準的なPDFの場合があります。可能であればソースバージョンを試すか、制限事項として記録してください。

代替案

arXiv 他との比較

代替案代わりに使う場面トレードオフ
Semantic Scholar MCP被引用数やインパクト指標が必要なときarXiv特化ではなく、カバレッジにばらつきがある
Papers with Code MCPコード実装がリンクされた論文が欲しいときカタログが小さく、ML分野に特化している

その他

リソース

📖 GitHub の公式 README を読む

🐙 オープンな issue を見る

🔍 400以上のMCPサーバーとSkillsを見る