arXiv MCP — インストール & ライブデモ

なぜ使うのか

主な機能

クエリ、カテゴリ（cs.AI、cs.CL、stat.MLなど）、日付範囲、著者による検索
PDFをローカルキャッシュディレクトリにダウンロード
ダウンロード済み論文からテキストを抽出し、要約やQ&Aに活用
ローカルにキャッシュ済みの論文一覧を表示し、再ダウンロードを防止
APIキー不要 — arXivのクエリAPIは公開されています

ライブデモ

実際の動作

arxiv.replay ▶ 準備完了

0/0

インストール

クライアントを選択

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Claude Desktop → Settings → Developer → Edit Config を開く。保存後、アプリを再起動。

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cursor は Claude Desktop と同じ mcpServers スキーマを使用。プロジェクト設定はグローバルより優先。

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cline サイドバーの MCP Servers アイコンをクリックし、"Edit Configuration" を選択。

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Claude Desktop と同じ形式。Windsurf を再起動して反映。

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "arxiv",
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  ]
}

Continue はマップではなくサーバーオブジェクトの配列を使用。

~/.config/zed/settings.json

{
  "context_servers": {
    "arxiv": {
      "command": {
        "path": "uvx",
        "args": [
          "arxiv-mcp-server"
        ]
      }
    }
  }
}

context_servers に追加。保存時に Zed がホットリロード。

claude mcp add arxiv -- uvx arxiv-mcp-server

ワンライナー。claude mcp list で確認、claude mcp remove で削除。

ユースケース

実用的な使い方： arXiv

ニッチなトピックのミニ文献調査を作成する

👤 研究者、大学院生、知的好奇心旺盛なエンジニア ⏱ ~25 min intermediate

使うタイミング： あるトピック（例：「speculative decoding」）について調査を始めたいとき、関連性の高い最新論文10本とその要約が欲しい場合に使います。

前提条件

ローカルキャッシュディレクトリが書き込み可能であること — デフォルトはユーザーホームディレクトリ配下。ARXIV_STORAGE_PATHで変更可能

フロー

戦略的に検索する

Search arXiv for 'speculative decoding' in cs.CL or cs.LG, last 12 months, sort by relevance. Top 20.✓ コピーしました

→ arXiv IDとタイトルとアブストラクトの一覧
上位候補をダウンロードする

Download the top 10 papers locally.✓ コピーしました

→ 論文がキャッシュされ、ローカルパスが返される
各論文を1段落で要約する

For each downloaded paper, extract text and write a 4-line summary: problem, method, result, limitations. Preserve the arxiv id.✓ コピーしました

→ 引用付きの構造化された要約

結果： 関連研究セクションやブログ記事にそのまま使える10本の論文サーベイ表が完成します。

注意点

arXivの関連性ソートは精度が低く、別の並び順に重要な論文が埋もれる可能性がある — submittedDate降順でも検索し、Semantic Scholar / Google Scholarの被引用数と照合して補完する

組み合わせ： filesystem · qdrant

1本の論文を深く読み込み、Q&Aで理解する

👤 難解な論文を読む必要があるすべての人 ⏱ ~20 min beginner

使うタイミング： 特定の論文（例：FlashAttention-3の論文）があり、PDF全文を一人で読まずに内容を理解したいときに使います。

フロー

論文をダウンロードする

Download arxiv paper 2405.12345. Report number of pages and total word count.✓ コピーしました

→ ファイルがキャッシュされ、統計情報が返される
セクションごとに要約する

Read the paper. Give me a section-by-section summary. For each section: goal, key points, any equations worth understanding (in plain English).✓ コピーしました

→ 構造化されたウォークスルー
的を絞った質問をする

Specific Q: [your question]. Answer only from the paper; cite the section and any equation numbers.✓ コピーしました

→ 引用に基づいた根拠のある回答

結果： 2時間かかる論文理解を20分で達成できます。

注意点

PDF抽出で数式や表が崩れることがある — 数式が多い論文の場合、Claudeに「数式の抽出は不正確な可能性があります」と注記させ、重要な数式はPDFと照合する

自分の分野の新着論文ウィークリーダイジェスト

👤 研究者、サブフィールドを追うMLエンジニア ⏱ ~15 min beginner

使うタイミング： 月曜の朝に「cs.CLでこの1週間に投稿された読むべき論文は？」と確認したいときに使います。

フロー

最近の投稿を取得する

Search arXiv cs.CL submissions in the last 7 days. Return top 50 by relevance or arbitrary.✓ コピーしました

→ 最近の論文リスト
関心のあるキーワードでフィルタリングする

Keep only papers whose title or abstract mentions [your keywords]. Dedupe.✓ コピーしました

→ 絞り込まれたショートリスト
アブストラクトダイジェストを作成する

For each kept paper, generate 2-line 'why it might matter' from the abstract. Mark 3 as must-reads.✓ コピーしました

→ ウィークリーダイジェスト

結果： arxiv-sanityを延々とスクロールすることなく、厳選されたウィークリーリーディングリストが得られます。

注意点

アブストラクトは誇張されがちで、「必読」タグが不正確な場合がある — タグは鵜呑みにせず、自分でアブストラクトを読むきっかけとして活用する

組み合わせ： notion

組み合わせ

他のMCPと組み合わせて10倍の力を

arxiv + qdrant

セマンティック検索が可能な論文ライブラリを構築する

Download the top 30 papers on 'mixture of experts'. Index each chunk into Qdrant collection papers_moe. Later answer: 'what tricks do MoE papers use for load balancing?'✓ コピーしました

arxiv + filesystem

インライン引用付きのMarkdownサーベイファイルを作成する

Download 10 papers on topic X, save summaries to /research/survey-X.md with [arxiv:id] links.✓ コピーしました

arxiv + notion

ウィークリー論文ダイジェストをNotionのリサーチDBに投稿する

Run the weekly digest for cs.CL, create a Notion page with the 5 must-reads as rows.✓ コピーしました

ツール

このMCPが提供する機能

ツール	入力	呼び出すタイミング	コスト
search_papers	query: str, category?, max_results?, date_range?	クエリ・カテゴリ・日付で関連論文を検索する	free
download_paper	paper_id	テキスト抽出のためにPDFをローカルにキャッシュする	free
read_paper	paper_id	キャッシュ済み論文からテキストを抽出して読解・Q&Aに使う	free
list_papers		ダウンロード済みの論文を確認して再取得を避ける	free

コストと制限

運用コスト

APIクォータ: arXivクエリAPIは約3秒に1リクエストを推奨しており、それ以上のレートではスロットリングされる可能性があります
呼び出しあたりのトークン: 検索: 500〜2,000トークン。論文テキスト: 1論文あたり5k〜30kトークン。
金額: 無料
ヒント: 積極的にキャッシュを活用してください。ダウンロード済み論文の抽出テキスト再読は無料です。

セキュリティ

権限、シークレット、影響範囲

認証情報の保管： 不要

データ送信先： export.arxiv.orgへのクエリ送信、arxiv.orgからのPDFダウンロード

arXivの1リクエスト/3秒の推奨を遵守し、過度な並列リクエストは避けてください。
正規のarXiv IDを持つ論文のみキャッシュしてください。アーカイブ全体のミラーリングは行わないでください。

トラブルシューティング

よくあるエラーと対処法

Empty search results：明らかに存在するトピックなのに検索結果が空になる

arXivの検索は引用符付き文字列に対してキーワード完全一致です。より広い用語を試し、正しいカテゴリプレフィックス（cs.CL vs cs.AI）を指定してください。

Download failed / PDF unavailable：ダウンロード失敗またはPDFが利用不可

非常にまれですが、取り下げられた論文は404になることがあります。arxiv.org/abs/<id>でIDを確認してください。

Extracted text is garbled：抽出テキストが文字化けしている

数式が多い論文は非標準的なPDFの場合があります。可能であればソースバージョンを試すか、制限事項として記録してください。

代替案

arXiv 他との比較

代替案	代わりに使う場面	トレードオフ
Semantic Scholar MCP	被引用数やインパクト指標が必要なとき	arXiv特化ではなく、カバレッジにばらつきがある
Papers with Code MCP	コード実装がリンクされた論文が欲しいとき	カタログが小さく、ML分野に特化している

その他

リソース

📖 GitHub の公式 README を読む

🐙 オープンな issue を見る

🔍 400以上のMCPサーバーとSkillsを見る