arXiv MCP — Installer & Démo en direct

Pourquoi l'utiliser

Fonctionnalités clés

Recherche par requête, catégorie (cs.AI, cs.CL, stat.ML, etc.), plage de dates, auteur
Télécharger le PDF dans un répertoire de cache local
Extraire le texte d'un article téléchargé pour résumé ou QA
Lister les articles mis en cache localement pour éviter de les re-télécharger
Pas de clé API — l'API de requête d'arXiv est publique

Démo en direct

Aperçu en pratique

arxiv.replay ▶ prêt

0/0

Installer

Choisissez votre client

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Ouvrez Claude Desktop → Settings → Developer → Edit Config. Redémarrez après avoir enregistré.

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cursor utilise le même schéma mcpServers que Claude Desktop. La config projet l'emporte sur la globale.

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cliquez sur l'icône MCP Servers dans la barre latérale Cline, puis "Edit Configuration".

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Même format que Claude Desktop. Redémarrez Windsurf pour appliquer.

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "arxiv",
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  ]
}

Continue utilise un tableau d'objets serveur plutôt qu'une map.

~/.config/zed/settings.json

{
  "context_servers": {
    "arxiv": {
      "command": {
        "path": "uvx",
        "args": [
          "arxiv-mcp-server"
        ]
      }
    }
  }
}

Ajoutez dans context_servers. Zed recharge à chaud à la sauvegarde.

claude mcp add arxiv -- uvx arxiv-mcp-server

Une seule ligne. Vérifiez avec claude mcp list. Supprimez avec claude mcp remove.

Cas d'usage

Usages concrets : arXiv

Construire une mini-revue de littérature sur un sujet de niche

👤 Chercheurs, étudiants diplômés, ingénieurs curieux ⏱ ~25 min intermediate

Quand l'utiliser : Vous commencez à travailler sur un sujet (p. ex. 'speculative decoding') et voulez les 10 articles récents les plus pertinents avec résumés.

Prérequis

Répertoire de cache local accessible en écriture — Par défaut sous le répertoire utilisateur ; à remplacer via ARXIV_STORAGE_PATH

Déroulement

Chercher stratégiquement

Chercher arXiv pour 'speculative decoding' dans cs.CL ou cs.LG, 12 derniers mois, trier par pertinence. Top 20.✓ Copié

→ Liste d'identifiants arXiv + titres + résumés
Télécharger les meilleurs candidats

Télécharger les 10 meilleurs articles localement.✓ Copié

→ Articles mis en cache ; retourner les chemins locaux
Résumer chacun en un paragraphe

Pour chaque article téléchargé, extraire le texte et écrire un résumé de 4 lignes : problème, méthode, résultat, limitations. Conserver l'identifiant arXiv.✓ Copié

→ Résumés structurés avec citations

Résultat : Un tableau de 10 articles prêt pour une section de travaux connexes ou un billet de blog.

Pièges

Le tri de pertinence d'arXiv est faible ; vous allez manquer des articles importants triés ailleurs — Cherchez également triés par submittedDate desc ; triangullez via Semantic Scholar / Google Scholar pour les nombres de citations

Combiner avec : filesystem · qdrant

Lire en profondeur un article unique avec Q&A

👤 Quiconque lit un article dense ⏱ ~20 min beginner

Quand l'utiliser : Vous avez un article spécifique (disons, l'article FlashAttention-3) et voulez le comprendre sans lire le PDF complet seul.

Déroulement

Télécharger l'article

Télécharger l'article arXiv 2405.12345. Signaler le nombre de pages et le nombre total de mots.✓ Copié

→ Fichier mis en cache + statistiques
Résumer par section

Lire l'article. Donnez-moi un résumé section par section. Pour chaque section : objectif, points clés, équations à comprendre (en anglais simple).✓ Copié

→ Présentation structurée
Poser des questions ciblées

Question spécifique : [votre question]. Répondre uniquement à partir de l'article ; citer la section et les numéros d'équation.✓ Copié

→ Réponse fondée avec citations

Résultat : Compréhension au niveau de l'article en 20 minutes au lieu de 2 heures.

Pièges

L'extraction de PDF estropie les équations et les tableaux — Pour les articles lourds en mathématiques, demandez à Claude de noter « l'extraction d'équations peut être peu fiable » et de vérifier les formules critiques par rapport au PDF

Résumé hebdomadaire des nouveaux articles dans votre domaine

👤 Universitaires, ingénieurs ML suivant un sous-domaine ⏱ ~15 min beginner

Quand l'utiliser : Lundi matin : « quoi de neuf dans cs.CL soumis au cours des 7 derniers jours qui vaut la peine de lire ? »

Déroulement

Tirer les soumissions récentes

Chercher les soumissions arXiv cs.CL des 7 derniers jours. Retourner les 50 premiers par pertinence ou arbitraire.✓ Copié

→ Liste des articles récents
Filtrer par mots-clés qui vous importent

Garder uniquement les articles dont le titre ou le résumé mentionne [vos mots-clés]. Dédoubler.✓ Copié

→ Liste courte réduite
Résumé abstrait

Pour chaque article conservé, générer une « raison pour laquelle cela pourrait compter » de 2 lignes à partir du résumé. Marquer 3 comme lectures obligatoires.✓ Copié

→ Résumé hebdomadaire

Résultat : Une liste de lecture hebdomadaire curée sans faire défiler arxiv-sanity.

Pièges

Les résumés se vendent trop ; la balise « lecture obligatoire » peut être incorrecte — Traiter la balise comme une invitation à lire le résumé vous-même, pas comme une approbation

Combiner avec : notion

Combinaisons

Associez-le à d'autres MCPs pour un effet X10

arxiv + qdrant

Construire une bibliothèque perméable d'articles pour la rappel sémantique

Télécharger les 30 premiers articles sur 'mixture of experts'. Indexer chaque morceau dans la collection Qdrant papers_moe. Répondre ensuite : « quels trucs les articles MoE utilisent-ils pour l'équilibrage de charge ? »✓ Copié

arxiv + filesystem

Écrire un fichier d'enquête markdown avec citations en ligne

Télécharger 10 articles sur le sujet X, enregistrer les résumés sur /research/survey-X.md avec les liens [arxiv:id].✓ Copié

arxiv + notion

Publier un résumé hebdomadaire des articles dans une base de données de recherche Notion

Exécuter le résumé hebdomadaire pour cs.CL, créer une page Notion avec les 5 lectures obligatoires en lignes.✓ Copié

Outils

Ce que ce MCP expose

Outil	Entrées	Quand appeler	Coût
search_papers	query: str, category?, max_results?, date_range?	Découvrir les articles pertinents par requête/catégorie/date	free
download_paper	paper_id	Mettre en cache un PDF localement pour extraction	free
read_paper	paper_id	Extraire le texte d'un article mis en cache pour la lecture/QA	free
list_papers		Voir ce qui a déjà été téléchargé pour éviter la re-récupération	free

Coût et limites

Coût d'exécution

Quota d'API: L'API de requête arXiv recommande ~1 req/3s ; les taux plus élevés peuvent être limités
Tokens par appel: Recherche : 500–2000 jetons. Texte de l'article : 5k–30k jetons par article.
Monétaire: Gratuit
Astuce: Mettez en cache de manière agressive ; relire le texte extrait d'un article est gratuit une fois téléchargé.

Sécurité

Permissions, secrets, portée

Stockage des identifiants : Aucun nécessaire

Sortie de données : Requêtes à export.arxiv.org ; téléchargements de PDF à partir d'arxiv.org

Respectez la recommandation 1 req / 3s d'arXiv ; ne pas paralléliser agressivement.
Mettez en cache uniquement les articles avec des identifiants arXiv corrects ; ne pas miroir l'archive complète.

Dépannage

Erreurs courantes et correctifs

Résultats de recherche vides pour un sujet clairement existant

La recherche d'arXiv est exacte par mot-clé pour les chaînes entre guillemets ; essayez des termes plus larges et le préfixe de catégorie correct (cs.CL vs cs.AI).

Téléchargement échoué / PDF indisponible

Très rare ; certains articles retirés renvoient 404. Confirmez l'identifiant sur arxiv.org/abs/<id>.

Le texte extrait est brouillé

Certains articles lourds en mathématiques ont des PDF non standards ; essayez la version source si disponible, sinon notez la limitation.

Alternatives

arXiv vs autres

Alternative	Quand l'utiliser	Compromis
Semantic Scholar MCP	Vous avez besoin de nombres de citations et de métriques d'influence	Non spécifique à arXiv ; la couverture varie
Papers with Code MCP	Vous voulez des articles avec des implémentations de code liées	Catalogue plus petit, axé sur ML

Plus

Ressources

📖 Lire le README officiel sur GitHub

🐙 Voir les issues ouvertes

🔍 Parcourir les 400+ serveurs MCP et Skills