/ Annuaire / Playground / arXiv
● Communauté blazickjp ⚡ Instantané

arXiv

par blazickjp · blazickjp/arxiv-mcp-server

Cherchez arXiv, téléchargez des articles, et laissez Claude les lire et les résumer — un assistant de recherche léger pour les derniers preprints.

Le serveur arxiv-mcp permet à Claude de chercher sur arXiv par mot-clé/catégorie/date, télécharger les PDF, et extraire leur texte pour une lecture en chat. Pas de clé API ; arXiv est entièrement public. Idéal pour les revues de littérature, le résumé d'articles, et rester à jour dans les domaines en rapide évolution du ML/physique/informatique.

Pourquoi l'utiliser

Fonctionnalités clés

Démo en direct

Aperçu en pratique

arxiv.replay ▶ prêt
0/0

Installer

Choisissez votre client

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Ouvrez Claude Desktop → Settings → Developer → Edit Config. Redémarrez après avoir enregistré.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cursor utilise le même schéma mcpServers que Claude Desktop. La config projet l'emporte sur la globale.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cliquez sur l'icône MCP Servers dans la barre latérale Cline, puis "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Même format que Claude Desktop. Redémarrez Windsurf pour appliquer.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "arxiv",
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  ]
}

Continue utilise un tableau d'objets serveur plutôt qu'une map.

~/.config/zed/settings.json
{
  "context_servers": {
    "arxiv": {
      "command": {
        "path": "uvx",
        "args": [
          "arxiv-mcp-server"
        ]
      }
    }
  }
}

Ajoutez dans context_servers. Zed recharge à chaud à la sauvegarde.

claude mcp add arxiv -- uvx arxiv-mcp-server

Une seule ligne. Vérifiez avec claude mcp list. Supprimez avec claude mcp remove.

Cas d'usage

Usages concrets : arXiv

Construire une mini-revue de littérature sur un sujet de niche

👤 Chercheurs, étudiants diplômés, ingénieurs curieux ⏱ ~25 min intermediate

Quand l'utiliser : Vous commencez à travailler sur un sujet (p. ex. 'speculative decoding') et voulez les 10 articles récents les plus pertinents avec résumés.

Prérequis
  • Répertoire de cache local accessible en écriture — Par défaut sous le répertoire utilisateur ; à remplacer via ARXIV_STORAGE_PATH
Déroulement
  1. Chercher stratégiquement
    Chercher arXiv pour 'speculative decoding' dans cs.CL ou cs.LG, 12 derniers mois, trier par pertinence. Top 20.✓ Copié
    → Liste d'identifiants arXiv + titres + résumés
  2. Télécharger les meilleurs candidats
    Télécharger les 10 meilleurs articles localement.✓ Copié
    → Articles mis en cache ; retourner les chemins locaux
  3. Résumer chacun en un paragraphe
    Pour chaque article téléchargé, extraire le texte et écrire un résumé de 4 lignes : problème, méthode, résultat, limitations. Conserver l'identifiant arXiv.✓ Copié
    → Résumés structurés avec citations

Résultat : Un tableau de 10 articles prêt pour une section de travaux connexes ou un billet de blog.

Pièges
  • Le tri de pertinence d'arXiv est faible ; vous allez manquer des articles importants triés ailleurs — Cherchez également triés par submittedDate desc ; triangullez via Semantic Scholar / Google Scholar pour les nombres de citations
Combiner avec : filesystem · qdrant

Lire en profondeur un article unique avec Q&A

👤 Quiconque lit un article dense ⏱ ~20 min beginner

Quand l'utiliser : Vous avez un article spécifique (disons, l'article FlashAttention-3) et voulez le comprendre sans lire le PDF complet seul.

Déroulement
  1. Télécharger l'article
    Télécharger l'article arXiv 2405.12345. Signaler le nombre de pages et le nombre total de mots.✓ Copié
    → Fichier mis en cache + statistiques
  2. Résumer par section
    Lire l'article. Donnez-moi un résumé section par section. Pour chaque section : objectif, points clés, équations à comprendre (en anglais simple).✓ Copié
    → Présentation structurée
  3. Poser des questions ciblées
    Question spécifique : [votre question]. Répondre uniquement à partir de l'article ; citer la section et les numéros d'équation.✓ Copié
    → Réponse fondée avec citations

Résultat : Compréhension au niveau de l'article en 20 minutes au lieu de 2 heures.

Pièges
  • L'extraction de PDF estropie les équations et les tableaux — Pour les articles lourds en mathématiques, demandez à Claude de noter « l'extraction d'équations peut être peu fiable » et de vérifier les formules critiques par rapport au PDF

Résumé hebdomadaire des nouveaux articles dans votre domaine

👤 Universitaires, ingénieurs ML suivant un sous-domaine ⏱ ~15 min beginner

Quand l'utiliser : Lundi matin : « quoi de neuf dans cs.CL soumis au cours des 7 derniers jours qui vaut la peine de lire ? »

Déroulement
  1. Tirer les soumissions récentes
    Chercher les soumissions arXiv cs.CL des 7 derniers jours. Retourner les 50 premiers par pertinence ou arbitraire.✓ Copié
    → Liste des articles récents
  2. Filtrer par mots-clés qui vous importent
    Garder uniquement les articles dont le titre ou le résumé mentionne [vos mots-clés]. Dédoubler.✓ Copié
    → Liste courte réduite
  3. Résumé abstrait
    Pour chaque article conservé, générer une « raison pour laquelle cela pourrait compter » de 2 lignes à partir du résumé. Marquer 3 comme lectures obligatoires.✓ Copié
    → Résumé hebdomadaire

Résultat : Une liste de lecture hebdomadaire curée sans faire défiler arxiv-sanity.

Pièges
  • Les résumés se vendent trop ; la balise « lecture obligatoire » peut être incorrecte — Traiter la balise comme une invitation à lire le résumé vous-même, pas comme une approbation
Combiner avec : notion

Combinaisons

Associez-le à d'autres MCPs pour un effet X10

arxiv + qdrant

Construire une bibliothèque perméable d'articles pour la rappel sémantique

Télécharger les 30 premiers articles sur 'mixture of experts'. Indexer chaque morceau dans la collection Qdrant papers_moe. Répondre ensuite : « quels trucs les articles MoE utilisent-ils pour l'équilibrage de charge ? »✓ Copié
arxiv + filesystem

Écrire un fichier d'enquête markdown avec citations en ligne

Télécharger 10 articles sur le sujet X, enregistrer les résumés sur /research/survey-X.md avec les liens [arxiv:id].✓ Copié
arxiv + notion

Publier un résumé hebdomadaire des articles dans une base de données de recherche Notion

Exécuter le résumé hebdomadaire pour cs.CL, créer une page Notion avec les 5 lectures obligatoires en lignes.✓ Copié

Outils

Ce que ce MCP expose

OutilEntréesQuand appelerCoût
search_papers query: str, category?, max_results?, date_range? Découvrir les articles pertinents par requête/catégorie/date free
download_paper paper_id Mettre en cache un PDF localement pour extraction free
read_paper paper_id Extraire le texte d'un article mis en cache pour la lecture/QA free
list_papers Voir ce qui a déjà été téléchargé pour éviter la re-récupération free

Coût et limites

Coût d'exécution

Quota d'API
L'API de requête arXiv recommande ~1 req/3s ; les taux plus élevés peuvent être limités
Tokens par appel
Recherche : 500–2000 jetons. Texte de l'article : 5k–30k jetons par article.
Monétaire
Gratuit
Astuce
Mettez en cache de manière agressive ; relire le texte extrait d'un article est gratuit une fois téléchargé.

Sécurité

Permissions, secrets, portée

Stockage des identifiants : Aucun nécessaire
Sortie de données : Requêtes à export.arxiv.org ; téléchargements de PDF à partir d'arxiv.org

Dépannage

Erreurs courantes et correctifs

Résultats de recherche vides pour un sujet clairement existant

La recherche d'arXiv est exacte par mot-clé pour les chaînes entre guillemets ; essayez des termes plus larges et le préfixe de catégorie correct (cs.CL vs cs.AI).

Téléchargement échoué / PDF indisponible

Très rare ; certains articles retirés renvoient 404. Confirmez l'identifiant sur arxiv.org/abs/<id>.

Le texte extrait est brouillé

Certains articles lourds en mathématiques ont des PDF non standards ; essayez la version source si disponible, sinon notez la limitation.

Alternatives

arXiv vs autres

AlternativeQuand l'utiliserCompromis
Semantic Scholar MCPVous avez besoin de nombres de citations et de métriques d'influenceNon spécifique à arXiv ; la couverture varie
Papers with Code MCPVous voulez des articles avec des implémentations de code liéesCatalogue plus petit, axé sur ML

Plus

Ressources

📖 Lire le README officiel sur GitHub

🐙 Voir les issues ouvertes

🔍 Parcourir les 400+ serveurs MCP et Skills