arXiv MCP — Instalar & Demo en vivo

Por qué usarlo

Características clave

Busca por consulta, categoría (cs.AI, cs.CL, stat.ML, etc.), rango de fechas, autor
Descarga PDF a un directorio de caché local
Extrae texto de un artículo descargado para resumen o Q&A
Lista artículos en caché local para evitar descargas duplicadas
Sin clave API — la query API de arXiv es pública

Demo en vivo

Cómo se ve en la práctica

arxiv.replay ▶ listo

0/0

Instalar

Elige tu cliente

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Abre Claude Desktop → Settings → Developer → Edit Config. Reinicia después de guardar.

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cursor usa el mismo esquema mcpServers que Claude Desktop. La configuración del proyecto prevalece sobre la global.

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Haz clic en el icono MCP Servers de la barra lateral de Cline y luego en "Edit Configuration".

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Mismo formato que Claude Desktop. Reinicia Windsurf para aplicar.

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "arxiv",
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  ]
}

Continue usa un array de objetos de servidor en lugar de un mapa.

~/.config/zed/settings.json

{
  "context_servers": {
    "arxiv": {
      "command": {
        "path": "uvx",
        "args": [
          "arxiv-mcp-server"
        ]
      }
    }
  }
}

Añádelo a context_servers. Zed recarga en caliente al guardar.

claude mcp add arxiv -- uvx arxiv-mcp-server

Un solo comando. Verifica con claude mcp list. Quita con claude mcp remove.

Casos de uso

Usos del mundo real: arXiv

Construye un mini survey de literatura en un tema específico

👤 Investigadores, estudiantes de posgrado, ingenieros curiosos ⏱ ~25 min intermediate

Cuándo usarlo: Estás iniciando trabajo en un tema (p. ej. 'speculative decoding') y deseas los 10 artículos más relevantes recientes con resúmenes.

Requisitos previos

Directorio de caché local escribible — Por defecto bajo el home del usuario; sobrescribe mediante ARXIV_STORAGE_PATH

Flujo

Busca estratégicamente

Busca en arXiv 'speculative decoding' en cs.CL o cs.LG, últimos 12 meses, ordena por relevancia. Top 20.✓ Copiado

→ Lista de ids de arxiv + títulos + abstracts
Descarga los candidatos principales

Descarga los 10 artículos principales localmente.✓ Copiado

→ Artículos en caché; retorna rutas locales
Resume cada uno en un párrafo

Para cada artículo descargado, extrae texto y escribe un resumen de 4 líneas: problema, método, resultado, limitaciones. Preserva el id de arxiv.✓ Copiado

→ Resúmenes estructurados con citas

Resultado: Una tabla de survey de 10 artículos lista para una sección de trabajo relacionado o entrada de blog.

Errores comunes

El ordenamiento por relevancia de arXiv es débil; te perderás artículos importantes ordenados en otro lugar — También busca ordenado por submittedDate descendente; triangula a través de Semantic Scholar / Google Scholar para conteos de citas

Combinar con: filesystem · qdrant

Lectura profunda de un artículo con Q&A

👤 Cualquiera leyendo un artículo denso ⏱ ~20 min beginner

Cuándo usarlo: Tienes un artículo específico (digamos, el artículo FlashAttention-3) y quieres entenderlo sin leer el PDF completo por tu cuenta.

Flujo

Descarga el artículo

Descarga el artículo de arxiv 2405.12345. Reporta el número de páginas y cuenta total de palabras.✓ Copiado

→ Archivo en caché + estadísticas
Resume por sección

Lee el artículo. Dame un resumen sección por sección. Para cada sección: objetivo, puntos clave, cualquier ecuación que valga la pena entender (en inglés simple).✓ Copiado

→ Tutorial estructurado
Haz preguntas dirigidas

Pregunta específica: [tu pregunta]. Responde solo desde el artículo; cita la sección y cualquier número de ecuación.✓ Copiado

→ Respuesta fundamentada con citas

Resultado: Comprensión a nivel de artículo en 20 minutos en lugar de 2 horas.

Errores comunes

La extracción de PDF desordena ecuaciones y tablas — Para artículos con matemáticas pesadas, pídele a Claude que note 'la extracción de ecuaciones puede no ser confiable' y verifica las fórmulas críticas contra el PDF

Resumen semanal de nuevos artículos en tu campo

👤 Académicos, ingenieros de ML siguiendo un subcampo ⏱ ~15 min beginner

Cuándo usarlo: Lunes por la mañana: '¿qué hay de nuevo en cs.CL enviado en los últimos 7 días que valga la pena leer?'

Flujo

Extrae envíos recientes

Busca envíos de arXiv cs.CL en los últimos 7 días. Retorna los 50 principales por relevancia o arbitrarios.✓ Copiado

→ Lista de artículos recientes
Filtra por palabras clave que te importan

Mantén solo artículos cuyo título o abstract menciona [tus palabras clave]. Deduplica.✓ Copiado

→ Lista corta reducida
Resumen abstract

Para cada artículo conservado, genera 2 líneas 'por qué podría importar' desde el abstract. Marca 3 como lecturas imprescindibles.✓ Copiado

→ Resumen semanal

Resultado: Una lista de lectura semanal curada sin desplazarte desesperadamente por arxiv-sanity.

Errores comunes

Los abstracts sobrevenden; la etiqueta 'must-read' puede ser incorrecta — Trata la etiqueta como un aviso para leer el abstract tú mismo, no como un respaldo

Combinar con: notion

Combinaciones

Combínalo con otros MCPs para multiplicar por 10

arxiv + qdrant

Construye una biblioteca de artículos buscable para recuperación semántica

Descarga los 30 artículos principales sobre 'mixture of experts'. Indexa cada fragmento en la colección Qdrant papers_moe. Luego responde: '¿qué trucos usan los artículos MoE para balanceo de carga?'✓ Copiado

arxiv + filesystem

Escribe un archivo de survey markdown con citas en línea

Descarga 10 artículos sobre tema X, guarda resúmenes en /research/survey-X.md con enlaces [arxiv:id].✓ Copiado

arxiv + notion

Publica un resumen semanal de artículos en una BD de investigación de Notion

Ejecuta el resumen semanal para cs.CL, crea una página de Notion con los 5 imprescindibles como filas.✓ Copiado

Herramientas

Lo que expone este MCP

Herramienta	Entradas	Cuándo llamar	Coste
search_papers	query: str, category?, max_results?, date_range?	Descubre artículos relevantes por consulta/categoría/fecha	free
download_paper	paper_id	Cachea un PDF localmente para extracción	free
read_paper	paper_id	Extrae texto de un artículo en caché para lectura/Q&A	free
list_papers		Ve qué ya está descargado para evitar re-descargas	free

Coste y límites

Lo que cuesta ejecutarlo

Cuota de API: La query API de arXiv recomienda ~1 req/3s; tasas más altas pueden ser limitadas
Tokens por llamada: Búsqueda: 500–2000 tokens. Texto de artículo: 5k–30k tokens por artículo.
Monetario: Gratis
Consejo: Cachea agresivamente; releer el texto extraído de un artículo es gratis una vez descargado.

Seguridad

Permisos, secretos, alcance

Almacenamiento de credenciales: Ninguno necesario

Salida de datos: Consultas a export.arxiv.org; descargas de PDF desde arxiv.org

Respeta la recomendación de arXiv de 1 req / 3s; no paralelices agresivamente.
Solo cachea artículos con ids de arXiv adecuados; no espejes el archivo completo.

Resolución de problemas

Errores comunes y soluciones

Resultados de búsqueda vacíos para un tema claramente existente

La búsqueda de arXiv es exacta por palabra clave para cadenas entrecomilladas; prueba términos más amplios y el prefijo de categoría correcto (cs.CL vs cs.AI).

Descarga fallida / PDF no disponible

Muy raro; algunos artículos retirados devuelven 404. Confirma el id en arxiv.org/abs/<id>.

Texto extraído está corrupto

Algunos artículos con muchas matemáticas tienen PDFs no estándar; intenta la versión de fuente si está disponible, si no, anota la limitación.

Alternativas

arXiv vs otros

Alternativa	Cuándo usarla	Contrapartida
Semantic Scholar MCP	Necesitas conteos de citas y métricas de influencia	No específico de arXiv; la cobertura varía
Papers with Code MCP	Deseas artículos con implementaciones de código vinculadas	Catálogo más pequeño, enfoque en ML

Más

Recursos

📖 Lee el README oficial en GitHub

🐙 Ver issues abiertas

🔍 Ver todos los 400+ servidores MCP y Skills