/ Directorio / Playground / arXiv
● Comunidad blazickjp ⚡ Instantáneo

arXiv

por blazickjp · blazickjp/arxiv-mcp-server

Busca en arXiv, descarga artículos y deja que Claude los lea y resuma — un asistente de investigación ligero para los últimos preprints.

El arxiv-mcp-server permite a Claude buscar en arXiv por palabra clave/categoría/fecha, descargar PDFs y extraer su texto para lectura en chat. Sin clave API; arXiv es completamente público. Ideal para surveys de literatura, resumen de artículos y estar al día en campos de ML/física/CS que se mueven rápidamente.

Por qué usarlo

Características clave

Demo en vivo

Cómo se ve en la práctica

arxiv.replay ▶ listo
0/0

Instalar

Elige tu cliente

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Abre Claude Desktop → Settings → Developer → Edit Config. Reinicia después de guardar.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cursor usa el mismo esquema mcpServers que Claude Desktop. La configuración del proyecto prevalece sobre la global.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Haz clic en el icono MCP Servers de la barra lateral de Cline y luego en "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Mismo formato que Claude Desktop. Reinicia Windsurf para aplicar.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "arxiv",
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  ]
}

Continue usa un array de objetos de servidor en lugar de un mapa.

~/.config/zed/settings.json
{
  "context_servers": {
    "arxiv": {
      "command": {
        "path": "uvx",
        "args": [
          "arxiv-mcp-server"
        ]
      }
    }
  }
}

Añádelo a context_servers. Zed recarga en caliente al guardar.

claude mcp add arxiv -- uvx arxiv-mcp-server

Un solo comando. Verifica con claude mcp list. Quita con claude mcp remove.

Casos de uso

Usos del mundo real: arXiv

Construye un mini survey de literatura en un tema específico

👤 Investigadores, estudiantes de posgrado, ingenieros curiosos ⏱ ~25 min intermediate

Cuándo usarlo: Estás iniciando trabajo en un tema (p. ej. 'speculative decoding') y deseas los 10 artículos más relevantes recientes con resúmenes.

Requisitos previos
  • Directorio de caché local escribible — Por defecto bajo el home del usuario; sobrescribe mediante ARXIV_STORAGE_PATH
Flujo
  1. Busca estratégicamente
    Busca en arXiv 'speculative decoding' en cs.CL o cs.LG, últimos 12 meses, ordena por relevancia. Top 20.✓ Copiado
    → Lista de ids de arxiv + títulos + abstracts
  2. Descarga los candidatos principales
    Descarga los 10 artículos principales localmente.✓ Copiado
    → Artículos en caché; retorna rutas locales
  3. Resume cada uno en un párrafo
    Para cada artículo descargado, extrae texto y escribe un resumen de 4 líneas: problema, método, resultado, limitaciones. Preserva el id de arxiv.✓ Copiado
    → Resúmenes estructurados con citas

Resultado: Una tabla de survey de 10 artículos lista para una sección de trabajo relacionado o entrada de blog.

Errores comunes
  • El ordenamiento por relevancia de arXiv es débil; te perderás artículos importantes ordenados en otro lugar — También busca ordenado por submittedDate descendente; triangula a través de Semantic Scholar / Google Scholar para conteos de citas
Combinar con: filesystem · qdrant

Lectura profunda de un artículo con Q&A

👤 Cualquiera leyendo un artículo denso ⏱ ~20 min beginner

Cuándo usarlo: Tienes un artículo específico (digamos, el artículo FlashAttention-3) y quieres entenderlo sin leer el PDF completo por tu cuenta.

Flujo
  1. Descarga el artículo
    Descarga el artículo de arxiv 2405.12345. Reporta el número de páginas y cuenta total de palabras.✓ Copiado
    → Archivo en caché + estadísticas
  2. Resume por sección
    Lee el artículo. Dame un resumen sección por sección. Para cada sección: objetivo, puntos clave, cualquier ecuación que valga la pena entender (en inglés simple).✓ Copiado
    → Tutorial estructurado
  3. Haz preguntas dirigidas
    Pregunta específica: [tu pregunta]. Responde solo desde el artículo; cita la sección y cualquier número de ecuación.✓ Copiado
    → Respuesta fundamentada con citas

Resultado: Comprensión a nivel de artículo en 20 minutos en lugar de 2 horas.

Errores comunes
  • La extracción de PDF desordena ecuaciones y tablas — Para artículos con matemáticas pesadas, pídele a Claude que note 'la extracción de ecuaciones puede no ser confiable' y verifica las fórmulas críticas contra el PDF

Resumen semanal de nuevos artículos en tu campo

👤 Académicos, ingenieros de ML siguiendo un subcampo ⏱ ~15 min beginner

Cuándo usarlo: Lunes por la mañana: '¿qué hay de nuevo en cs.CL enviado en los últimos 7 días que valga la pena leer?'

Flujo
  1. Extrae envíos recientes
    Busca envíos de arXiv cs.CL en los últimos 7 días. Retorna los 50 principales por relevancia o arbitrarios.✓ Copiado
    → Lista de artículos recientes
  2. Filtra por palabras clave que te importan
    Mantén solo artículos cuyo título o abstract menciona [tus palabras clave]. Deduplica.✓ Copiado
    → Lista corta reducida
  3. Resumen abstract
    Para cada artículo conservado, genera 2 líneas 'por qué podría importar' desde el abstract. Marca 3 como lecturas imprescindibles.✓ Copiado
    → Resumen semanal

Resultado: Una lista de lectura semanal curada sin desplazarte desesperadamente por arxiv-sanity.

Errores comunes
  • Los abstracts sobrevenden; la etiqueta 'must-read' puede ser incorrecta — Trata la etiqueta como un aviso para leer el abstract tú mismo, no como un respaldo
Combinar con: notion

Combinaciones

Combínalo con otros MCPs para multiplicar por 10

arxiv + qdrant

Construye una biblioteca de artículos buscable para recuperación semántica

Descarga los 30 artículos principales sobre 'mixture of experts'. Indexa cada fragmento en la colección Qdrant papers_moe. Luego responde: '¿qué trucos usan los artículos MoE para balanceo de carga?'✓ Copiado
arxiv + filesystem

Escribe un archivo de survey markdown con citas en línea

Descarga 10 artículos sobre tema X, guarda resúmenes en /research/survey-X.md con enlaces [arxiv:id].✓ Copiado
arxiv + notion

Publica un resumen semanal de artículos en una BD de investigación de Notion

Ejecuta el resumen semanal para cs.CL, crea una página de Notion con los 5 imprescindibles como filas.✓ Copiado

Herramientas

Lo que expone este MCP

HerramientaEntradasCuándo llamarCoste
search_papers query: str, category?, max_results?, date_range? Descubre artículos relevantes por consulta/categoría/fecha free
download_paper paper_id Cachea un PDF localmente para extracción free
read_paper paper_id Extrae texto de un artículo en caché para lectura/Q&A free
list_papers Ve qué ya está descargado para evitar re-descargas free

Coste y límites

Lo que cuesta ejecutarlo

Cuota de API
La query API de arXiv recomienda ~1 req/3s; tasas más altas pueden ser limitadas
Tokens por llamada
Búsqueda: 500–2000 tokens. Texto de artículo: 5k–30k tokens por artículo.
Monetario
Gratis
Consejo
Cachea agresivamente; releer el texto extraído de un artículo es gratis una vez descargado.

Seguridad

Permisos, secretos, alcance

Almacenamiento de credenciales: Ninguno necesario
Salida de datos: Consultas a export.arxiv.org; descargas de PDF desde arxiv.org

Resolución de problemas

Errores comunes y soluciones

Resultados de búsqueda vacíos para un tema claramente existente

La búsqueda de arXiv es exacta por palabra clave para cadenas entrecomilladas; prueba términos más amplios y el prefijo de categoría correcto (cs.CL vs cs.AI).

Descarga fallida / PDF no disponible

Muy raro; algunos artículos retirados devuelven 404. Confirma el id en arxiv.org/abs/<id>.

Texto extraído está corrupto

Algunos artículos con muchas matemáticas tienen PDFs no estándar; intenta la versión de fuente si está disponible, si no, anota la limitación.

Alternativas

arXiv vs otros

AlternativaCuándo usarlaContrapartida
Semantic Scholar MCPNecesitas conteos de citas y métricas de influenciaNo específico de arXiv; la cobertura varía
Papers with Code MCPDeseas artículos con implementaciones de código vinculadasCatálogo más pequeño, enfoque en ML

Más

Recursos

📖 Lee el README oficial en GitHub

🐙 Ver issues abiertas

🔍 Ver todos los 400+ servidores MCP y Skills