/ Diretório / Playground / arXiv
● Comunidade blazickjp ⚡ Instantâneo

arXiv

por blazickjp · blazickjp/arxiv-mcp-server

Pesquise no arXiv, baixe artigos e deixe Claude lê-los + resumi-los — um assistente de pesquisa leve para os últimos pré-prints.

O arxiv-mcp-server permite que Claude pesquise no arXiv por palavra-chave/categoria/data, baixe PDFs e extraia seu texto para leitura no chat. Sem chave de API; arXiv é totalmente público. Ideal para levantamentos bibliográficos, sumarização de artigos e acompanhar subcampos em rápida evolução de ML/física/CS.

Por que usar

Principais recursos

Demo ao vivo

Como fica na prática

arxiv.replay ▶ pronto
0/0

Instalar

Escolha seu cliente

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Abra Claude Desktop → Settings → Developer → Edit Config. Reinicie após salvar.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cursor usa o mesmo esquema mcpServers que o Claude Desktop. Config de projeto vence a global.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Clique no ícone MCP Servers na barra lateral do Cline, depois "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Mesmo formato do Claude Desktop. Reinicie o Windsurf para aplicar.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "arxiv",
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  ]
}

O Continue usa um array de objetos de servidor em vez de um map.

~/.config/zed/settings.json
{
  "context_servers": {
    "arxiv": {
      "command": {
        "path": "uvx",
        "args": [
          "arxiv-mcp-server"
        ]
      }
    }
  }
}

Adicione em context_servers. Zed recarrega automaticamente ao salvar.

claude mcp add arxiv -- uvx arxiv-mcp-server

Uma linha só. Verifique com claude mcp list. Remova com claude mcp remove.

Casos de uso

Usos do mundo real: arXiv

Crie um mini levantamento bibliográfico sobre um tópico nicho

👤 Pesquisadores, pós-graduandos, engenheiros curiosos ⏱ ~25 min intermediate

Quando usar: Você está começando a trabalhar em um tópico (ex: 'especulative decoding') e quer os 10 artigos mais relevantes recentes com resumos.

Pré-requisitos
  • Diretório de cache local com permissão de escrita — Padrão sob home do usuário; substitua via ARXIV_STORAGE_PATH
Fluxo
  1. Pesquise estrategicamente
    Pesquise no arXiv por 'especulative decoding' em cs.CL ou cs.LG, últimos 12 meses, ordene por relevância. Top 20.✓ Copiado
    → Lista de ids do arxiv + títulos + resumos
  2. Baixe os principais candidatos
    Baixe os 10 principais artigos localmente.✓ Copiado
    → Artigos em cache; retorne caminhos locais
  3. Resuma cada um em um parágrafo
    Para cada artigo baixado, extraia o texto e escreva um resumo de 4 linhas: problema, método, resultado, limitações. Preserve o id do arxiv.✓ Copiado
    → Resumos estruturados com citações

Resultado: Uma tabela de levantamento de 10 artigos pronta para uma seção de trabalhos relacionados ou post de blog.

Armadilhas
  • A classificação de relevância do arXiv é fraca; você perderá artigos importantes classificados em outro lugar — Também pesquise ordenado por submittedDate desc; triangule via Semantic Scholar / Google Scholar para contagem de citações
Combine com: filesystem · qdrant

Leia profundamente um único artigo com Q&A

👤 Qualquer pessoa lendo um artigo denso ⏱ ~20 min beginner

Quando usar: Você tem um artigo específico (digamos, o artigo FlashAttention-3) e deseja entendê-lo sem ler o PDF completo sozinho.

Fluxo
  1. Baixe o artigo
    Baixe o artigo arxiv 2405.12345. Informe o número de páginas e contagem total de palavras.✓ Copiado
    → Arquivo em cache + estatísticas
  2. Resuma por seção
    Leia o artigo. Dê-me um resumo seção por seção. Para cada seção: objetivo, pontos principais, quaisquer equações que valha a pena entender (em inglês simples).✓ Copiado
    → Explicação estruturada
  3. Faça perguntas direcionadas
    Q específica: [sua pergunta]. Responda apenas com base no artigo; cite a seção e quaisquer números de equações.✓ Copiado
    → Resposta fundamentada com citações

Resultado: Compreensão no nível do artigo em 20 minutos em vez de 2 horas.

Armadilhas
  • A extração de PDF danifica equações e tabelas — Para artigos com muita matemática, peça a Claude para observar 'a extração de equações pode ser pouco confiável' e verifique cruzadamente as fórmulas críticas com o PDF

Resumo semanal de novos artigos em seu campo

👤 Acadêmicos, engenheiros de ML acompanhando um subcampo ⏱ ~15 min beginner

Quando usar: Segunda-feira de manhã: 'o que há de novo em cs.CL enviado nos últimos 7 dias que vale a pena ler?'

Fluxo
  1. Obtenha submissões recentes
    Pesquise submissões cs.CL do arXiv dos últimos 7 dias. Retorne os 50 principais por relevância ou arbitrário.✓ Copiado
    → Lista de artigos recentes
  2. Filtre por palavras-chave que você se importa
    Mantenha apenas artigos cujo título ou resumo mencione [suas palavras-chave]. Deduque.✓ Copiado
    → Lista restrita reduzida
  3. Resumo do abstract
    Para cada artigo mantido, gere 'por que pode importar' de 2 linhas a partir do resumo. Marque 3 como leitura obrigatória.✓ Copiado
    → Resumo semanal

Resultado: Uma lista de leitura semanal curada sem doomscroll do arxiv-sanity.

Armadilhas
  • Resumos exageram; a tag 'leitura obrigatória' pode estar errada — Trate a tag como um prompt para ler o resumo você mesmo, não como uma aprovação
Combine com: notion

Combinações

Combine com outros MCPs para 10× de alavancagem

arxiv + qdrant

Crie uma biblioteca de artigos pesquisável para recuperação semântica

Baixe os 30 principais artigos sobre 'mixture of experts'. Indexe cada chunk na coleção Qdrant papers_moe. Depois responda: 'que truques os artigos MoE usam para balanceamento de carga?'✓ Copiado
arxiv + filesystem

Escreva um arquivo de levantamento markdown com citações inline

Baixe 10 artigos sobre tópico X, salve resumos em /research/survey-X.md com links [arxiv:id].✓ Copiado
arxiv + notion

Poste um resumo de papel semanal para um DB de pesquisa Notion

Execute o resumo semanal para cs.CL, crie uma página Notion com os 5 leitura obrigatória como linhas.✓ Copiado

Ferramentas

O que este MCP expõe

FerramentaEntradasQuando chamarCusto
search_papers query: str, category?, max_results?, date_range? Descubra artigos relevantes por consulta/categoria/data free
download_paper paper_id Coloque em cache um PDF localmente para extração free
read_paper paper_id Extraia texto de um artigo em cache para leitura/QA free
list_papers Veja o que já foi baixado para evitar re-busca free

Custo e limites

O que custa rodar

Cota de API
A API de consulta do arXiv recomenda ~1 req/3s; taxas mais altas podem ser limitadas
Tokens por chamada
Pesquisa: 500–2000 tokens. Texto do artigo: 5k–30k tokens por artigo.
Monetário
Gratuito
Dica
Coloque em cache agressivamente; re-ler o texto extraído de um artigo é gratuito uma vez baixado.

Segurança

Permissões, segredos, alcance

Armazenamento de credenciais: Nenhum necessário
Saída de dados: Consultas para export.arxiv.org; downloads de PDF de arxiv.org

Solução de problemas

Erros comuns e correções

Resultados de pesquisa vazios para um tópico claramente existente

A pesquisa do arXiv é exata por palavra-chave para cadeias entre aspas; tente termos mais amplos e o prefixo de categoria correto (cs.CL vs cs.AI).

Download falhou / PDF indisponível

Muito raro; alguns artigos retirados 404. Confirme o id em arxiv.org/abs/<id>.

Texto extraído está ilegível

Alguns artigos com muita matemática têm PDFs não padrão; tente a versão de origem se disponível, caso contrário, observe a limitação.

Alternativas

arXiv vs. outros

AlternativaQuando usarTroca
Semantic Scholar MCPVocê precisa de contagem de citações e métricas de influênciaNão específico do arXiv; cobertura varia
Papers with Code MCPVocê quer artigos com implementações de código vinculadasCatálogo menor, focado em ML

Mais

Recursos

📖 Leia o README oficial no GitHub

🐙 Ver issues abertas

🔍 Ver todos os 400+ servidores MCP e Skills