/ Directorio / Playground / Qdrant
● Oficial qdrant 🔑 Requiere tu clave

Qdrant

por qdrant · qdrant/mcp-server-qdrant

Dale a Claude memoria vectorial duradera — almacena, recuerda y busca semánticamente texto con un MCP minimalista y opinado respaldado por Qdrant.

El MCP oficial de Qdrant convierte cualquier instancia de Qdrant (cloud o autohospedada) en un almacén de memoria semántica simple con solo dos herramientas: qdrant-store y qdrant-find. Perfecto para dar a agentes memoria a largo plazo, construir una base de conocimiento personal, o prototipear RAG sin escribir código pegadizo de embedding.

Por qué usarlo

Características clave

Demo en vivo

Cómo se ve en la práctica

qdrant.replay ▶ listo
0/0

Instalar

Elige tu cliente

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "qdrant": {
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  }
}

Abre Claude Desktop → Settings → Developer → Edit Config. Reinicia después de guardar.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "qdrant": {
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  }
}

Cursor usa el mismo esquema mcpServers que Claude Desktop. La configuración del proyecto prevalece sobre la global.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "qdrant": {
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  }
}

Haz clic en el icono MCP Servers de la barra lateral de Cline y luego en "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "qdrant": {
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  }
}

Mismo formato que Claude Desktop. Reinicia Windsurf para aplicar.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "qdrant",
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  ]
}

Continue usa un array de objetos de servidor en lugar de un mapa.

~/.config/zed/settings.json
{
  "context_servers": {
    "qdrant": {
      "command": {
        "path": "uvx",
        "args": [
          "mcp-server-qdrant"
        ]
      }
    }
  }
}

Añádelo a context_servers. Zed recarga en caliente al guardar.

claude mcp add qdrant -- uvx mcp-server-qdrant

Un solo comando. Verifica con claude mcp list. Quita con claude mcp remove.

Casos de uso

Usos del mundo real: Qdrant

Dale a un agente de Claude memoria persistente entre sesiones

👤 Constructores haciendo asistentes personales o copilotos internos ⏱ ~15 min beginner

Cuándo usarlo: Quieres que Claude recuerde preferencias del usuario, decisiones pasadas, o proyectos en curso incluso después de que termine el chat.

Requisitos previos
  • Qdrant en ejecución (Docker local o cloud) — docker run -p 6333:6333 qdrant/qdrant O una URL de clúster de Qdrant Cloud + clave API
  • Variable de entorno COLLECTION_NAME establecida — Cualquier string, p.ej. claude_memory
Flujo
  1. Enséñale a almacenar hechos importantes
    Siempre que te diga algo importante sobre un proyecto (plazos, partes interesadas, decisiones), almacenalo con qdrant-store, metadatos {project, category}.✓ Copiado
    → Claude comienza a repetir 'almacenado' para hechos duraderos
  2. Verifica que el recuerdo funcione
    ¿Qué recuerdas sobre el proyecto 'atlas'? Usa qdrant-find con una consulta como 'project atlas decisions'.✓ Copiado
    → Mensajes previos relevantes devueltos con puntuaciones
  3. Cura y olvida
    Busca cualquier cosa sobre el proyecto 'atlas' que tenga más de 90 días de antigüedad o esté marcada como obsoleta, y elimina esas entradas.✓ Copiado
    → Lista de elementos podados con confirmación

Resultado: Un asistente que realmente recuerda lo que le dijiste la semana pasada — limitado por proyecto, podable.

Errores comunes
  • Almacenar cada mensaje hincha la colección y degrada la calidad de recuperación — Solo almacena hechos/decisiones explícitos, no charla. Haz que la decisión 'almacenar o no' sea parte del prompt del sistema.
  • Colección creada con tamaño de vector incorrecto después de cambiar modelos de embedding — Qdrant rechaza vectores no coincidentes — descarta y recrea la colección cuando cambies EMBEDDING_MODEL
Combinar con: filesystem · notion

Construye un RAG ligero sobre una carpeta de docs

👤 Devs que quieren RAG sin un framework ⏱ ~30 min intermediate

Cuándo usarlo: Tienes 50–5000 archivos Markdown y quieres que Claude responda preguntas sobre ellos, con citas.

Requisitos previos
  • Docs en disco como Markdown — Cualquier carpeta de archivos .md
Flujo
  1. Fragmenta y almacena los docs
    Lee cada .md bajo /docs. Divide en fragmentos de ~500-token en límites de encabezados. Para cada fragmento, llama qdrant-store con el texto y metadatos {source_path, heading}.✓ Copiado
    → N fragmentos almacenados, uno por sección
  2. Consulta con una pregunta del usuario
    El usuario pregunta: '¿Cómo roto las claves API?' Usa qdrant-find para extraer los 5 fragmentos más relevantes. Cita source_path en tu respuesta.✓ Copiado
    → Respuesta con citas inline [source_path]
  3. Mide la calidad de recuperación
    Para estas 10 preguntas de evaluación [lista], ¿cuáles de las rutas de origen esperadas aparecen en la recuperación top-5? Reporta recall@5.✓ Copiado
    → Una puntuación de calidad de recuperación que puedes mejorar iterativamente

Resultado: Un bucle RAG funcional que puedes ajustar el tamaño de fragmento y k hasta que la calidad sea aceptable.

Errores comunes
  • Fragmentos demasiado grandes diluyen el embedding y matan la recuperación — Mantén fragmentos bajo ~1000 tokens; divide primero por encabezados, luego por conteo de tokens como alternativa
  • Actualizar un doc no elimina fragmentos antiguos — las respuestas se vuelven anticuadas — Usa un id de punto determinista (hash de source_path+heading) para que los upserts reemplacen en lugar de duplicar
Combinar con: filesystem · firecrawl

Desduplicar semánticamente una lista desordenada de tickets, leads o FAQs

👤 Equipos de Ops con un CSV de casi-duplicados ⏱ ~25 min intermediate

Cuándo usarlo: La deduplicación exacta se pierde cosas como 'reset password' vs 'how do I change my password' — necesitas similitud semántica.

Flujo
  1. Almacena cada elemento con su id de fila como metadatos
    Lee rows.csv. Para cada fila, qdrant-store con information=<text> y metadata={row_id: <id>}.✓ Copiado
    → N puntos almacenados
  2. Agrupa por similitud
    Para cada fila, consulta qdrant-find para sus 5 vecinos principales con puntuación > 0.85. Produce grupos de row_ids que están mutuamente cerca.✓ Copiado
    → Grupos duplicados impresos
  3. Elige canónico + marca el resto como duplicados
    Para cada grupo, elige la fila más larga/más informativa como canónica. Produce un CSV {row_id, canonical_id}.✓ Copiado
    → Mapa de dedup listo para el sistema de origen

Resultado: Un CSV de mapeo de dedup con puntuaciones de confianza, revisable por un humano antes de aplicar.

Errores comunes
  • El umbral de similitud es específico del dominio — 0.85 puede ser demasiado tolerante o demasiado estricto — Etiqueta manualmente 20 pares primero, luego elige el umbral que mejor separa dup de no-dup
Combinar con: postgres · filesystem

Memoria de notas de reunión buscable

👤 Managers / ICs ahogándose en notas de Notion/Obsidian ⏱ ~20 min beginner

Cuándo usarlo: Tomas notas semanales pero nunca puedes encontrar la en la que se tomó una decisión específica.

Requisitos previos
  • Carpeta de notas de reunión — Cualquier archivo de texto o markdown
Flujo
  1. Indexa notas existentes
    Recorre /meetings/**/*.md. Para cada una, qdrant-store el cuerpo con metadatos {date, attendees, project}.✓ Copiado
    → Todas las notas indexadas con fechas
  2. Recuerda decisiones
    Encuentra cada nota donde discutimos 'pricing for enterprise tier'. Muéstrame la fecha y un resumen de 2 líneas de cada una.✓ Copiado
    → Lista clasificada de reuniones coincidentes
  3. Mantenlo fresco
    Añade la nota de hoy <paste>, luego dime cuáles notas pasadas probablemente contradicen o actualizan decisiones en la de hoy.✓ Copiado
    → Verificación de contradicción vía vecinos semánticos

Resultado: Un índice semántico sobre tus notas que puedes seguir actualizando semanalmente.

Errores comunes
  • Mezclar notas personales + trabajo en una colección filtra alcance — Usa colecciones separadas o aplica un filtro de metadatos scope en cada búsqueda
Combinar con: filesystem · notion

Combinaciones

Combínalo con otros MCPs para multiplicar por 10

qdrant + filesystem

Indexa una carpeta de docs local luego responde preguntas con citas

Indexa cada .md bajo /docs en Qdrant, luego responde: '¿cómo funciona nuestro flujo de auth?' con citas a las rutas de archivo originales.✓ Copiado
qdrant + firecrawl

Rastrea un sitio y construye una base de conocimiento buscable

Rastrea docs.mycompany.com con Firecrawl, almacena cada página en la colección de Qdrant company_docs.✓ Copiado
qdrant + postgres

Búsqueda semántica sobre columnas no estructuradas en una BD relacional

SELECT id, body FROM support_tickets created in the last 30 days, inserta cada body en Qdrant con metadatos {ticket_id}, luego déjame buscarlos por significado.✓ Copiado

Herramientas

Lo que expone este MCP

HerramientaEntradasCuándo llamarCoste
qdrant-store information: str, metadata?: object Persiste un hecho, fragmento, o nota para recuperación semántica posterior gratuito (embedding local)
qdrant-find query: str, limit?: int Recupera entradas semánticamente similares para responder una pregunta o desduplicar gratuito

Coste y límites

Lo que cuesta ejecutarlo

Cuota de API
Autohospedada: ilimitada. Qdrant Cloud: depende del tamaño del clúster.
Tokens por llamada
Almacenar: ~100 tokens de sobrecarga por llamada. Buscar: ~200 tokens + carga útil de resultado.
Monetario
Gratuito si está autohospedado. Qdrant Cloud capa gratuita: clúster de 1GB. De pago desde ~$25/mes.
Consejo
Comienza con Docker local para desarrollo; actualiza a Cloud solo cuando necesites persistencia y acceso multi-dispositivo.

Seguridad

Permisos, secretos, alcance

Almacenamiento de credenciales: QDRANT_URL y QDRANT_API_KEY opcional en variables de entorno
Salida de datos: Si está autohospedada: ninguno. Si Qdrant Cloud: todos los vectores y metadatos enviados a la región de tu clúster.

Resolución de problemas

Errores comunes y soluciones

La colección no existe / No encontrada

El servidor crea la colección en el primer almacenamiento solo si COLLECTION_NAME está configurada. Verifica la variable de entorno y reinicia el MCP.

Verificar: curl $QDRANT_URL/collections
Desajuste de dimensión vectorial

Cambiaste EMBEDDING_MODEL sin descartar la colección antigua. Descártala y comienza de nuevo (o usa un nuevo COLLECTION_NAME).

Verificar: curl $QDRANT_URL/collections/<name>
Conexión rechazada en localhost:6333

El contenedor de Qdrant no se está ejecutando. docker run -p 6333:6333 qdrant/qdrant e intenta de nuevo.

Verificar: curl localhost:6333/healthz
Las búsquedas devuelven resultados irrelevantes

Los fragmentos pueden ser demasiado grandes o el modelo de embedding demasiado débil. Intenta bge-small-en-v1.5 de FastEmbed y fragmentos ≤500 tokens.

Alternativas

Qdrant vs otros

AlternativaCuándo usarlaContrapartida
Chroma MCPPrefieres una BD vectorial integrada sin infraestructuraMenos de nivel producción que Qdrant para cargas pesadas
Pinecone MCPYa estás en Pinecone y quieres solo hospedadoDe pago desde el primer día; más opinado
Memory MCPQuieres memoria clave-valor ultra simple, no semánticaSin embeddings — solo recuperación exacta

Más

Recursos

📖 Lee el README oficial en GitHub

🐙 Ver issues abiertas

🔍 Ver todos los 400+ servidores MCP y Skills