/ 目錄 / 演練場 / Qdrant
● 官方 qdrant 🔑 需要你的金鑰

Qdrant

作者 qdrant · qdrant/mcp-server-qdrant

賦予 Claude 持久的向量記憶——透過簡潔、有主見的 Qdrant MCP 儲存、回溯並語意搜尋文字。

官方 Qdrant MCP 將任何 Qdrant 實例(雲端或自架)轉化為簡單的語意記憶儲存庫,只需兩個工具:qdrant-storeqdrant-find。非常適合為 Agent 提供長期記憶、建立個人知識庫,或在不撰寫嵌入膠水程式碼的情況下快速打造 RAG 原型。

為什麼要用

核心特性

即時演示

實際使用效果

qdrant.replay ▶ 就緒
0/0

安裝

選擇你的客戶端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "qdrant": {
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  }
}

開啟 Claude Desktop → Settings → Developer → Edit Config。儲存後重啟應用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "qdrant": {
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  }
}

Cursor 使用與 Claude Desktop 相同的 mcpServers 格式。專案級設定優先於全域。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "qdrant": {
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  }
}

點擊 Cline 側欄中的 MCP Servers 圖示,然後選 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "qdrant": {
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  }
}

格式與 Claude Desktop 相同。重啟 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "qdrant",
      "command": "uvx",
      "args": [
        "mcp-server-qdrant"
      ]
    }
  ]
}

Continue 使用伺服器物件陣列,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "qdrant": {
      "command": {
        "path": "uvx",
        "args": [
          "mcp-server-qdrant"
        ]
      }
    }
  }
}

加入 context_servers。Zed 儲存後熱重載。

claude mcp add qdrant -- uvx mcp-server-qdrant

一行命令搞定。用 claude mcp list 驗證,claude mcp remove 移除。

使用場景

實戰用法: Qdrant

讓 Claude Agent 在跨對話間保有持久記憶

👤 正在打造個人助理或內部 Copilot 的開發者 ⏱ ~15 min beginner

何時使用: 您希望 Claude 在對話結束後仍能記住使用者偏好、過去的決策或進行中的專案。

前置條件
  • 運行中的 Qdrant(本機 Docker 或雲端) — docker run -p 6333:6333 qdrant/qdrant 或 Qdrant Cloud 叢集 URL + API 金鑰
  • 設定 COLLECTION_NAME 環境變數 — 任意字串,例如 claude_memory
步驟
  1. 讓它學會儲存重要事實
    每當我告訴你某個專案的重要資訊(截止日期、關係人、決策),請用 qdrant-store 儲存,中繼資料包含 {project, category}。✓ 已複製
    → Claude 開始對需要持久保存的事實回應「已儲存」
  2. 驗證回溯功能正常運作
    你記得關於 'atlas' 專案的哪些內容?請使用 qdrant-find,查詢語句類似 'project atlas decisions'。✓ 已複製
    → 相關的過去訊息連同分數一起回傳
  3. 整理並刪除過期記憶
    搜尋所有關於 'atlas' 專案、超過 90 天或標記為已過期的內容,並刪除這些條目。✓ 已複製
    → 列出已刪除項目並附確認訊息

結果: 一個真正記得您上週說過什麼的助理——依專案區分範圍,且可隨時整理清除。

注意事項
  • 儲存每一則訊息會使資料集膨脹,並降低回溯品質 — 只儲存明確的事實或決策,不儲存閒聊內容。將「是否儲存」的判斷邏輯寫入系統提示詞。
  • 切換嵌入模型後,Collection 以錯誤的向量維度建立 — Qdrant 會拒絕維度不符的向量——更換 EMBEDDING_MODEL 時,請刪除並重新建立 Collection。
搭配使用: filesystem · notion

對文件資料夾建立輕量 RAG

👤 想要 RAG 功能但不想依賴框架的開發者 ⏱ ~30 min intermediate

何時使用: 您有 50–5000 個 Markdown 檔案,想讓 Claude 基於這些檔案回答問題並附上引用來源。

前置條件
  • 磁碟上的 Markdown 文件 — 任何包含 .md 檔案的資料夾
步驟
  1. 切割文件並儲存
    讀取 /docs 下的所有 .md 檔案,以標題邊界切割成約 500 個 token 的段落。對每個段落呼叫 qdrant-store,儲存文字並附帶中繼資料 {source_path, heading}。✓ 已複製
    → N 個段落已儲存,每個章節一筆
  2. 以使用者問題進行查詢
    使用者問:「如何輪換 API 金鑰?」請用 qdrant-find 取得最相關的前 5 個段落,並在回答中引用 source_path。✓ 已複製
    → 回答中附有內嵌的 [source_path] 引用
  3. 評估檢索品質
    針對這 10 個評估問題 [列表],預期的 source_path 是否出現在前 5 名的檢索結果中?請回報 recall@5 分數。✓ 已複製
    → 可用於迭代改善的檢索品質分數

結果: 一個可運作的 RAG 流程,您可以調整段落大小和 k 值直到品質達到要求。

注意事項
  • 段落過大會稀釋嵌入向量,導致回溯品質下降 — 將段落控制在約 1000 個 token 以內;優先以標題分割,再以 token 數量作為備援條件
  • 更新文件時舊段落未被移除,導致回答過時 — 使用確定性的 point id(以 source_path+heading 的雜湊值),讓 upsert 取代而非重複寫入
搭配使用: filesystem · firecrawl

以語意方式對凌亂的工單、潛在客戶或 FAQ 去重

👤 手上有一份充滿近似重複項目 CSV 的維運團隊 ⏱ ~25 min intermediate

何時使用: 精確字串比對遺漏了「重設密碼」與「我要如何更改密碼」這類語意相近但字面不同的內容——您需要語意相似度比對。

步驟
  1. 將每個項目連同其列 ID 作為中繼資料一起儲存
    讀取 rows.csv,對每一列執行 qdrant-store,information=<text>,中繼資料 {row_id: <id>}。✓ 已複製
    → N 個資料點已儲存
  2. 依相似度分群
    對每一列查詢 qdrant-find,找出分數 > 0.85 的前 5 個相鄰項目,輸出互相接近的 row_id 群組。✓ 已複製
    → 重複群組已列印輸出
  3. 選出正規項並標記其餘為重複
    對每個群組,選取內容最長、最具資訊量的列作為正規項,輸出 CSV 格式 {row_id, canonical_id}。✓ 已複製
    → 去重對應表已備妥,可套用至來源系統

結果: 一份附有信賴分數的去重對應 CSV,可供人工審核後再實際套用。

注意事項
  • 相似度閾值因領域而異——0.85 可能過於寬鬆或嚴格 — 先手動標記 20 組配對,再選出最能區分重複與非重複的閾值
搭配使用: postgres · filesystem

可搜尋的會議記錄記憶庫

👤 被 Notion/Obsidian 筆記淹沒的主管或個人貢獻者 ⏱ ~20 min beginner

何時使用: 您每週都在做記錄,卻永遠找不到當時做出某個決策的那份記錄。

前置條件
  • 會議記錄的資料夾 — 任何文字或 Markdown 檔案
步驟
  1. 為現有記錄建立索引
    遍歷 /meetings/**/*.md,對每份記錄執行 qdrant-store,儲存內文並附帶中繼資料 {date, attendees, project}。✓ 已複製
    → 所有記錄連同日期已建立索引
  2. 回溯決策
    找出所有討論過「企業方案定價」的記錄,顯示日期及每份記錄的 2 行摘要。✓ 已複製
    → 依相關性排序的會議配對清單
  3. 保持索引更新
    新增今天的記錄 <貼上內容>,然後告訴我哪些過去的記錄最可能與今天的決策相矛盾或有所更新。✓ 已複製
    → 透過語意相鄰比對進行的矛盾檢查

結果: 建立在您的筆記上、可每週持續更新的語意索引。

注意事項
  • 將個人與工作筆記混在同一個 Collection 中會造成範圍洩漏 — 使用獨立的 Collection,或在每次查找時強制套用 scope 中繼資料過濾條件
搭配使用: filesystem · notion

組合

與其他 MCP 搭配,撬動十倍槓桿

qdrant + filesystem

為本機文件資料夾建立索引,再以引用來源回答問題

將 /docs 下的所有 .md 檔案建立索引到 Qdrant,然後回答:「我們的認證流程是如何運作的?」並附上原始檔案路徑的引用。✓ 已複製
qdrant + firecrawl

爬取網站並建立可搜尋的知識庫

用 Firecrawl 爬取 docs.mycompany.com,將每個頁面儲存至 Qdrant Collection company_docs✓ 已複製
qdrant + postgres

對關聯式資料庫中的非結構化欄位進行語意搜尋

SELECT id, body FROM support_tickets(過去 30 天內建立的),將每筆 body 嵌入 Qdrant 並附帶中繼資料 {ticket_id},然後讓我依語意含義搜尋這些工單。✓ 已複製

工具

此 MCP 暴露的能力

工具輸入參數何時呼叫成本
qdrant-store information: str, metadata?: object 將一個事實、段落或筆記持久化,供日後語意回溯使用 free (local embedding)
qdrant-find query: str, limit?: int 取得語意相似的條目,用於回答問題或執行去重 free

成本與限制

運行它的成本

API 配額
自架版:無限制。Qdrant Cloud:取決於叢集大小。
每次呼叫 Token 數
Store:每次呼叫約 100 個 token 的額外開銷。Find:約 200 個 token 加上結果酬載。
費用
自架版免費。Qdrant Cloud 免費方案:1GB 叢集。付費方案從約 $25/mo 起。
提示
開發階段先用本機 Docker;只有在需要持久化與多裝置存取時,再升級至 Cloud。

安全

權限、密鑰、影響範圍

憑證儲存: QDRANT_URL 及選用的 QDRANT_API_KEY 儲存於環境變數中
資料出站: 自架版:無外部傳輸。Qdrant Cloud:所有向量與中繼資料會傳送至您的叢集所在區域。

故障排查

常見錯誤與修復

Collection does not exist / Not found

伺服器只有在設定 COLLECTION_NAME 的情況下,才會在第一次儲存時自動建立 Collection。請確認環境變數是否正確設定並重新啟動 MCP。

驗證: curl $QDRANT_URL/collections
Vector dimension mismatch

您在未刪除舊 Collection 的情況下更換了 EMBEDDING_MODEL。請刪除舊 Collection 並重新開始(或使用新的 COLLECTION_NAME)。

驗證: curl $QDRANT_URL/collections/<name>
Connection refused on localhost:6333

Qdrant 容器尚未運行。請執行 docker run -p 6333:6333 qdrant/qdrant 後重試。

驗證: curl localhost:6333/healthz
Searches return irrelevant results

段落可能過大,或嵌入模型能力不足。請嘗試 FastEmbed 的 bge-small-en-v1.5,並將段落控制在 ≤500 個 token。

替代方案

Qdrant 對比其他方案

替代方案何時用它替代權衡
Chroma MCP您偏好零基礎設施的嵌入式向量資料庫在高負載的正式環境場景下,穩定性不如 Qdrant
Pinecone MCP您已在使用 Pinecone,且希望採用純雲端託管方案從第一天起就需付費;產品主張較為強硬
Memory MCP您只需要超簡單的鍵值記憶,不需要語意功能無嵌入向量——只支援精確回溯

更多

資源

📖 閱讀 GitHub 上的官方 README

🐙 查看未解決的 issue

🔍 瀏覽全部 400+ MCP 伺服器和 Skills