/ الدليل / الملعب / mcp-local-rag
● مجتمع shinpr ⚡ فوري

mcp-local-rag

بواسطة shinpr · shinpr/mcp-local-rag

RAG خاص يعمل محليًا بالدرجة الأولى — فهرس ملفات PDF والمستندات والأكواس مرة واحدة، ثم ابحث دلاليًا من أي عميل MCP. بدون مفاتيح API، بدون سحابة، بدون بيانات تترك جهازك.

يعمل mcp-local-rag بالكامل بلا اتصال بعد تنزيل نموذج بحوالي 90 ميجابايت. استورد ملفات PDF/DOCX/TXT/MD/HTML أو سلاسل HTML خام، ثم استعلم باستخدام البحث الدلالي والكلماتي المدمجين. مثالي لقواعد المعرفة الشخصية والمستندات السرية والعمل أثناء الرحلات الجوية.

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

local-rag.replay ▶ جاهز
0/0

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-local-rag"
      ],
      "_inferred": true
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-local-rag"
      ],
      "_inferred": true
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-local-rag"
      ],
      "_inferred": true
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-local-rag"
      ],
      "_inferred": true
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "local-rag",
      "command": "npx",
      "args": [
        "-y",
        "mcp-local-rag"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json
{
  "context_servers": {
    "local-rag": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "mcp-local-rag"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add local-rag -- npx -y mcp-local-rag

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: mcp-local-rag

بناء RAG خاص فوق أوراقك البحثية وملفات PDF المحملة

👤 الباحثون والطلاب وعمال المعرفة ⏱ ~30 min beginner

متى تستخدمه: لديك مئات ملفات PDF في ~/Documents/papers وتريد استخدامها فعلاً — 'ماذا قالت تلك الورقة عن تضاؤل الانتباه؟'

المتطلبات الأساسية
  • ملفات PDF أو مستندات على القرص — أي مجلد من الملفات — يتم دعم الاستيراد العودي
الخطوات
  1. استورد المجلد
    استورد كل شيء في ~/Documents/papers إلى local-rag. تخطَّ الملفات الأكبر من 50 ميجابايت.✓ تم النسخ
    → سجل الاستيراد لكل ملف + ملخص 'تم فهرسة N ملف'
  2. اطرح الأسئلة
    عبر أوراقي، ماذا يقولون عن الترميز الموضعي في transformers ذات السياق الطويل؟ اذكر الملف المصدري والصفحة إن أمكن.✓ تم النسخ
    → إجابة مركبة مع اقتباسات الملف المصدري
  3. صقل البحث
    أعطني فقط أفضل 5 مقاطع الأكثر صلة بـ 'ring attention'، خام — لا تختصرها.✓ تم النسخ
    → قائمة المقاطع المصنفة

النتيجة: كل ورقة قمت بتحميلها في أي وقت هي الآن قابلة للاستعلام حسب الموضوع — ترقية دائمة لحياتك في القراءة.

المزالق
  • ملفات PDF الممسوحة ضوئيًا لا تحتوي على نص قابل للاستخراج — قم بتمرير OCR أولاً (ocrmypdf) قبل الاستيراد
  • الفهرس الأول لـ 1000+ ملف بطيء (تضمينات CPU) — اتركه يعمل طوال الليل؛ إعادة الاستيراد الإضافية سريعة
اجمعها مع: filesystem

الاستعلام عن العقود السرية / وثائق الموارد البشرية دون تسريب إلى أي سحابة

👤 العمليات القانونية والموارد البشرية والامتثال ⏱ ~20 min intermediate

متى تستخدمه: المستندات حساسة جدًا لتضمينات السحابة من OpenAI/Claude. تحتاج البحث لكن لا يمكنك إرسال المحتوى في أي مكان.

الخطوات
  1. استورد
    استورد /secure/contracts/*.pdf إلى local-rag.✓ تم النسخ
    → تم فهرسة الملفات محليًا؛ تأكد من عدم إجراء أي استدعاء شبكة
  2. الاستعلام
    أي العقود لها بند تجديد تلقائي أطول من 12 شهرًا؟✓ تم النسخ
    → قائمة العقود المرشحة مع البند المقتبس

النتيجة: مجموعة خاصة قابلة للبحث بدون شيء يترك الجهاز.

المزالق
  • الإجابات من Claude لا تزال تذهب إلى Anthropic — التضمينات محلية لكن الحوار لا — إذا كان يجب أن تكون الإجابات محلية أيضًا، فشغل مع LLM محلي عبر Ollama أو LM Studio بدلاً من Claude السحابي
اجمعها مع: filesystem

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

local-rag + filesystem

راقب مجلدًا، أعد استيراد الملفات عند تغييرها

في كل مرة يتغير ملف تحت ~/Notes، أعد استيراده إلى local-rag.✓ تم النسخ
local-rag + firecrawl

اكشط موقع docs ثم أرسله إلى local-rag للاستعلام بلا اتصال

اكشط docs.example.com، احفظ كل صفحة كـ Markdown، ثم استورد جميعها إلى local-rag.✓ تم النسخ
local-rag + playwright

التقط صفحات معروضة JS واستورد نصها المستخرج

افتح هذا SPA، احصل على HTML المعروض، ingest_data في local-rag مع URL كمصدر.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداةالمدخلاتمتى تستدعيهاالتكلفة
ingest_file path: str | path[] أضف ملف أو أكثر إلى الفهرس CPU only
ingest_data html: str, source_url?: str أضف كتلة HTML خام — مفيدة بعد الكشط CPU only
query_documents query: str, top_k?: int استدعاء الاسترجاع الرئيسي — استخدم قبل الإجابة على أسئلة المستخدم free
list_files انظر ما هو مفهرس free
delete_file path: str إزالة ملف قديم/غير ذي صلة من الفهرس free
status فحص معقول لحجم الفهرس free

التكلفة والحدود

تكلفة التشغيل

حصة API
لا توجد حصة — كل شيء محلي
الرموز لكل استدعاء
نتائج الاستعلام 500-3000 رمز حسب top_k
التكلفة المالية
مجاني. تحميل نموذج لمرة واحدة حوالي 90 ميجابايت.
نصيحة
اضبط top_k على 5-8 لمعظم الأسئلة؛ الذهاب إلى الأعلى يهدر الرموز دون تحسين الإجابات.

الأمان

الصلاحيات والأسرار ونطاق الأثر

تخزين بيانات الاعتماد: لا شيء — لا توجد مفاتيح API
نقل البيانات الخارجي: صفر بعد تنزيل النموذج. مستنداتك لا تترك الجهاز أبدًا.

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

First query is slow / seems to hang

نموذج التضمين يتم تنزيله عند التشغيل الأول (~90MB). الاستدعاءات اللاحقة سريعة.

تحقق: تحقق من ~/.cache/mcp-local-rag للملف النموذجي
PDF ingest returns 0 chunks

PDF محتمل أن يكون ممسوحًا ضوئيًا (صور فقط). شغل ocrmypdf input.pdf output.pdf أولاً.

تحقق: pdftotext input.pdf -
Results feel irrelevant

يكافح البحث الدلالي البحت مع الاستعلامات القصيرة. أضف كلمات رئيسية أكثر. البحث الهجين يعززها بالفعل.

Out of memory on large PDFs

قسّم PDF أولاً، أو زد كومة Node: NODE_OPTIONS=--max-old-space-size=8192

البدائل

mcp-local-rag مقابل البدائل

البديلمتى تستخدمهاالمقايضة
Chroma MCP / Qdrant MCPتريد قاعدة بيانات متجهات حقيقية مع متعدد المستخدمين والقياس وفلاتر البيانات الوصفيةإعداد أكثر، عادة ما يتطلب خادمًا قيد التشغيل
OpenAI Assistants file_searchأنت موافق على إرسال المستندات إلى سحابة OpenAIليس محليًا، يكلف لكل رمز، لكن إعداد صفري وأكثر دقة
ChatGPT Projects / Claude Projects file uploadمجموعة مستندات صغيرة (<20 ملف) وتستخدم الدردشة المستضافةليس MCP؛ لا يمكن أن يكون نصًا برمجيًا

المزيد

الموارد

📖 اقرأ ملف README الرسمي على GitHub

🐙 تصفح القضايا المفتوحة

🔍 تصفح أكثر من 400 خادم MCP و Skills