/ الدليل / الملعب / Jina AI
● رسمي jina-ai 🔑 يتطلب مفتاحك

Jina AI

بواسطة jina-ai · jina-ai/MCP

19 أداة لقراءة الويب والبحث (الويب، arXiv، SSRN، الصور)، وإعادة ترتيب، والتصنيف، واستخراج PDF — بنية Jina للذكاء الاصطناعي كـ MCP.

يكشف MCP الرسمي من Jina AI عن APIs القراءة والبحث والمعالجة. استخدمه لاستخراج markdown نظيف من أي URL، والبحث الأكاديمي عبر arXiv و SSRN، وإزالة التكرار من الصور والنصوص، وإعادة الترتيب، واستخراج الأشكال والجداول من PDF. الطبقة المجانية قابلة للاستخدام؛ مفتاح API يفتح حدود معدل أعلى.

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

jina.replay ▶ جاهز
0/0

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "jina": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "jina": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "jina": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "jina": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "jina",
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json
{
  "context_servers": {
    "jina": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "mcp-remote",
          "https://mcp.jina.ai/sse"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add jina -- npx -y mcp-remote https://mcp.jina.ai/sse

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: Jina AI

تلخيص أوراق arXiv الأخيرة حول موضوع ما

👤 الباحثون، مهندسو ML الحاليون ⏱ ~20 min intermediate

متى تستخدمه: تريد معرفة ما هو جديد على arXiv حول موضوعك دون قراءة 50 ملخصًا.

المتطلبات الأساسية
  • مفتاح Jina API اختياري — jina.ai → لوحة التحكم → مفتاح API (الطبقة المجانية تعمل للاستخدام الخفيف)
الخطوات
  1. ابحث في arXiv
    استخدم search_arxiv للعثور على أوراق من آخر 30 يومًا حول 'speculative decoding for LLM inference'. أعد أفضل 20.✓ تم النسخ
    → قائمة الأوراق مع العناوين والمؤلفين والملخصات
  2. أعد الترتيب حسب الصلة
    استخدم sort_by_relevance لإعادة ترتيب مقابل هذا الاستعلام: 'practical speedups in production inference, not pure research'. احتفظ بأفضل 8.✓ تم النسخ
    → قائمة معاد ترتيبها
  3. لخص كل واحد
    بالنسبة لأفضل 8، extract_pdf الورقة، لخص في 3 نقاط: المساهمة، الطريقة، الإسراع المبلغ عنه. الإخراج كجدول markdown.✓ تم النسخ
    → جدول ملخص جاهز للهضم

النتيجة: ملخص بحثي أسبوعي حول موضوعك في 10 دقائق.

المزالق
  • extract_pdf على كل نتيجة مكلفة — الأرصدة تتراكم — أعد الترتيب أولاً لقطع المرشحين، استخرج فقط أفضل N
اجمعها مع: notion

تحويل دفعة من عناوين URL إلى markdown نظيفة لـ RAG

👤 مهندسو الذكاء الاصطناعي الذين يبنون أنظمة الاسترجاع ⏱ ~15 min intermediate

متى تستخدمه: لديك قائمة عناوين URL للابتلاع. تريد markdown نظيفة، وليس HTML خام أو خط أنابيب parsing.

الخطوات
  1. اقرأ عناوين URL بالتوازي
    استخدم parallel_read_url على هذه القائمة [URLs]. أعد markdown لكل واحد مع URL الأصلية كمفتاح.✓ تم النسخ
    → Markdown لكل URL
  2. أزل التكرار من المتشابهات القريبة
    استخدم deduplicate_strings بتشابه 0.9 لإسقاط الصفحات المتشابهة القريبة (شائعة للمستندات المرآة).✓ تم النسخ
    → مجموعة معاد حسابها مع معرفات الصفحات المحذوفة
  3. احفظ على القرص
    احفظ كل واحد إلى ./knowledge/<slug>.md حيث يتم اشتقاق slug من مسار URL.✓ تم النسخ
    → ملفات Markdown جاهزة لخط أنابيب التضمين

النتيجة: مجموعة نظيفة لخطوة التضمين/الفهرسة، بدون كتابة أي رمز scraping.

المزالق
  • الصفحات المحمية بجدران أجر أو مصادقة JS تعيد فراغ/قمامة — تحقق من عينة من عناوين URL - إذا كان المحتوى رقيقًا، العودة إلى playwright لتدفقات المصادقة
اجمعها مع: filesystem · firecrawl

تصنيف دفعة من النصوص باستخدام تسميات مخصصة

👤 محللو البيانات، فرق النمو ⏱ ~15 min beginner

متى تستخدمه: لديك N عنصر نص حر (التذاكر والمراجعات واستجابات الاستطلاع) وتريد تصنيفها في تصنيفك.

الخطوات
  1. حدد التسميات
    تسمياتي: ['bug', 'feature_request', 'question', 'praise', 'other']. خذ عينة من أول 10 عناصر وتحقق من معقولية التسميات.✓ تم النسخ
    → تم التحقق من التسميات مقابل العينات
  2. تصنيف الدفعة
    استخدم classify_text على جميع العناصر بتلك التسميات. أعد {id, text, label, confidence}.✓ تم النسخ
    → مجموعة بيانات مصنفة
  3. راجع الثقة المنخفضة
    علم العناصر حيث الثقة < 0.6 للمراجعة اليدوية. ملخص: التوزيع والقيم الشاذة والتسميات المفقودة المحتملة.✓ تم النسخ
    → قائمة المراجعة + ملاحظات التصنيف

النتيجة: مجموعة بيانات مصنفة بدون ضبط مصنف أو كتابة رموز لكل عنصر.

المزالق
  • التسميات غامضة والمصنف يتردد في التعادل القريب — اجعل التسميات حصرية متبادلة؛ إذا امتدت العناصر عبر الفئات، اسمح بإخراج متعدد التسميات
اجمعها مع: filesystem

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

jina + notion

ملخص البحث الأسبوعي المنشور على Notion

ابحث في arXiv عن أوراق 'agentic RAG' الجديدة هذا الأسبوع. لخص كل واحد وأنشئ صفحة Notion في قاعدة بيانات Research Digest.✓ تم النسخ
jina + firecrawl

Jina للصفحات الفردية، Firecrawl للزحف الكامل — نفس إخراج markdown النظيف

بالنسبة لقائمة عناوين URL، استخدم parallel_read_url (Jina). بالنسبة لمواقع الوثائق الكاملة الثلاثة، استخدم Firecrawl crawl. دمج في دليل معرفة واحد.✓ تم النسخ
jina + filesystem

بناء قاعدة معرفة markdown محلية من قائمة القراءة

اقرأ كل URL في urls.txt، أزل التكرار، احفظ إلى ./knowledge/<hash>.md. اكتب فوقه فقط إذا تغير المحتوى.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداةالمدخلاتمتى تستدعيهاالتكلفة
search_web query, num_results? البحث العام على الويب credits per call
search_arxiv / search_ssrn / search_bibtex / search_images / search_jina_blog query البحث الموجه credits per call
parallel_search_web / parallel_search_arxiv / parallel_search_ssrn query[] البحث متعدد الاستعلامات في استدعاء واحد credits × N queries
read_url url استخراج المحتوى النظيف من أي URL credits per page
parallel_read_url url[] ابتلاع الصفحات الدفعي credits × N pages
capture_screenshot_url url لقطة شاشة بصرية لصفحة credits
sort_by_relevance documents, query أعد الترتيب بعد البحث للجودة credits
classify_text texts, labels التصنيف بدون إطلاق نار credits per text
deduplicate_strings / deduplicate_images items, threshold أزل المتشابهات القريبة من المجموعة credits
extract_pdf url or file احصل على محتوى منظم من ملفات PDF credits per PDF
expand_query / primer / guess_datetime_url utility مساعدون حول ضبط البحث credits (minor)

التكلفة والحدود

تكلفة التشغيل

حصة API
طبقة مجانية متاحة مع حدود معدل؛ الطبقات المدفوعة قابلة للتوسع
الرموز لكل استدعاء
الإخراج هو التكلفة الأكبر — ملفات PDF وإزالة التكرار يمكن أن تعود 10k+ رموز
التكلفة المالية
أرصدة Jina API، عادةً تُقاس لكل طلب. انظر jina.ai/pricing.
نصيحة
أعد الترتيب قبل الاستخراج — extract_pdf مكلف. نسخ read_url محليًا؛ معظم الصفحات لا تتغير يوميًا.

الأمان

الصلاحيات والأسرار ونطاق الأثر

تخزين بيانات الاعتماد: متغير بيئة JINA_API_KEY (اختياري للعديد من الأدوات، مطلوب للاستخدام الثقيل)
نقل البيانات الخارجي: جميع الاستدعاءات إلى api.jina.ai / r.jina.ai / s.jina.ai — الاستعلامات وعناوين URL مرئية لـ Jina

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

429 Too Many Requests

الطبقة المجانية لها حدود معدل منخفضة. أضف متغير بيئة JINA_API_KEY وقم بالترقية في jina.ai للحصول على سعة burst.

read_url returns empty markdown

قد تكون الصفحة محمية بجدران مصادقة أو محظورة بواسطة bot. حاول باستخدام User-Agent مختلف عبر خيارات الأداة، أو العودة إلى playwright/firecrawl.

classify_text assigns everything to 'other'

قد تكون تسمياتك ضيقة جدًا أو متشابهة جدًا. أضف وصف التسميات ('bug: user reports something broken') للحصول على دقة أفضل بدون إطلاق نار.

search_arxiv misses recent papers

قد يتأخر فهرس arXiv؛ تحقق من خلال بحث مباشر في arxiv.org. استخدم expand_query لتوسيع الشروط.

البدائل

Jina AI مقابل البدائل

البديلمتى تستخدمهاالمقايضة
Firecrawlتحتاج إلى زحف الموقع الكامل أو استخراج JSON-schemaموجهة للزحف؛ القوة الفائقة لـ Jina هي اتساع أدوات المعالجة خارج القراءة فقط
Exa Search MCPتريد بحث ويب دلالي/عصبي كواجهة أساسيةأقوى في الاسترجاع الدلالي؛ أضيق من مجموعة أدوات Jina
Brave Search MCPتريد فهرس بحث مستقل + خصوصيةالبحث فقط، بدون قارئ/إعادة ترتيب/تصنيف

المزيد

الموارد

📖 اقرأ ملف README الرسمي على GitHub

🐙 تصفح القضايا المفتوحة

🔍 تصفح أكثر من 400 خادم MCP و Skills