/ الدليل / الملعب / pdf-reader-mcp
● مجتمع SylphxAI ⚡ فوري

pdf-reader-mcp

بواسطة SylphxAI · SylphxAI/pdf-reader-mcp

أداة واحدة read_pdf تستخرج النص والصور والبيانات الوصفية من ملفات PDF محلية أو بعيدة بسرعة أكبر 5-10 مرات عبر معالجة الصفحات بالتوازي.

pdf-reader-mcp (SylphxAI) هو MCP قائم على Node.js متخصص يوفر أداة واحدة تتعامل مع جميع عمليات استخراج PDF. يستخدم PDF.js مع عمال صفحات متوازية والحفاظ على تخطيط إحداثيات Y. يدعم المسارات المحلية وعناوين HTTP/HTTPS. غطاء الاختبار بنسبة 94% يجعله أكثر أماناً لأنابيب الإنتاج.

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

pdf-reader.replay ▶ جاهز
0/0

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "pdf-reader": {
      "command": "npx",
      "args": [
        "-y",
        "pdf-reader-mcp"
      ],
      "_inferred": true
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "pdf-reader": {
      "command": "npx",
      "args": [
        "-y",
        "pdf-reader-mcp"
      ],
      "_inferred": true
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "pdf-reader": {
      "command": "npx",
      "args": [
        "-y",
        "pdf-reader-mcp"
      ],
      "_inferred": true
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "pdf-reader": {
      "command": "npx",
      "args": [
        "-y",
        "pdf-reader-mcp"
      ],
      "_inferred": true
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "pdf-reader",
      "command": "npx",
      "args": [
        "-y",
        "pdf-reader-mcp"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json
{
  "context_servers": {
    "pdf-reader": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "pdf-reader-mcp"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add pdf-reader -- npx -y pdf-reader-mcp

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: pdf-reader-mcp

كيفية مراجعة عقد PDF مع Claude

👤 فريق العمليات القانونية، والمؤسسون، ومديرو المنتجات ⏱ ~20 min beginner

متى تستخدمه: تحتاج إلى فهم محتوى عقد مكون من 50 صفحة وتحديد البنود غير العادية.

الخطوات
  1. قراءة ملف PDF كاملاً
    استخدم read_pdf على ./contracts/msa-acme.pdf. استخرج النص والبيانات الوصفية.✓ تم النسخ
    → النص الكامل + البيانات الوصفية للمؤلف/العنوان/التاريخ
  2. اطلب ملخصاً منظماً
    ملخص: الأطراف، المدة، شروط الدفع، الملكية الفكرية، الإنهاء، البنود غير العادية. اقتبس البند الدقيق لكل واحد.✓ تم النسخ
    → ملخص منظم مع اقتباسات
  3. مراجعة الأعلام الحمراء
    مقارنة بـ MSA SaaS القياسي، ما البنود غير العادية أو المحفوفة بالمخاطر؟ اذكر أرقام الصفحات.✓ تم النسخ
    → قائمة مرتبة حسب الأولوية بالأشياء القابلة للتفاوض

النتيجة: مراجعة مدتها 15 دقيقة بدلاً من ساعتين — مع اقتباسات.

المزالق
  • ملفات PDF الممسوحة ضوئياً تُرجع نصاً فارغاً — يحتاج pdf-reader إلى طبقة نصية؛ شغّل ocrmypdf input.pdf output.pdf أولاً

تجميع مجلد من أبحاث PDFs في جدول ملخص

👤 المحللون، الباحثون ⏱ ~15 min beginner

متى تستخدمه: قمت بتحميل 30 ورقة بيضاء وتحتاج إلى طبقة مسح سريع قبل تقرير ما تقرأ بعمق.

الخطوات
  1. سرد ملفات PDF
    سرد جميع ملفات PDF في ./papers/. لكل واحد، استخرج العنوان والملخص.✓ تم النسخ
    → الجدول: اسم الملف، العنوان، الملخص
  2. تصنيف وترتيب
    صنف كل ورقة إلى [ذات صلة / عرضية / تخطي]. أعطِ سبباً بسطر واحد.✓ تم النسخ
    → قائمة القراءة المرتبة حسب الأولوية

النتيجة: ترتيب القراءة بناءً على المحتوى، وليس اسم الملف.

اجمعها مع: filesystem

استخراج البيانات المنظمة من فواتير PDF

👤 فريق المالية وفريق الحسابات الدائنة ⏱ ~20 min intermediate

متى تستخدمه: تستقبل فواتير PDF وتريدها كملف CSV أو JSON لدفاترك.

الخطوات
  1. الاستخراج لكل فاتورة
    لكل ملف PDF في ./inbox/، استخرج: المورّد، رقم الفاتورة، التاريخ، الإجمالي، line_items[]. أرجع كمصفوفة JSON.✓ تم النسخ
    → JSON منظم لكل فاتورة
  2. تحديد الشذوذ
    حدد أي فواتير بإجماليات > 10000$ أو مع عناصر أسطر لا تضيف✓ تم النسخ
    → قائمة المراجعة

النتيجة: فرز آلي للحسابات الدائنة مع تدخل بشري للأعلام.

اجمعها مع: google-sheets

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

pdf-reader + filesystem

التكرار على مجلد PDF، كتابة الملخصات جنباً إلى جنب

لكل ملف PDF في ./papers/، اكتب ملخصاً .md مقابلاً في نفس المجلد.✓ تم النسخ
pdf-reader + google-sheets

بيانات الفاتورة مباشرة إلى دفتر أوراق Google

استخرج الفواتير من ./inbox/*.pdf وأضف صف واحد لكل فاتورة إلى ورقة 'AP' الخاصة بي.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداةالمدخلاتمتى تستدعيهاالتكلفة
read_pdf path: str (local or URL), options?: { pages?, include_images?, include_metadata? } أي استيراد PDF — تتعامل أداة واحدة مع جميع العمليات Local CPU only

التكلفة والحدود

تكلفة التشغيل

حصة API
لا توجد — تعمل محلياً
الرموز لكل استدعاء
المستند المكون من 50 صفحة يحتوي على 20 ألف - 100 ألف رمز
التكلفة المالية
مجاني
نصيحة
استخدم خيار pages لتحديد الاستخراج على أول N صفحة عند النماذج الأولية

الأمان

الصلاحيات والأسرار ونطاق الأثر

تخزين بيانات الاعتماد: لا يوجد
نقل البيانات الخارجي: فقط عند إعطائها عناوين HTTP؛ المسارات المحلية تبقى محلية

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

Empty text from a valid PDF

ملف PDF يحتوي على صور فقط. شغّل OCR أولاً: ocrmypdf in.pdf out.pdf، ثم اقرأ

تحقق: تحقق من البيانات الوصفية؛ إذا قال `producer` 'Scanner'، فهو مصور
Out-of-memory on huge PDFs

مرر pages: [1, 50] للتقسيم؛ عالج في نطاقات

Garbled text / wrong reading order

بعض ملفات PDF تستخدم تخطيطات غير قياسية. حاول تعطيل الحفاظ على التخطيط للحصول على ترتيب البث الخام

البدائل

pdf-reader-mcp مقابل البدائل

البديلمتى تستخدمهاالمقايضة
mcp-server-pdf (بسيط)الحد الأدنى من الاعتماديات، موافق على أبطأ أحادي الخيطأبطأ بكثير على المستندات الكبيرة
LlamaParse APIتحتاج إلى فهم تخطيط من درجة LLM للنماذج/الجداول المعقدةمدفوع، سحابي، أفضل على المستندات الفوضوية

المزيد

الموارد

📖 اقرأ ملف README الرسمي على GitHub

🐙 تصفح القضايا المفتوحة

🔍 تصفح أكثر من 400 خادم MCP و Skills