بناء RAG خاص فوق أوراقك البحثية وملفات PDF المحملة
متى تستخدمه: لديك مئات ملفات PDF في ~/Documents/papers وتريد استخدامها فعلاً — 'ماذا قالت تلك الورقة عن تضاؤل الانتباه؟'
المتطلبات الأساسية
- ملفات PDF أو مستندات على القرص — أي مجلد من الملفات — يتم دعم الاستيراد العودي
الخطوات
-
استورد المجلداستورد كل شيء في ~/Documents/papers إلى local-rag. تخطَّ الملفات الأكبر من 50 ميجابايت.✓ تم النسخ→ سجل الاستيراد لكل ملف + ملخص 'تم فهرسة N ملف'
-
اطرح الأسئلةعبر أوراقي، ماذا يقولون عن الترميز الموضعي في transformers ذات السياق الطويل؟ اذكر الملف المصدري والصفحة إن أمكن.✓ تم النسخ→ إجابة مركبة مع اقتباسات الملف المصدري
-
صقل البحثأعطني فقط أفضل 5 مقاطع الأكثر صلة بـ 'ring attention'، خام — لا تختصرها.✓ تم النسخ→ قائمة المقاطع المصنفة
النتيجة: كل ورقة قمت بتحميلها في أي وقت هي الآن قابلة للاستعلام حسب الموضوع — ترقية دائمة لحياتك في القراءة.
المزالق
- ملفات PDF الممسوحة ضوئيًا لا تحتوي على نص قابل للاستخراج — قم بتمرير OCR أولاً (ocrmypdf) قبل الاستيراد
- الفهرس الأول لـ 1000+ ملف بطيء (تضمينات CPU) — اتركه يعمل طوال الليل؛ إعادة الاستيراد الإضافية سريعة