web-eval-agent MCP — التثبيت & عرض مباشر

لماذا تستخدمه

الميزات الأساسية

اوصف الاختبارات باللغة الإنجليزية البسيطة، لا باستخدام المحددات والتأكيدات
يلتقط لقطات الشاشة وأخطاء وحركة المرور
setup_browser_state يحفظ حالة المصادقة لكي تتمكن الاختبارات من التشغيل خلف بوابة المصادقة
يعمل في Cursor وClaude والوكلاء البرمجية المشابهة

عرض مباشر

كيف يبدو في الممارسة

web-eval-agent.replay ▶ جاهز

0/0

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "web-eval-agent": {
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ],
      "_inferred": true
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "web-eval-agent": {
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ],
      "_inferred": true
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "web-eval-agent": {
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ],
      "_inferred": true
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "web-eval-agent": {
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ],
      "_inferred": true
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "web-eval-agent",
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json

{
  "context_servers": {
    "web-eval-agent": {
      "command": {
        "path": "uvx",
        "args": [
          "web-eval-agent"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add web-eval-agent -- uvx web-eval-agent

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: web-eval-agent

اختبار دخان لنشر الويب باستخدام web-eval-agent

👤 المطورون الفرديون والفرق الصغيرة التي لا تملك مجموعة Playwright ⏱ ~10 min beginner

متى تستخدمه: نشرت التحديث وتريد فحصًا سريعًا لـ 'هل كسرت شيئًا واضحًا؟'

المتطلبات الأساسية

مفتاح API مجاني من operative.sh/mcp — سجل حسابًا، انسخ المفتاح
تبعيات Playwright — npx playwright install (سيطالبك MCP إذا كانت مفقودة)

الخطوات

اوصف الاختبار

على staging.example.com، تحقق من أن بإمكاني: التسجيل برسالة بريد إلكترونية جديدة وإنشاء مشروع والخروج. أبلغ عن ما يفشل.✓ تم النسخ

→ نجاح/فشل مع لقطات الشاشة
احفر في الفشل

بالنسبة للخطوة الفاشلة، أظهر أخطاء وحركة المرور التي أرجعت 500.✓ تم النسخ

→ دليل على مستوى الكود

النتيجة: الثقة من سلامة النشر في دقيقتين.

المزالق

حسابات الاختبار تلوث قاعدة البيانات الإنتاجية — قم دائمًا بالتشغيل ضد staging؛ إذا كان إنتاجيًا، استخدم حسابًا متخصصًا لـ QA وقم بالتنظيف

اجمعها مع: sentry

تقييم تجربة المستخدم الاستكشافي لسير عمل جديد

👤 المصممون ومديرو المنتجات ⏱ ~20 min intermediate

متى تستخدمه: تريد وجهة نظر خارجية حول سير عمل دون جدولة اختبارات المستخدم.

الخطوات

اوصف نية المستخدم، لا الخطوات

كمستخدم جديد، حاول مشاركة مشروع مع زميل. لاحظ كل نقطة احتكاك.✓ تم النسخ

→ نقد تجربة مستخدم حر مع لقطات شاشة لكل التباس
قارن مع المسار السعيد

الآن قم بنفس سير العمل كمستخدم متقدم يعرف الواجهة. كم مرة أسرع؟ ما الذي ارتبك من المبتدئ وليس الخبير؟✓ تم النسخ

→ خريطة احتكاك مقارنة

النتيجة: ملاحظات تجربة المستخدم السريعة قبل وضع المستخدمين الحقيقيين أمامها.

اختبار الميزات خلف تسجيل الدخول مع حفظ حالة المتصفح

👤 أي شخص يختبر سير عمل مصرح ⏱ ~15 min intermediate

متى تستخدمه: ميزتك تتطلب تسجيل دخول؛ لا تريد أن يتعامل الوكيل مع كلمة السر.

الخطوات

بدء الجلسة

استدعِ setup_browser_state لفتح https://app.example.com/login — سأقوم بتسجيل الدخول بنفسي.✓ تم النسخ

→ يفتح متصفح تفاعلي؛ تسجيل دخولك؛ حفظ الجلسة
قم بتشغيل الاختبار باستخدام الحالة المحفوظة

اختبر صفحة إعدادات الفواتير: حملها وتحقق من أن الخطة الحالية تظهر وحاول خفض الخطة.✓ تم النسخ

→ يعمل الاختبار مع جلستك المصرحة

النتيجة: اختبار مصرح دون مشاركة بيانات الاعتماد مع الوكيل.

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

web-eval-agent + sentry

قم بتشغيل تقييم، أي أخطاء جديدة تذهب إلى Sentry للمراجعة اللاحقة

قم بتشغيل تقييم التسجيل، ثم تحقق من Sentry للأخطاء الجديدة التي تم التقاطها خلال تلك النافذة.✓ تم النسخ

web-eval-agent + playwright

اختبر نموذجًا باستخدام web-eval-agent، قسّيه إلى Playwright للـ CI

حول اختبار web-eval-agent الذي يعمل إلى اختبار Playwright يمكنك تشغيله في CI.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداة	المدخلات	متى تستدعيها	التكلفة
web_eval_agent	url: str, task: str, headless_browser?: bool	أي اختبار ويب باللغة الطبيعية	LLM calls + browser time
setup_browser_state	url?: str	مرة واحدة لكل خدمة، لحفظ حالة تسجيل الدخول	0

التكلفة والحدود

تكلفة التشغيل

حصة API: الطبقة المجانية من operative.sh
الرموز لكل استدعاء: التقييم الكامل يمكن أن يكون 5-20k tokens (صور الشاشة الموصوفة)
التكلفة المالية: مجاني للحجم المنخفض
نصيحة: للاختبارات المتكررة، ارتقِ بها إلى Playwright؛ استخدم web-eval-agent للاستكشاف

الأمان

الصلاحيات والأسرار ونطاق الأثر

تخزين بيانات الاعتماد: مفتاح operative.sh API في متغير البيئة؛ حالة المتصفح محفوظة محليًا

نقل البيانات الخارجي: المواقع المستهدفة + operative.sh لتنسيق التقييم

المشروع الأصلي مؤرشف/متوقف؛ الفريق الآن في withrefresh.com. لا يزال يعمل لكن لا توقع ميزات جديدة.

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

Browser fails to launch

ثبت تبعيات Playwright: npx playwright install-deps

Session keeps expiring

بعض المواقع تدير ملفات تعريف الارتباط؛ أعد تشغيل setup_browser_state. أو استخدم storageState من Playwright للتحكم الأدق

Agent misunderstands the task

كن محددًا: URLs والمحددات أو النص المراد البحث عنه والنتائج المتوقعة

البدائل

web-eval-agent مقابل البدائل

البديل	متى تستخدمها	المقايضة
Playwright MCP	تريد اختبارات نصية وقابلة للتكرار	أنت تكتب الكود
Browserbase MCP	تحتاج متصفحات مستضافة على السحابة للـ CI	مدفوع لكل دقيقة

web-eval-agent

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

التثبيت

اختر العميل

حالات الاستخدام

استخدامات عملية: web-eval-agent

اختبار دخان لنشر الويب باستخدام web-eval-agent

المتطلبات الأساسية

الخطوات

المزالق

تقييم تجربة المستخدم الاستكشافي لسير عمل جديد

الخطوات

اختبار الميزات خلف تسجيل الدخول مع حفظ حالة المتصفح

الخطوات

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

الأدوات

ما يوفره هذا الـ MCP

التكلفة والحدود

تكلفة التشغيل

الأمان

الصلاحيات والأسرار ونطاق الأثر

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

البدائل

web-eval-agent مقابل البدائل

المزيد

الموارد