/ الدليل / الملعب / web-eval-agent
● مجتمع refreshdotdev ⚡ فوري

web-eval-agent

بواسطة refreshdotdev · refreshdotdev/web-eval-agent

اختبارات شاملة من البداية إلى النهاية باللغة الطبيعية لتطبيقات الويب — يقود الوكيل المتصفح ويلتقط أخطاء وحركة المرور ويوثق النتائج.

web-eval-agent (refreshdotdev) يتيح لك وصف مهمة المستخدم باللغة الإنجليزية البسيطة؛ يفتح MCP متصفحًا وينفذ سير العمل ويبلغ عن لقطات الشاشة وسجلات وحركة المرور. مفيد لاختبار التجربة الاستكشافي دون كتابة سكريبتات Playwright. ملاحظة: المشروع الأصلي متوقف — انتقل الفريق إلى withrefresh.com — لكن MCP يبقى يعمل بموجب رخصته الحالية.

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

web-eval-agent.replay ▶ جاهز
0/0

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "web-eval-agent": {
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ],
      "_inferred": true
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "web-eval-agent": {
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ],
      "_inferred": true
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "web-eval-agent": {
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ],
      "_inferred": true
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "web-eval-agent": {
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ],
      "_inferred": true
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "web-eval-agent",
      "command": "uvx",
      "args": [
        "web-eval-agent"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json
{
  "context_servers": {
    "web-eval-agent": {
      "command": {
        "path": "uvx",
        "args": [
          "web-eval-agent"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add web-eval-agent -- uvx web-eval-agent

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: web-eval-agent

اختبار دخان لنشر الويب باستخدام web-eval-agent

👤 المطورون الفرديون والفرق الصغيرة التي لا تملك مجموعة Playwright ⏱ ~10 min beginner

متى تستخدمه: نشرت التحديث وتريد فحصًا سريعًا لـ 'هل كسرت شيئًا واضحًا؟'

المتطلبات الأساسية
  • مفتاح API مجاني من operative.sh/mcp — سجل حسابًا، انسخ المفتاح
  • تبعيات Playwright — npx playwright install (سيطالبك MCP إذا كانت مفقودة)
الخطوات
  1. اوصف الاختبار
    على staging.example.com، تحقق من أن بإمكاني: التسجيل برسالة بريد إلكترونية جديدة وإنشاء مشروع والخروج. أبلغ عن ما يفشل.✓ تم النسخ
    → نجاح/فشل مع لقطات الشاشة
  2. احفر في الفشل
    بالنسبة للخطوة الفاشلة، أظهر أخطاء وحركة المرور التي أرجعت 500.✓ تم النسخ
    → دليل على مستوى الكود

النتيجة: الثقة من سلامة النشر في دقيقتين.

المزالق
  • حسابات الاختبار تلوث قاعدة البيانات الإنتاجية — قم دائمًا بالتشغيل ضد staging؛ إذا كان إنتاجيًا، استخدم حسابًا متخصصًا لـ QA وقم بالتنظيف
اجمعها مع: sentry

تقييم تجربة المستخدم الاستكشافي لسير عمل جديد

👤 المصممون ومديرو المنتجات ⏱ ~20 min intermediate

متى تستخدمه: تريد وجهة نظر خارجية حول سير عمل دون جدولة اختبارات المستخدم.

الخطوات
  1. اوصف نية المستخدم، لا الخطوات
    كمستخدم جديد، حاول مشاركة مشروع مع زميل. لاحظ كل نقطة احتكاك.✓ تم النسخ
    → نقد تجربة مستخدم حر مع لقطات شاشة لكل التباس
  2. قارن مع المسار السعيد
    الآن قم بنفس سير العمل كمستخدم متقدم يعرف الواجهة. كم مرة أسرع؟ ما الذي ارتبك من المبتدئ وليس الخبير؟✓ تم النسخ
    → خريطة احتكاك مقارنة

النتيجة: ملاحظات تجربة المستخدم السريعة قبل وضع المستخدمين الحقيقيين أمامها.

اختبار الميزات خلف تسجيل الدخول مع حفظ حالة المتصفح

👤 أي شخص يختبر سير عمل مصرح ⏱ ~15 min intermediate

متى تستخدمه: ميزتك تتطلب تسجيل دخول؛ لا تريد أن يتعامل الوكيل مع كلمة السر.

الخطوات
  1. بدء الجلسة
    استدعِ setup_browser_state لفتح https://app.example.com/login — سأقوم بتسجيل الدخول بنفسي.✓ تم النسخ
    → يفتح متصفح تفاعلي؛ تسجيل دخولك؛ حفظ الجلسة
  2. قم بتشغيل الاختبار باستخدام الحالة المحفوظة
    اختبر صفحة إعدادات الفواتير: حملها وتحقق من أن الخطة الحالية تظهر وحاول خفض الخطة.✓ تم النسخ
    → يعمل الاختبار مع جلستك المصرحة

النتيجة: اختبار مصرح دون مشاركة بيانات الاعتماد مع الوكيل.

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

web-eval-agent + sentry

قم بتشغيل تقييم، أي أخطاء جديدة تذهب إلى Sentry للمراجعة اللاحقة

قم بتشغيل تقييم التسجيل، ثم تحقق من Sentry للأخطاء الجديدة التي تم التقاطها خلال تلك النافذة.✓ تم النسخ
web-eval-agent + playwright

اختبر نموذجًا باستخدام web-eval-agent، قسّيه إلى Playwright للـ CI

حول اختبار web-eval-agent الذي يعمل إلى اختبار Playwright يمكنك تشغيله في CI.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداةالمدخلاتمتى تستدعيهاالتكلفة
web_eval_agent url: str, task: str, headless_browser?: bool أي اختبار ويب باللغة الطبيعية LLM calls + browser time
setup_browser_state url?: str مرة واحدة لكل خدمة، لحفظ حالة تسجيل الدخول 0

التكلفة والحدود

تكلفة التشغيل

حصة API
الطبقة المجانية من operative.sh
الرموز لكل استدعاء
التقييم الكامل يمكن أن يكون 5-20k tokens (صور الشاشة الموصوفة)
التكلفة المالية
مجاني للحجم المنخفض
نصيحة
للاختبارات المتكررة، ارتقِ بها إلى Playwright؛ استخدم web-eval-agent للاستكشاف

الأمان

الصلاحيات والأسرار ونطاق الأثر

تخزين بيانات الاعتماد: مفتاح operative.sh API في متغير البيئة؛ حالة المتصفح محفوظة محليًا
نقل البيانات الخارجي: المواقع المستهدفة + operative.sh لتنسيق التقييم

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

Browser fails to launch

ثبت تبعيات Playwright: npx playwright install-deps

Session keeps expiring

بعض المواقع تدير ملفات تعريف الارتباط؛ أعد تشغيل setup_browser_state. أو استخدم storageState من Playwright للتحكم الأدق

Agent misunderstands the task

كن محددًا: URLs والمحددات أو النص المراد البحث عنه والنتائج المتوقعة

البدائل

web-eval-agent مقابل البدائل

البديلمتى تستخدمهاالمقايضة
Playwright MCPتريد اختبارات نصية وقابلة للتكرارأنت تكتب الكود
Browserbase MCPتحتاج متصفحات مستضافة على السحابة للـ CIمدفوع لكل دقيقة

المزيد

الموارد

📖 اقرأ ملف README الرسمي على GitHub

🐙 تصفح القضايا المفتوحة

🔍 تصفح أكثر من 400 خادم MCP و Skills