VoiceMode MCP — التثبيت & عرض مباشر

لماذا تستخدمه

الميزات الأساسية

خيار Whisper المحلي — لا صوت سحابي
خلفيات TTS متعددة: OpenAI وElevenLabs وCoqui المحلي
وضع الضغط للحديث أو التفعيل الصوتي
يبث الردود الجزئية لتسمع Claude وهو يُفكّر
يعمل في الطرفية بجانب Claude Code CLI

عرض مباشر

كيف يبدو في الممارسة

voicemode-mcp.replay ▶ جاهز

0/0

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "voicemode-mcp": {
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "voicemode-mcp": {
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "voicemode-mcp": {
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "voicemode-mcp": {
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "voicemode-mcp",
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json

{
  "context_servers": {
    "voicemode-mcp": {
      "command": {
        "path": "uvx",
        "args": [
          "voice-mode"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add voicemode-mcp -- uvx voice-mode

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: VoiceMode

أدر جلسة Claude Code حرّة اليدين أثناء القراءة على شاشة أخرى

👤 المطورون الذين يقرؤون المستندات أو التصاميم على شاشة أثناء البرمجة ⏱ ~30 min intermediate

متى تستخدمه: تقرأ وثيقة تصميم وتريد إملاء التغييرات دون الانتقال بين النوافذ.

المتطلبات الأساسية

ميكروفون + مكبرات صوت — إعداد صوت النظام — اختبر بـ say "hello" أو ما يعادله
نموذج Whisper جاهز — voice-mode install-whisper يُحمّل النموذج المحلي

الخطوات

ابدأ الصوت

استخدم voicemode. استمع للـ prompts وتحدّث بالردود. كرّر بعدي: «جاهز»✓ تم النسخ

→ TTS يُشغّل «جاهز»
إملاء تغيير

[منطوق] حدّث src/auth.ts — استخدم bcrypt بدلًا من SHA256 المجرد لكلمات المرور.✓ تم النسخ

→ التفريغ صحيح؛ التغيير مُطبَّق؛ TTS يؤكد
المراجعة

[منطوق] اقرأ لي الـ diff.✓ تم النسخ

→ TTS يقرأ الـ diff على دُفعات قابلة للإيقاف

النتيجة: جلسة عمل كاملة دون مغادرة يديك لما كانتا عليه.

المزالق

TTS يتحدث فوق prompts-ك — فعّل وضع الضغط للحديث أو كلمة تنبيه

اجمعها مع: filesystem

اكتب الكود بالصوت للوصول أو التعافي من RSI

👤 المطورون المصابون بـ RSI أو ضعاف البصر أو من يفضلون الإدخال الصوتي ⏱ ~60 min intermediate

متى تستخدمه: لا يمكنك الكتابة فترةً وتحتاج الاستمرار في الشحن.

المتطلبات الأساسية

ضجيج محيط مقبول — غرفة هادئة؛ ميكروفون سماعة الرأس أفضل من ميكروفون اللابتوب

الخطوات

الخط الأساسي

[منطوق] استخدم voicemode. اقرأ آخر git diff بصوت عالٍ، مع وقفة بين الملفات.✓ تم النسخ

→ قراءة TTS واضحة
سير العمل

[منطوق] أعد هيكلة نموذج المستخدم في src/models/user.ts. انقل تجزئة كلمة المرور إلى method. أرني الخطة أولًا.✓ تم النسخ

→ الخطة منطوقة؛ يُطلب تأكيد قبل التغييرات

النتيجة: جلسة برمجة كاملة بلا إدخال لوحة مفاتيح.

المزالق

TTS ينطق رموز الكود بشكل خاطئ — اضبط قاموس فونيمات TTS لمصطلحات البرمجة الشائعة

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

voicemode-mcp + filesystem

تغييرات الكود الملقاة صوتيًا تُحفَظ في المستودع

سأُملي التغييرات؛ طبّقها في الملفات بعد قراءة كل منها.✓ تم النسخ

voicemode-mcp + github

إملاء وصف PR بعد مراجعة الـ diff صوتيًا

اقرأ لي التغييرات المُدرجة، ثم افتح PR بوصف سأمليه.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداة	المدخلات	متى تستدعيها	التكلفة
start_listening	mode: "ptt"\|"vad"	ابدأ جلسة صوتية	free or OpenAI Whisper API
speak	text: str, voice?: str	في أي وقت يريد Claude إيصال شيء بصوت مسموع	TTS provider-dependent
transcribe_last	none	اجلب ما قاله المستخدم للتو	Whisper call
stop_listening	none	أنهِ الجلسة الصوتية	free

التكلفة والحدود

تكلفة التشغيل

حصة API: محلي: مجاني. OpenAI Whisper: 0.006 دولار/دقيقة. ElevenLabs TTS: ~0.30 دولار/1000 حرف.
الرموز لكل استدعاء: خطوط أنابيب الصوت لا تُكلَّف بالرموز مباشرةً
التكلفة المالية: مجاني مع المكدس المحلي؛ مُحاسَب مع مزودي السحابة
نصيحة: Whisper المحلي + Coqui TTS مجاني تمامًا لكن جودة أقل — ابدأ بالسحابة وتراجع لاحقًا

الأمان

الصلاحيات والأسرار ونطاق الأثر

الحد الأدنى من الصلاحيات: microphone speakers

تخزين بيانات الاعتماد: مفاتيح API للـ TTS/STT في متغيرات البيئة

نقل البيانات الخارجي: الصوت إلى مزود TTS/STT إن لم يكن محليًا

لا تستخدم STT سحابيًا في مكالمات تحتوي صوتًا سريًا ما لم تثق بسياسة الاحتفاظ لدى المزود

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

الميكروفون غير مكتشف

إذن صوت النظام — امنح الطرفية/Claude Code صلاحية الميكروفون

تحقق: `voice-mode test-mic` prints levels

TTS يبدو آليًا

الافتراضي Coqui المحلي — بدّل إلى OpenAI tts-1-hd عبر VOICE_MODE_TTS=openai

تأخر بين كلامي والرد

استخدم Whisper-tiny محليًا لـ STT؛ السحابة تُضيف 500ms+

البدائل

VoiceMode مقابل البدائل

البديل	متى تستخدمها	المقايضة
macOS Dictation + say command	تريد فقط صوت OS الأساسي	لا تكامل مع مخرجات Claude — في اتجاه واحد فقط
Superwhisper / Wispr Flow	تريد تطبيق إملاء macOS أصيل ومصقول	غير مُدمج مع MCP؛ لا تدفقات على مستوى الوكيل

VoiceMode

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

التثبيت

اختر العميل

حالات الاستخدام

استخدامات عملية: VoiceMode

أدر جلسة Claude Code حرّة اليدين أثناء القراءة على شاشة أخرى

المتطلبات الأساسية

الخطوات

المزالق

اكتب الكود بالصوت للوصول أو التعافي من RSI

المتطلبات الأساسية

الخطوات

المزالق

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

الأدوات

ما يوفره هذا الـ MCP

التكلفة والحدود

تكلفة التشغيل

الأمان

الصلاحيات والأسرار ونطاق الأثر

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

البدائل

VoiceMode مقابل البدائل

المزيد

الموارد