/ الدليل / الملعب / VoiceMode
● مجتمع mbailey 🔑 يتطلب مفتاحك

VoiceMode

بواسطة mbailey · mbailey/voicemode

تحدّث إلى Claude Code واسمعه يرد — برمجة حرّة اليدين للتزاوج والوصول وجلسات التركيز.

يُضيف VoiceMode صوتًا ثنائيًا طبيعيًا لـ Claude Code عبر MCP. يستخدم Whisper لتحويل الصوت إلى نص (محليًا أو عبر API) وTTS قابل للإعداد (OpenAI أو ElevenLabs أو محلي). يُشغّل خط أنابيب صوت صغيرًا بجانب خادم MCP. الأفضل للـ prompts القصيرة وقراءات المراجعة، لا المونولوجات الطويلة.

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

voicemode-mcp.replay ▶ جاهز
0/0

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "voicemode-mcp": {
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "voicemode-mcp": {
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "voicemode-mcp": {
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "voicemode-mcp": {
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "voicemode-mcp",
      "command": "uvx",
      "args": [
        "voice-mode"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json
{
  "context_servers": {
    "voicemode-mcp": {
      "command": {
        "path": "uvx",
        "args": [
          "voice-mode"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add voicemode-mcp -- uvx voice-mode

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: VoiceMode

أدر جلسة Claude Code حرّة اليدين أثناء القراءة على شاشة أخرى

👤 المطورون الذين يقرؤون المستندات أو التصاميم على شاشة أثناء البرمجة ⏱ ~30 min intermediate

متى تستخدمه: تقرأ وثيقة تصميم وتريد إملاء التغييرات دون الانتقال بين النوافذ.

المتطلبات الأساسية
  • ميكروفون + مكبرات صوت — إعداد صوت النظام — اختبر بـ say "hello" أو ما يعادله
  • نموذج Whisper جاهزvoice-mode install-whisper يُحمّل النموذج المحلي
الخطوات
  1. ابدأ الصوت
    استخدم voicemode. استمع للـ prompts وتحدّث بالردود. كرّر بعدي: «جاهز»✓ تم النسخ
    → TTS يُشغّل «جاهز»
  2. إملاء تغيير
    [منطوق] حدّث src/auth.ts — استخدم bcrypt بدلًا من SHA256 المجرد لكلمات المرور.✓ تم النسخ
    → التفريغ صحيح؛ التغيير مُطبَّق؛ TTS يؤكد
  3. المراجعة
    [منطوق] اقرأ لي الـ diff.✓ تم النسخ
    → TTS يقرأ الـ diff على دُفعات قابلة للإيقاف

النتيجة: جلسة عمل كاملة دون مغادرة يديك لما كانتا عليه.

المزالق
  • TTS يتحدث فوق prompts-ك — فعّل وضع الضغط للحديث أو كلمة تنبيه
اجمعها مع: filesystem

اكتب الكود بالصوت للوصول أو التعافي من RSI

👤 المطورون المصابون بـ RSI أو ضعاف البصر أو من يفضلون الإدخال الصوتي ⏱ ~60 min intermediate

متى تستخدمه: لا يمكنك الكتابة فترةً وتحتاج الاستمرار في الشحن.

المتطلبات الأساسية
  • ضجيج محيط مقبول — غرفة هادئة؛ ميكروفون سماعة الرأس أفضل من ميكروفون اللابتوب
الخطوات
  1. الخط الأساسي
    [منطوق] استخدم voicemode. اقرأ آخر git diff بصوت عالٍ، مع وقفة بين الملفات.✓ تم النسخ
    → قراءة TTS واضحة
  2. سير العمل
    [منطوق] أعد هيكلة نموذج المستخدم في src/models/user.ts. انقل تجزئة كلمة المرور إلى method. أرني الخطة أولًا.✓ تم النسخ
    → الخطة منطوقة؛ يُطلب تأكيد قبل التغييرات

النتيجة: جلسة برمجة كاملة بلا إدخال لوحة مفاتيح.

المزالق
  • TTS ينطق رموز الكود بشكل خاطئ — اضبط قاموس فونيمات TTS لمصطلحات البرمجة الشائعة

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

voicemode-mcp + filesystem

تغييرات الكود الملقاة صوتيًا تُحفَظ في المستودع

سأُملي التغييرات؛ طبّقها في الملفات بعد قراءة كل منها.✓ تم النسخ
voicemode-mcp + github

إملاء وصف PR بعد مراجعة الـ diff صوتيًا

اقرأ لي التغييرات المُدرجة، ثم افتح PR بوصف سأمليه.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداةالمدخلاتمتى تستدعيهاالتكلفة
start_listening mode: "ptt"|"vad" ابدأ جلسة صوتية free or OpenAI Whisper API
speak text: str, voice?: str في أي وقت يريد Claude إيصال شيء بصوت مسموع TTS provider-dependent
transcribe_last none اجلب ما قاله المستخدم للتو Whisper call
stop_listening none أنهِ الجلسة الصوتية free

التكلفة والحدود

تكلفة التشغيل

حصة API
محلي: مجاني. OpenAI Whisper: 0.006 دولار/دقيقة. ElevenLabs TTS: ~0.30 دولار/1000 حرف.
الرموز لكل استدعاء
خطوط أنابيب الصوت لا تُكلَّف بالرموز مباشرةً
التكلفة المالية
مجاني مع المكدس المحلي؛ مُحاسَب مع مزودي السحابة
نصيحة
Whisper المحلي + Coqui TTS مجاني تمامًا لكن جودة أقل — ابدأ بالسحابة وتراجع لاحقًا

الأمان

الصلاحيات والأسرار ونطاق الأثر

الحد الأدنى من الصلاحيات: microphone speakers
تخزين بيانات الاعتماد: مفاتيح API للـ TTS/STT في متغيرات البيئة
نقل البيانات الخارجي: الصوت إلى مزود TTS/STT إن لم يكن محليًا

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

الميكروفون غير مكتشف

إذن صوت النظام — امنح الطرفية/Claude Code صلاحية الميكروفون

تحقق: `voice-mode test-mic` prints levels
TTS يبدو آليًا

الافتراضي Coqui المحلي — بدّل إلى OpenAI tts-1-hd عبر VOICE_MODE_TTS=openai

تأخر بين كلامي والرد

استخدم Whisper-tiny محليًا لـ STT؛ السحابة تُضيف 500ms+

البدائل

VoiceMode مقابل البدائل

البديلمتى تستخدمهاالمقايضة
macOS Dictation + say commandتريد فقط صوت OS الأساسيلا تكامل مع مخرجات Claude — في اتجاه واحد فقط
Superwhisper / Wispr Flowتريد تطبيق إملاء macOS أصيل ومصقولغير مُدمج مع MCP؛ لا تدفقات على مستوى الوكيل

المزيد

الموارد

📖 اقرأ ملف README الرسمي على GitHub

🐙 تصفح القضايا المفتوحة

🔍 تصفح أكثر من 400 خادم MCP و Skills