فرض حصص الرموز لكل فريق عبر نشرات Azure OpenAI
متى تستخدمه: يشارك عدة فرق منتجات في AOAI؛ لا يجب أن تحرق حلقة الفريق الواحد المجنونة ميزانية TPM المشتركة.
المتطلبات الأساسية
- مثيل APIM مع تطبيق أنماط AI-Gateway — نشر البنية المرجعية من مستودع Azure-Samples/AI-Gateway
- مفتاح اشتراك APIM لكل فريق — يحصل كل فريق على اشتراك APIM متميز (مفتاح) يتم تضمينه في رأس Ocp-Apim-Subscription-Key
الخطوات
-
مراجعة الحصص الحاليةاسرد اشتراكات APIM مع حصصها الحالية من TPM و RPM لمنتج AOAI.✓ تم النسخ→ جدول الحصص حسب الفريق
-
تقليل الفريق الصاخبفريق 'النمو' في حرق 90% من TPM يوميًا. قلل حصتهم من 200 ألف → 100 ألف TPM. اترك الآخرين دون تغيير.✓ تم النسخ→ تم تحديث الحصة؛ تأكيد
-
المراقبة بعد التغييرعلى مدار الساعة التالية، اسحب عدد 429 (معدل محدود) لكل اشتراك. تأكد من أن النمو يجري تشكيله لكن لا تتأثر فرق المنتج الحرجة.✓ تم النسخ→ الإنفاذ مرئي في المقاييس
النتيجة: إنفاق AOAI مشترك خاضع للرقابة دون إلحاق الضرر بحركة المرور الشرعية ذات الأولوية العالية.
المزالق
- تعيين حصص منخفضة جدًا يحرم أحمال العمل الشرعية — قم بالنشر في وضع الظل أولاً (السجل فقط)، ثم افرض بعد فهم الأنماط الحقيقية