نموذج Qwen الجديد من علي بابا يعزز أدوات النسخ الصوتي بالذكاء الاصطناعي
كتب -محمد شاهين

أعلنت شركة علي بابا عن إطلاق نموذج Qwen3-ASR-Flash، الذي يعد بمثابة نقلة نوعية في أدوات النسخ الصوتي بالذكاء الاصطناعي. تم بناء هذا النموذج على أساس الذكاء الاصطناعي القوي Qwen3-Omni، وتم تدريبه باستخدام مجموعة بيانات ضخمة تشمل عشرات الملايين من ساعات البيانات الصوتية، مما يجعله لا يقتصر على كونه نموذجًا تقليديًا للتعرف على الصوت.
أداء النموذج مقارنة بالمنافسين
أظهرت نتائج الاختبارات التي أجريت في أغسطس 2025 أن Qwen3-ASR-Flash حقق معدل خطأ قدره 3.97% في اختبار اللغة الصينية القياسية، متفوقًا على منافسيه مثل Gemini-2.5-Pro (8.98%) وGPT4o-Transcribe (15.72%). كما تمكن النموذج من التعامل بشكل جيد مع اللهجات الصينية، حيث سجل معدل خطأ بلغ 3.48% في هذه اللهجات، وحقق 3.81% في اللغة الإنجليزية.
القدرة على نسخ الأغاني
تعتبر قدرة Qwen3-ASR-Flash على نسخ كلمات الأغاني إنجازًا ملحوظًا، حيث سجل معدل خطأ قدره 4.51%. وعند إجراء اختبارات داخلية على الأغاني الكاملة، حقق نموذج Qwen3-ASR-Flash معدل خطأ بلغ 9.96%، وهو تحسن كبير مقارنةً بمعدل 32.79% لـ Gemini-2.5-Pro و58.59% لـ GPT4o-Transcribe.
ميزات مبتكرة
يقدم النموذج ميزات مبتكرة لأدوات النسخ الصوتي الجديدة، بما في ذلك إمكانية التخصيص وفقًا للسياق. يمكن للمستخدمين إدخال نص خلفي بأي صيغة تقريبًا للحصول على نتائج مخصصة، مما يلغي الحاجة إلى معالجة معلومات السياق بشكل معقد.
دعم اللغات
يطمح نموذج Qwen3-ASR-Flash ليصبح أداة نسخ صوتي عالمية، حيث يدعم 11 لغة مع العديد من اللهجات. تشمل اللغات المدعومة الصينية بجميع لهجاتها، بالإضافة إلى الإنجليزية بكل من اللهجات البريطانية والأمريكية، وكذلك لغات أخرى مثل الفرنسية والألمانية والإسبانية والإيطالية والبرتغالية والروسية واليابانية والكورية والعربية.
يمثل نموذج Qwen3-ASR-Flash من علي بابا خطوة هامة نحو تحسين أدوات النسخ الصوتي بالذكاء الاصطناعي، مما يفتح آفاقًا جديدة للمستخدمين في مختلف المجالات. مع دقته العالية ودعمه للغات متعددة، من المتوقع أن يكون لهذا النموذج تأثير كبير على صناعة النسخ الصوتي.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.







