
تسعى شركة NVIDIA إلى معالجة مشكلة عدم شمول الذكاء الاصطناعي للعديد من اللغات، حيث لا يعمل هذا المجال إلا في نسبة صغيرة من اللغات العالمية التي تصل إلى 7000 لغة، مما يترك جزءًا كبيرًا من السكان العالميين خارج دائرة الاستفادة. تهدف NVIDIA إلى تصحيح هذا الخلل الواضح، خاصة في أوروبا.
أدوات مفتوحة المصدر جديدة
أطلقت الشركة مجموعة قوية من الأدوات المفتوحة المصدر لتمكين المطورين من بناء تقنيات الذكاء الاصطناعي الصوتية عالية الجودة لـ 25 لغة أوروبية مختلفة. تشمل هذه اللغات الرئيسية، بالإضافة إلى تقديم فرصة للغات التي غالبًا ما تُهمل من قبل الشركات الكبرى، مثل الكرواتية والإستونية والمالطية.
أهداف المبادرة
تسعى هذه المبادرة إلى تمكين المطورين من إنشاء أدوات تعتمد على الصوت، مثل الدردشة متعددة اللغات التي تفهم المستخدمين، وبوتات خدمة العملاء، وخدمات الترجمة التي تعمل بسرعة البرق.
المكتبة الضخمة Granary
تتميز هذه المبادرة بمكتبة Granary، التي تحتوي على حوالي مليون ساعة من الصوت البشري، تم تنظيمها لمساعدة الذكاء الاصطناعي على فهم تفاصيل التعرف على الكلام والترجمة.
نماذج ذكاء اصطناعي جديدة
لتسهيل استخدام بيانات الصوت، تقدم NVIDIA نموذجين جديدين مصممين لمهام اللغة:
Canary-1b-v2: نموذج كبير يتمتع بدقة عالية في مهام النسخ والترجمة المعقدة.
Parakeet-tdt-0.6b-v3: مصمم للتطبيقات الفورية حيث تكون السرعة هي كل شيء.
الابتكار في جمع البيانات
تعتبر الطريقة التي تم بها إنشاء هذه البيانات سحرًا حقيقيًا. فقد تعاون فريق الذكاء الاصطناعي الصوتي من NVIDIA مع باحثين من جامعة كارنيجي ميلون ومؤسسة برونو كيسلر لبناء خط أنابيب آلي. باستخدام مجموعة أدوات NeMo الخاصة بهم، استطاعوا تحويل الصوت الخام غير المعنون إلى بيانات منظمة وعالية الجودة يمكن للذكاء الاصطناعي التعلم منها.
نتائج مذهلة
توصل الفريق إلى أن بيانات Granary فعالة للغاية، حيث تحتاج إلى نصف الكمية المطلوبة من البيانات للوصول إلى مستوى دقة مستهدف مقارنةً بمجموعات البيانات الشعبية الأخرى.
مستقبل الذكاء الاصطناعي
بتوفير هذه الأدوات القوية والطرق وراءها لمجتمع المطورين العالمي، لا تطلق NVIDIA منتجًا فحسب، بل تبدأ موجة جديدة من الابتكار، آملة في خلق عالم يتحدث فيه الذكاء الاصطناعي لغتك، بغض النظر عن مكانك.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.