نموذج ميتا “مَافريك” يتأخر عن المنافسين في معيار الدردشة الشهير

كتب: محمد شاهين

'الثلاثاء - 15 أبريل - 2025'

537 دقيقة واحدة

0:00

أثارت ميتا جدلاً واسعًا بسبب استخدامها نسخةً تجريبيةً غير مُطْلَقة من نموذجها “Llama 4 Maverick” لِتحقيق نتيجة عالية في معيار LM Arena لِلدردشة. وقد دفع ذلك مسؤولي LM Arena إلى الاعتذار وتغيير سياساتهم وتقييم نسخة “مَافريك” العادية غير المُعدّلة.

وقد أظهرت النتائج أنّ نسخة “مَافريك” العادية (Llama-4-Maverick-17B-128E-Instruct) تحتلّ مركزًا متأخرًا مقارنةً بِنماذج أخرى مثل GPT-4o من OpenAI، وClaude 3.5 Sonnet من Anthropic، وGemini 1.5 Pro من جوجل. والجدير بِالذكر أنّ عديدًا من هذه النماذج قديمة بِشهور.

يُعزى سوء الأداء إلى أنّ النسخة التجريبية من “مَافريك” (Llama-4-Maverick-03-26-Experimental) قد صُمّمت خصّيصًا لِتحسين جودة الدردشة. وقد أثبتت هذه التحسينات فعاليتها في معيار LM Arena، الذي يعتمد على مقارنة مُقيّمين بشريين لِمخرجات النماذج واختيار الأفضل.

مع ذلك، يُعرف عن معيار LM Arena عدم دقّته كليًا في قياس أداء نماذج الذكاء الاصطناعي. كما أنّ تعديل النموذج لِيتناسب مع معيارٍ مُحدّد يُصعّب من توقع أداء النموذج في سياقاتٍ مُختلفة.

أكدت ميتا أنّها تجري تجربةً مع جميع أنواع النسخ المُخصصة، وأشارت إلى أنّ النسخة التجريبية قد أظهرت أداءً جيدًا في معيار LM Arena. وتُتوقع ميتا أن يُعدّل المُطوّرون نموذج Llama 4 لِيتناسب مع حالات استخدامهم الخاصة.

هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.

الوسوم

'الثلاثاء - 15 أبريل - 2025'

537 دقيقة واحدة

أقرأ التالي

نموذج ميتا “مَافريك” يتأخر عن المنافسين في معيار الدردشة الشهير

كتب: محمد شاهين

أقرأ التالي

شركة Perplexity تجمع 200 مليون دولار بتقييم 20 مليار دولار: المنافسة مع جوجل تتصاعد

استكشاف مستقبل الذكاء الاصطناعي الصوتي مع ماتي ستانيزيويسكي في TechCrunch Disrupt 2025

إنفيديا تكشف عن وحدة معالجة الرسوميات الجديدة Rubin CPX: خطوة نحو الذكاء الاصطناعي المتقدم

شركة Perplexity تجمع 200 مليون دولار بتقييم 20 مليار دولار: المنافسة مع جوجل تتصاعد

استكشاف مستقبل الذكاء الاصطناعي الصوتي مع ماتي ستانيزيويسكي في TechCrunch Disrupt 2025

إنفيديا تكشف عن وحدة معالجة الرسوميات الجديدة Rubin CPX: خطوة نحو الذكاء الاصطناعي المتقدم

تليفزيون ليوميديا الإفتراضي

فريق الموظفين الإفتراضيين في ليوميديا
تواصل مع أي موظف بالضغط علي صورته

مروان موظف التدريب

فريدة- الراديو 9090

حازم - موظف الإستشارات

جاسمن - موظفة أجنا

تليفزيون ليوميديا الإفتراضي

فريق الموظفين الإفتراضيين في ليوميديا
تواصل مع أي موظف بالضغط علي صورته

مروان موظف التدريب

فريدة- الراديو 9090

حازم - موظف الإستشارات

جاسمن - موظفة أجنا

أقرأ التالي

شركة Perplexity تجمع 200 مليون دولار بتقييم 20 مليار دولار: المنافسة مع جوجل تتصاعد

استكشاف مستقبل الذكاء الاصطناعي الصوتي مع ماتي ستانيزيويسكي في TechCrunch Disrupt 2025

إنفيديا تكشف عن وحدة معالجة الرسوميات الجديدة Rubin CPX: خطوة نحو الذكاء الاصطناعي المتقدم

شركة Perplexity تجمع 200 مليون دولار بتقييم 20 مليار دولار: المنافسة مع جوجل تتصاعد

استكشاف مستقبل الذكاء الاصطناعي الصوتي مع ماتي ستانيزيويسكي في TechCrunch Disrupt 2025

إنفيديا تكشف عن وحدة معالجة الرسوميات الجديدة Rubin CPX: خطوة نحو الذكاء الاصطناعي المتقدم

التحقق من الهوية شرط مُحتمل للوصول إلى نماذج OpenAI المُتقدمة

جوجل تطلق DolphinGemma: ثورة في فك شفرة تواصل الدلافين باستخدام الذكاء الاصطناعي

مقالات ذات صلة

إعادة هيكلة تاريخية في OpenAI: دمج فريق “شخصية” ChatGPT وولادة مختبرات جديدة وتوسع نحو سوق الوظائف

جوجل توسع وضع الذكاء الاصطناعي ليشمل 5 لغات جديدة منها الهندية واليابانية والكورية

نمو قطاع الذكاء الاصطناعي في المملكة المتحدة يسجل استثمارًا قياسيًا يبلغ 2.9 مليار جنيه إسترليني

الذكاء الاصطناعي وتعلم الآلة في تصميم الهندسة

فريق الموظفين الإفتراضيين في ليوميديا تواصل مع أي موظف بالضغط علي صورته

مروان موظف التدريب

فريدة- الراديو 9090

حازم - موظف الإستشارات

جاسمن - موظفة أجنا

تليفزيون ليوميديا الإفتراضي

فريق الموظفين الإفتراضيين في ليوميديا تواصل مع أي موظف بالضغط علي صورته

مروان موظف التدريب

فريدة- الراديو 9090

حازم - موظف الإستشارات

جاسمن - موظفة أجنا

فريق الموظفين الإفتراضيين في ليوميديا
تواصل مع أي موظف بالضغط علي صورته

فريق الموظفين الإفتراضيين في ليوميديا
تواصل مع أي موظف بالضغط علي صورته