تقنيات جديدة

نماذج OpenAI الجديدة للتفكير تعاني من زيادة في “الهلوسة”: تحدٍّ جديد في مجال الذكاء الاصطناعي

كتب: محمد شاهين

0:00

 

كشفت اختباراتٌ حديثةٌ أنّ نماذج OpenAI الجديدة للتفكير، o3 و o4-mini، تُعاني من مشكلة “الهلوسة” (hallucination)، أي اختلاق معلومات غير صحيحة، بشكلٍ أكبر من النماذج السابقة. وتُعتبر الهلوسة إحدى أكبر التحديات في مجال الذكاء الاصطناعي، حيث تُؤثّر على أداء أفضل النماذج الحالية.

وبحسب اختبارات OpenAI الداخلية، تُظهر النماذج o3 و o4-mini معدّلَ هلوسةٍ أعلى من النماذج السابقة، o1 و o1-mini و o3-mini، بل وحتى من النماذج التقليدية غير المُخصصة للتفكير، مثل GPT-4o. وقد بلغ معدل الهلوسة في نموذج o3 نحو 33% في اختبار PersonQA، وهو ضعف معدل الهلوسة في النماذج السابقة. أمّا نموذج o4-mini، فقد سجّل معدل هلوسة أعلى، يصل إلى 48%.

ولم تتمكّن OpenAI من تحديد سبب هذه الزيادة في الهلوسة. ويشير تقرير OpenAI الخاصّ بهذه النماذج إلى الحاجة لمزيدٍ من البحث لفهم هذه الظاهرة. وعلى الرغم من أنّ النماذج الجديدة تُظهر أداءً أفضل في بعض المجالات، مثل البرمجة والرياضيات، إلا أنّ زيادة عدد الادعاءات التي تُطلقها تُزيد من احتمالية اختلاق معلومات غير دقيقة.

وقد أكّدت اختباراتٌ خارجيةٌ أجراها مختبر Transluce للأبحاث، هذه النتائج، مُلاحظًا أنّ نموذج o3 يختلق أحيانًا خطواتٍ في عملية الوصول إلى الإجابات. وقد أشار الباحثون إلى أنّ تقنيات التعلم المعزز المُستخدمة في نماذج سلسلة o قد تُضخم المشاكل التي تُخفّفها عادةً (ولكن لا تُمحى تمامًا) خطوات معالجة ما بعد التدريب.

ويُعتبر معدل الهلوسة المرتفع في هذه النماذج عائقًا أمام استخدامها في المجالات التي تتطلب دقةً عالية، مثل المجال القانوني. وتُشير OpenAI إلى أنّ إحدى الطرق الواعدة لتحسين دقة النماذج هي منحها إمكانية البحث على الإنترنت، حيث يُظهر نموذج GPT-4o مع إمكانية البحث دقةً عاليةً في اختبار SimpleQA.

وتُمثل هذه النتائج تحديًا جديدًا في مجال الذكاء الاصطناعي، خاصةً مع توجه الصناعة نحو نماذج التفكير، التي تُحسّن الأداء في العديد من المهام دون الحاجة إلى كمياتٍ هائلةٍ من الحوسبة والبيانات خلال التدريب. وتُشدّد OpenAI على أنّها تعمل باستمرار على تحسين دقة موثوقية نماذجها.

هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.

مقالات ذات صلة

زر الذهاب إلى الأعلى

Main Heading Goes Here
Sub Heading Goes Here

No, thank you. I do not want.
100% secure your website.
Powered by
Main Heading Goes Here
Sub Heading Goes Here

No, thank you. I do not want.
100% secure your website.