
أعلنت شركة أمازون عن إطلاق نموذجها الجديد Nova Act، وهو نموذج ذكاء اصطناعي متقدم مصمم لإنشاء “وكلاء أذكياء” قادرين على تنفيذ مهام معقدة ومتعددة الخطوات مباشرة عبر متصفحات الويب. يأتي هذا الإطلاق كخطوة نحو تحقيق رؤية الشركة لوكلاء ذكيين يعملون بشكل مستقل في البيئات الرقمية والفيزيائية، متجاوزين حدود النماذج اللغوية الحالية.
ما الذي يُميز Nova Act؟
بينما تركّز النماذج اللغوية الكبيرة (مثل ChatGPT) على توليد النصوص أو استرجاع المعلومات عبر تقنيات مثل RAG، تُعيد أمازون تعريف مفهوم “الوكلاء” ليكونوا كيانات قادرة على تنفيذ مهام ملموسة، مثل تنظيم حفل زفاف أو إدارة مهام تقنية معقدة لتعزيز الإنتاجية. وفقًا لبيان الشركة:
“حلمنا أن يصبح الوكلاء قادرين على إدارة مهام متشعبة دون تدخل بشري مستمر”.
التحديات والحلول
تواجه الوكلاء الحالية قيودًا مثل الاعتماد على تكامل واجهات برمجة التطبيقات (APIs) أو الحاجة للإشراف البشري. هنا يأتي Nova Act بحزمة تطوير برمجية (SDK) تتيح للمطورين بناء وكلاء تلقائيين لأتمتة مهام مثل:
إرسال ردود تلقاعية على البريد الإلكتروني.
حجز مواعيد في التقويمات الرقمية.
تجاوز الإعلانات المُزعجة خلال عمليات الدفع الإلكتروني.
تعتمد الحزمة على تقسيم المهام إلى أوامر بسيطة (Atomic Commands) مثل “ابحث” أو “تفاعل مع القائمة المنسدلة”، مع دعم تقنيات مثل Playwright لتحريك المتصفحات، وخيوط التنفيذ المتوازي (Parallel Threading) لتجنب تأخير تحميل الصفحات.
أداء متميز في المقاييس
سجّل Nova Act نتائج استثنائية في الاختبارات الداخلية لأمازون:
0.939 في اختبار ScreenSpot Web Text (تفاعلات نصية)، متفوقًا على Claude 3.7 Sonnet (0.900) ونموذج CUA من OpenAI (0.883).
0.879 في اختبار ScreenSpot Web Icon (تفاعلات مع العناصر المرئية).
التكيف مع بيئات جديدة
إحدى الميزات الفريدة لـ Nova Act هي قدرته على فهم واجهات المستخدم في بيئات غير مألوفة دون تدريب مسبق. على سبيل المثال، نجح النموذج في التنقل داخل ألعاب المتصفح رغم عدم تدريبه عليها، كما يُستخدم حاليًا في تحسين قدرات مساعد Alexa+ لإنجاز مهام عبر الويب دون الاعتماد الكلي على واجهات برمجة التطبيقات.
رؤية أمازون المستقبلية
تؤكد أمازون أن Nova Act يمثل المرحلة الأولى نحو بناء وكلاء ذكاء اصطناعي قادرين على التعلم عبر سيناريوهات واقعية معقدة، باستخدام التعلم التعزيزي (Reinforcement Learning). وأوضحت الشركة:
“أفضل حالات استخدام الوكلاء لم تُكتشف بعد. هدفنا تمكين المطورين من استكشافها عبر أدواتنا”.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.