تقارير ومتابعاتتقنيات جديدة

لا تدع الضجيج حول وكلاء الذكاء الاصطناعى يتقدمون على الواقع

0:00


كتب – المحرر الإفتراضي

لنبدأ بمصطلح “الوكيل” نفسه. في الوقت الحالي ، يتم صفعها على كل شيء بدءًا من البرامج النصية البسيطة إلى مهام سير العمل المتطورة من الذكاء الاصطناعي. لا يوجد تعريف مشترك ، والذي يترك الكثير من المجال للشركات لتسويق الأتمتة الأساسية كشيء أكثر تقدماً. هذا النوع من “غسل الوكيل” لا يخلط بين العملاء ؛ يدعو خيبة الأمل. لا نحتاج بالضرورة إلى معيار جامد ، لكننا نحتاج إلى توقعات أوضح حول ما يفترض أن تفعله هذه الأنظمة ، وكيف تعمل بشكل مستقل ، ومدى أداءها بشكل موثوق.

والموثوقية هي التحدي الكبير التالي. يتم تشغيل معظم وكلاء اليوم من خلال نماذج لغة كبيرة (LLMS) ، والتي تولد استجابات احتمالية. هذه الأنظمة قوية ، لكنها أيضًا لا يمكن التنبؤ بها. يمكنهم تصنيع الأمور أو الخروج من المسار الصحيح أو الفشل بطرق خفية – خاصةً عندما يُطلب منهم إكمال المهام متعددة الخطوات ، وسحب الأدوات الخارجية وسلاسل الاستجابات LLM معًا. مثال حديث: تم إخبار مستخدمي Cursor ، وهو مساعد برمجة AI الشهير ، من قبل وكيل دعم آلي أنهم لا يستطيعون استخدام البرنامج على أكثر من جهاز واحد. كانت هناك شكاوى واسعة النطاق وتقارير عن المستخدمين الذين يقومون بإلغاء اشتراكاتهم. ولكن اتضح أن السياسة لم تكن موجودة. اخترع الذكاء الاصطناعى.

في إعدادات المؤسسة ، قد يخلق هذا النوع من الخطأ أضرارًا هائلة. نحتاج إلى التوقف عن معالجة LLMs كمنتجات مستقلة والبدء في بناء أنظمة كاملة من حولها – أنظمة متوقعة تمثل عدم اليقين ، ومراقبة المخرجات ، وإدارة التكاليف ، والطبقة في الدرابزين من أجل السلامة والدقة. يمكن أن تساعد هذه التدابير في التأكد من أن الإخراج يلتزم بالمتطلبات التي يعبر عنها المستخدم ، وتطيع سياسات الشركة فيما يتعلق بالوصول إلى المعلومات ، وتحترم مشكلات الخصوصية ، وما إلى ذلك. بعض الشركات ، بما في ذلك AI21 (التي تم تأسيسها والتي تلقت تمويلًا من Google) ، تتحرك بالفعل في هذا الاتجاه ، وتفتت نماذج اللغة في بنية أكثر تعمدًا منظمة. تم تصميم أحدث إطلاقنا ، Maestro ، لموثونة المؤسسات ، الجمع بين LLMs وبيانات الشركة والمعلومات العامة والأدوات الأخرى لضمان المخرجات التي يمكن الاعتماد عليها.

ومع ذلك ، حتى أذكى وكيل لن يكون مفيدًا في فراغ. لكي يعمل نموذج الوكيل ، يحتاج وكلاء مختلفون إلى التعاون (حجز سفرك ، والتحقق من الطقس ، وتقديم تقرير النفقات الخاص بك) دون إشراف بشري مستمر. هذا هو المكان الذي يأتي فيه بروتوكول A2A من Google. من المفترض أن تكون لغة عالمية تتيح للوكلاء مشاركة ما يمكنهم القيام به وتقسيم المهام. من حيث المبدأ ، إنها فكرة رائعة.

في الممارسة العملية ، لا يزال A2A قصيرًا. إنه يحدد كيف يتحدث الوكلاء مع بعضهم البعض ، ولكن ليس ما يعنيهم بالفعل. إذا قال أحد العوامل إنه يمكن أن يوفر “ظروف الرياح” ، فيجب على شخص آخر تخمين ما إذا كان ذلك مفيدًا لتقييم الطقس على طريق الطيران. بدون مفردات أو سياق مشترك ، يصبح التنسيق هشًا. لقد رأينا هذه المشكلة من قبل في الحوسبة الموزعة. حلها على نطاق أبعد عن تافهة.


هذا المحتوي تم بالكامل عن طريق أدوات الذكاء الإصطناعي

مقالات ذات صلة

زر الذهاب إلى الأعلى

Main Heading Goes Here
Sub Heading Goes Here

No, thank you. I do not want.
100% secure your website.
Powered by
Main Heading Goes Here
Sub Heading Goes Here

No, thank you. I do not want.
100% secure your website.