تقارير ومتابعاتتقنيات جديدة

هل يمكن أن تكون Google’s Veo 3 بداية لنماذج العالم القابلة للعب؟

0:00


كتب – المحرر الإفتراضي

يبدو أن ديميس هاسابيس ، الرئيس التنفيذي لمؤسسة أبحاث الذكاء الاصطناعى في Google ، تشير إلى أن مساء الثلاثاء ، يمكن استخدامه في أحدث طراز توليد الفيديو في Google ، لألعاب الفيديو.

رداً على منشور على x beseching Google إلى “دعني أعزف لعبة فيديو لمقاطع فيديو Veo 3 الخاصة بي بالفعل” ، وتسأل ، “Playable World Models Wen؟” أجاب حسابيس ، “الآن لن يكون هذا شيئًا”.

في صباح الأربعاء ، لوغان كيلباتريك ، المنتج الرئيسي لاستوديو AI من Google و Gemini API ، مع رد: “🤐🤐🤐🤐”

تعد كلتا المنشورات من المديرين التنفيذيين من Google أكثر من مجرد اقتراحات مرحة ، وأخبر متحدث باسم Google TechCrunch أن الشركة ليس لديها ما تشاركه في الوقت الحالي. لكن بناء نماذج العالم القابلة للعب ليس خارج نطاق إمكانيات عملاق التكنولوجيا.

تختلف النماذج العالمية عن نماذج توليد الفيديو. السابق يحاكي ديناميات بيئة حقيقية ، والتي تتيح للعوامل التنبؤ بكيفية تطور العالم استجابة لأفعالهم. نماذج GEN بالفيديو تجمع تسلسل فيديو واقعي.

تخطط Google لتحويل نموذج الأساس متعدد الوسائط ، Gemini 2.5 Pro ، إلى نموذج عالمي يحاكي جوانب الدماغ البشري. في ديسمبر / كانون الأول ، كشفت DeepMind عن Genie 2 ، وهو نموذج يمكن أن يولد مجموعة متنوعة “لا نهاية لها” من العوالم القابلة للعب. في الشهر التالي ، أبلغنا أن Google كانت تشكل فريقًا جديدًا للعمل على نماذج الذكاء الاصطناعى يمكنها محاكاة العالم الحقيقي.

يعمل آخرون على بناء نماذج عالمية-أبرزها ، رائد الذكاء الاصطناعي Fei-Fei Li. خرج لي من Stealth العام الماضي مع World Labs ، وهي شركة ناشئة قامت ببناء نظام الذكاء الاصطناعى الخاص به والذي يولد مشاهد ثلاثية الأبعاد مثل ألعاب الفيديو من صورة واحدة.

https://www.youtube.com/watch؟v=BMECE8LLQIK

يمكن لـ VEO 3 ، التي لا تزال في المعاينة العامة ، إنشاء فيديو بالإضافة إلى الصوت لتتماشى مع مقاطع – أي شيء من الكلام إلى الموسيقى التصويرية. في حين أن VEO 3 يخلق حركات واقعية من خلال محاكاة الفيزياء في العالم الحقيقي ، إلا أنها ليست نموذجًا عالميًا حتى الآن. بدلاً من ذلك ، يمكن استخدامه لرواية القصص السينمائية في الألعاب ، مثل cutscenes ، والمقطورات ، والنماذج الأولية السردية

لا يزال هذا النموذج أيضًا نموذجًا توليديًا “إخراجًا سلبيًا” ، وسيحتاج (أو جيل VEO في المستقبل) إلى التحول إلى جهاز محاكاة أكثر نشاطًا وتفاعلية وتنبئًا.

لكن التحدي الحقيقي مع إنتاج ألعاب الفيديو ليس مجرد صور رائعة ؛ إنه الوقت الفعلي ومتسق ويمكن التحكم فيه. لهذا السبب قد يكون من المنطقي رؤية Google تتبع نهجًا هجينًا يعزز Veo و Genie في المستقبل ، في حالة متابعة لعبة الفيديو أو تطوير العالم القابل للعب.

يمكن أن تجد Google نفسها تتنافس مع Microsoft و Synario و Runway و Pika ، وفي النهاية ، طراز Openai المولد بالفيديو Sora.

بالنظر إلى حركات Google المخطط لها في مساحة النماذج العالمية وسمعتها لاستخدام جيوبها العميقة وعضلات التوزيع إلى منافسي البخار ، سيكون من الحكمة أن يحافظ المنافسون في هذه المساحة على مراقبة عن كثب.


هذا المحتوي تم بالكامل عن طريق أدوات الذكاء الإصطناعي

مقالات ذات صلة

زر الذهاب إلى الأعلى

Main Heading Goes Here
Sub Heading Goes Here

No, thank you. I do not want.
100% secure your website.
Powered by
Main Heading Goes Here
Sub Heading Goes Here

No, thank you. I do not want.
100% secure your website.