جوجل تخطط لدمج Gemini و Veo لتعزيز فهم الذكاء الاصطناعي للعالم

أعلن ديميس هاسابيس - الرئيس التنفيذي لشركة جوجل ديب مايند، في حلقة من بودكاست Possible الذي يستضيفه أحد مؤسسي لينكد إن، أن جوجل تخطط لدمج نماذج الذكاء الاصطناعي Gemini مع نماذج إنشاء الفيديو Veo بهدف تحسين فهم النماذج السابقة للعالم المادي.

وأوضح الرئيس التنفيذي لديب مايند أن Gemini صُمم منذ البداية ليكون متعدد الوسائط وأن هذا القرار اتُخذ بسبب رؤية جوجل لإنشاء مساعد رقمي عالمي قادر على مساعدة المستخدمين في العالم الحقيقي.

ويتجه مجال الذكاء الاصطناعي تدريجيًا نحو نماذج "متعددة القدرات" قادرة على فهم ودمج أشكال مختلفة من المحتوى فنماذج Gemini من جوجل قادرة على إنتاج الصوت والصورة والنص بينما يمكن لنموذج GPT-4o من OpenAI أيضًا إنشاء الصور.

ويتطلب إنشاء مثل هذه النماذج كميات هائلة من بيانات التدريب بما في ذلك الصور ومقاطع الفيديو والصوت والنصوص وأشار هاسابيس إلى أن بيانات الفيديو الخاصة بـ Veo تُستخلص بشكل أساسي من يوتيوب.

جوجل تخطط لدمج Gemini و Veo لتعزيز فهم الذكاء الاصطناعي للعالم
جوجل تخطط لدمج Gemini و Veo لتعزيز فهم الذكاء الاصطناعي للعالم

ويقول هاسابيس إنه من خلال مشاهدة كمية كبيرة من مقاطع الفيديو على يوتيوب يمكن لـ Veo 2 تحديد مفاهيم مثل قوانين الفيزياء في العالم.

وكانت جوجل قد ذكرت سابقًا أن نماذجها قد تُدرب على بعض محتويات يوتيوب بموجب اتفاقية مع منشئي المحتوى ويُقال إن جوجل وسعت شروط الخدمة الخاصة بها العام الماضي لتوفير وصول أكبر إلى بيانات يوتيوب لتدريب نماذج الذكاء الاصطناعي الخاصة بها.

إرسال تعليق (0)
أحدث أقدم