جوجل تطلق نموذجًا تجريبيًا جديدًا لتحويل النصوص إلى تمثيلات رقمية

أضافت جوجل نموذجًا تجريبيًا جديدًا يُدعى "Gemini Embedding" إلى واجهة برمجة التطبيقات (API) الخاصة بمطوري جيميناي يُستخدم هذا النموذج لتحويل النصوص مثل الكلمات والعبارات إلى تمثيلات رقمية تحتفظ بالمعنى المفاهيمي للنص وتُستخدم هذه النماذج في تطبيقات مثل البحث في المستندات وتصنيف المحتوى حيث تساعد في تقليل التكاليف وتحسين سرعة المعالجة.

عندما يُذكر مصطلح "تمثيلات رقمية" في سياق النصوص ونماذج الذكاء الاصطناعي مثل Gemini Embedding فإنه يشير إلى عملية تحويل النصوص (الكلمات، الجمل، الفقرات) إلى أرقام أو متجهات (vectors) يمكن للكمبيوتر فهمها ومعالجتها هذه التمثيلات الرقمية تحتفظ بالمعنى المفاهيمي للنص وبالتالي يسمح للآلة بفهم العلاقات بين الكلمات والعبارات واستخدامها في مهام مختلفة.

لنفترض أن لدينا الكلمات التالية: قطة، كلب، تفاحة، وبعد تحويلها إلى تمثيلات رقمية قد تكون المتجهات كالتالي:

  • قطة: [0.2, 0.8, 0.1]
  • كلب: [0.3, 0.7, 0.2]
  • تفاحة: [0.9, 0.1, 0.4]

هنا نلاحظ أن "قطة" و"كلب" كلاهما حيوانات ولهما متجهات قريبة من بعضهما بينما "تفاحة" فهي فاكهة فلها متجه مختلف وهذا يوضح كيف تحتفظ التمثيلات الرقمية بالمعنى المفاهيمي.

وتقدم شركات أخرى مثل أمازون وCohere وOpenAI نماذج مشابهة من خلال واجهات برمجة التطبيقات الخاصة بها وكانت جوجل قد قدمت نماذجًا سابقة لتحويل النصوص إلى تمثيلات رقمية لكن Gemini Embedding يُعتبر أول نموذج يتم تدريبه بناءً على نماذج الذكاء الاصطناعي الخاصة بمنصة جيميناي.

وأوضحت جوجل في بيان لها: "تم تدريب نموذج Gemini Embedding مباشرةً على أساس نماذج جيميناي مما يعني أنه ورث الفهم العميق للغة والمفاهيم الدقيقة التي تتمتع بها هذه النماذج وقد تم تصميمه ليكون عامًا ويقدم أداءً استثنائيًا في مجالات متنوعة مثل التمويل والعلوم والقانون والبحث وغيرها."

وأشارت جوجل إلى أن أداء Gemini Embedding يتفوق على النموذج السابق "text-embedding-004" الذي كان يعتبر أكثر النماذج تقدمًا في هذا المجال حتى الآن وكما أظهر النموذج الجديد قدرة تنافسية في الاختبارات المعيارية ويتميز Gemini Embedding بقدرته على معالجة أجزاء أكبر من النصوص والأكواد في وقت واحد بالإضافة إلى دعمه لأكثر من 100 لغة مختلفة أي ضعف عدد اللغات التي كان يدعمها النموذج السابق.

جوجل تطلق نموذجًا تجريبيًا جديدًا لتحويل النصوص إلى تمثيلات رقمية

وأكدت جوجل أن Gemini Embedding لا يزال في مرحلة الاختبار وأن سعته محدودة وقد يخضع لتغييرات في المستقبل وقالت الشركة: "نعمل حاليًا على إصدار نسخة مستقرة ومتاحة للجميع والتي سيتم إطلاقها خلال الأشهر القليلة المقبلة."

التضمين (Embedding) يحول كل كلمة أو عبارة إلى متجه رقمي في فضاء متعدد الأبعاد هذه المتجهات تمثل المعنى الدلالي للكلمات على سبيل المثال الكلمات المتشابهة في المعنى ستكون متجهاتها قريبة من بعضها في هذا الفضاء الرقمي ويمكن استخدام هذه التمثيلات الرقمية في تطبيقات مثل:

  • البحث في المستندات للعثور على نصوص ذات صلة ببعضها.
  • تصنيف المحتوى لتحديد فئة النص (مثل تصنيف البريد الإلكتروني كـ رسائل مهمة أو رسائل غير مهمة).
  • الترجمة الآلية لفهم النصوص بلغات مختلفة.
  • التلخيص التلقائي لاستخراج الأفكار الرئيسية من النصوص الطويلة.

إرسال تعليق (0)
أحدث أقدم