على عكس النماذج التوليدية، مثل Gemini 3، لا تركز نماذج التضمين على إنشاء محتوى جديد، بل على فهم المعلومات وتمثيلها.
ولتحقيق ذلك، تحوّل هذه النماذج أنواع البيانات المختلفة إلى متجهات رياضية، يسهل على الآلات تحليلها. تُمكّنها هذه القدرة من أداء مهام مثل البحث الدلالي، والتصنيف، وتجميع المعلومات، مما يوفر نتائج أكثر دقة وسياقية من الأنظمة التي تعتمد فقط على الكلمات المفتاحية.
بينما اقتصر نموذج التضمين الأول من جوجل على النصوص فقط، يوسع نموذج Gemini Embedding 2 نطاق هذا النهج ليشمل دمج أنواع متعددة من المحتوى ضمن مساحة عرض واحدة. يعالج النموذج النصوص والصور والفيديوهات والملفات الصوتية والمستندات، ويمكنه استخلاص المعنى الدلالي بأكثر من 100 لغة.
بحسب جوجل، يُبسّط هذا النظام العمليات المعقدة ويُحسّن مجموعة واسعة من المهام متعددة الوسائط اللاحقة، بدءًا من توليد المحتوى المعزز مرورًا بالاسترجاع والبحث الدلالي وصولًا إلى تحليل المشاعر وتجميع البيانات. علاوة على ذلك، يُتيح النظام تحليل العلاقات بين أنواع المحتوى المختلفة، ومعالجة الطلبات التي تتضمن نصوصًا وصورًا في آنٍ واحد، مما يُسهّل التحليل المُدمج للمعلومات.
ومن بين الاستخدامات المُحتملة، تُسلّط جوجل الضوء على المجال القانوني: فخلال عمليات الكشف عن الأدلة، يُمكن للمختصين استخدام Gemini Embedding 2 لتحديد المعلومات الهامة بين ملايين السجلات بكفاءة أكبر.
النموذج متاح للمعاينة العامة من خلال واجهة برمجة تطبيقات Gemini و Vertex AI.
- للمزيد من المعلومات في مدونة جوجل
source http://www.igli5.com/2026/03/gemini-embedding-2.html
ليست هناك تعليقات