أعلنت شركة Meta عن نموذج جديد للذكاء الاصطناعي يسمى CM3Leon، وتدعي أنه أفضل نموذج في فئته لتوليد الصور استنادًا إلى الأوامر النصية.
يتميز هذا النموذج بأنه أكثر كفاءة ويحتاج إلى حوسبة أقل بخمس مرات ومجموعة بيانات أصغر للتدريب مقارنةً بالنماذج الأخرى.
كما تعتمد معظم مولدات الصور التي تعمل بالذكاء الاصطناعي على تقنية الانتشار Diffusion، وهي تقنية بطيئة وتتطلب حوسبة كبيرة ومكلفة. ومع ذلك، يعتمد نموذج CM3Leon على تقنية مختلفة تُعرف باسم الاهتمام Attention، مما يجعله أسرع في التدريب وخلق النتائج وأقل كلفة في التشغيل.
ويتميز نموذج CM3Leon بقدرته على توليد وصف للصور، مما يمهد الطريق لنماذج فهم الصور ذات القدرات الأكبر في المستقبل، وفقًا للشركة.
وقد استخدمت شركة Meta ملايين الصور من شركة Shutterstock لتدريب CM3Leon، ويحتوي النموذج على 7 مليارات معامل، أي أكثر من ضعف ما يحتويه نموذج DALL-E 2 التابع لشركة OpenAI.
كما استخدمت Meta تقنية الضبط الدقيق تحت الإشراف لتحسين أداء النموذج في توليد الصور وكتابة الوصف والتعليقات على الصور، مما يسمح بالإجابة على الأسئلة حول الصور وتعديلها باستخدام الأوامر النصية.
ويمكن استخدام CM3Leon في مجموعة واسعة من التطبيقات مثل الواقع الافتراضي والواقع المعزز والروبوتات والإعلان والتسويق.
كما لم تحدد Meta موعد إصدار نموذج CM3Leon أو ما إذا كانت تنوي إطلاقه للجمهور، ومن المتوقع أن تكشف Meta المزيد من التفاصيل حول النموذج في وقتٍ لاحق.
تحويل كودإخفاء محول الأكواد الإبتساماتإخفاء