قامت Meta بإنشاء نموذج مدعوم بالذكاء الإصطناعي قادر على التعرف على أكثر من 4000 لغة محكية و إنتاج كلام مسموع بأكثر من 1100 لغة

قامت شركة Meta بإنشاء نموذجًا لغويًا مدعومًا بالذكاء الاصطناعي و يُعرف باسم MMS، و هو قادر على التعرف على أكثر من 4000 لغة محكية و إنتاج الكلام المسموع بأكثر من 1100 لغة.

كما أن Meta تقدم خدمة MMS بصورة مفتوحة المصدر لدعم التنوع اللغوي و تشجيع الباحثين على الاستفادة منها، على غرار المشاريع الأخرى في مجال الذكاء الاصطناعي التي أعلنت عنها الشركة.

وهذا ما كتبته الشركة: "نحن نشارك نماذجنا ورموزنا بشكل علني ليتسنى للآخرين في مجتمع البحث البناء على عملنا. من خلال هذا الجهد، نأمل أن نقدم مساهمة صغيرة في الحفاظ على التنوع اللغوي المدهش في العالم".

كما أنه وفقًا لـ Meta، يتطلب تدريب نماذج التعرف على الكلام وتحويل النص إلى كلام مسموع الآلاف من ساعات الصوت مع توضيح محتوى الصوت. ويعتبر التوضيح ضروريًا أيضًا للتعلم الآلي، حيث يساعد على تصنيف البيانات و فهمها بشكل صحيح من قبل الخوارزميات. ومع ذلك، تكون هذه البيانات غير متوفرة للغات غير المستخدمة على نطاق واسع.

ولتحقيق ذلك، قررت Meta استخدام منهج غير تقليدي لجمع البيانات الصوتية. واعتمدت الشركة على تسجيلات النصوص الدينية المترجمة، حيث صرحت قائلة: "قمنا باستخدام النصوص الدينية، مثل الكتاب المقدّس، التي تم ترجمتها إلى العديد من اللغات المختلفة و تم دراسة ترجماتها بشكل واسع في مجال بحوث الترجمة اللغوية المبنية على النصوص. هذا زاد عدد اللغات المدعومة في النموذج إلى أكثر من 4000 لغة".

وقد أشارت Meta إلى أن المحتوى المسجّل صوتيًا هو محتوى ذو طابع ديني، إلا أن تحليلنا يوضح أن هذا لا يتسبب في تحييز النموذج لإنتاج مزيد من اللغة الدينية.

على الرغم من ذلك، قامت شركة Meta بتحذير أن نماذجها الجديدة ليست مثالية، حيث يوجد بعض المخاطر من احتمال أن يقوم نموذج تحويل الكلام إلى نص بارتكاب أخطاء في ترجمة كلمات أو عبارات محددة، مما يمكن أن يؤدي إلى استخدام لغة مسيئة أو غير دقيقة.