اقتصاد وتكنولوجيا

ميتا تكشف عن نظام Omnilingual ASR: قفزة في التعرف الآلي على الكلام البشري

أعلنت شركة ميتا عن إطلاق نظام مبتكر للذكاء الاصطناعي يدعى Omnilingual ASR، وهو حل مفتوح المصدر يتجاوز حدود التعرف التلقائي على الكلام بتغطية أكثر من 1600 لغة، مع إمكانية التمدد لتشمل نحو 5400 لغة أخرى من خلال ميزة “التعلم السياقي دون تدريب مسبق”.

يبرز هذا النظام بقدرته على دمج لغات جديدة باستخدام عينات صوتية ونصية محدودة فقط، مما يلغي الحاجة إلى إعادة تدريب كاملة، ويجعله الأكثر مرونة وتوسعًا في عالم أنظمة التعرف الصوتي حتى الآن.

 إصدار مفتوح المصدر دون أي شروط

تؤكد ميتا توافر جميع مكونات النظام بشكل مجاني تمامًا تحت رخصة أباتشي 2.0، مما يتيح استخدامه بحرية في الدراسات العلمية والمشاريع التجارية على حد سواء.

تشمل الموارد المتاحة مجموعات من النماذج اللغوية المتقدمة، ونموذج تمثيل صوتي متعدد اللغات يعتمد على 7 مليارات معامل، بالإضافة إلى قاعدة بيانات هائلة تشمل أكثر من 350 لغة غير شائعة.

 دعم شامل بتقنيات متطورة

يحتوي حزمة Omnilingual ASR على عدة نماذج رائدة، منها:

– نماذج wav2vec 2.0 للتعلم الذاتي من التسجيلات الصوتية، تتراوح معالمها بين 300 مليون و7 مليارات.

– نماذج CTC-ASR للتحويل السريع إلى نص.

– نماذج LLM-ASR التي تربط بين معالج صوتي ومنتج نصي مبني على هيكل Transformers.

– نموذج ZeroShot-ASR الذي يتعامل مع لغات غير مدربة عليها أثناء التشغيل الفوري.

وفقًا لاختبارات الأداء، يصل النظام إلى معدل خطأ في الأحرف (CER) أقل من 10% في 78% من اللغات المشمولة، بما في ذلك أكثر من 500 لغة لم يغطها أي نظام سابق.

 تحول استراتيجي لميتا بعد تحديات Llama 4

يأتي هذا الإطلاق في سياق عام مليء بالتغييرات الإدارية داخل ميتا، خاصة بعد الاستقبال الضعيف لنموذج Llama 4 في الدوائر البحثية والتجارية.

لقد عين الرئيس التنفيذي مارك زوكربيرغ ألكسندر وانغ، الذي كان مؤسسًا لشركة Scale AI المتخصصة في الذكاء الاصطناعي، لقيادة قسم الذكاء الاصطناعي، بهدف التركيز على المشاريع العملية والمفتوحة المصدر.

يمثل النظام نقطة انطلاق استراتيجية تعيد ميتا إلى قوتها التاريخية في مجال الذكاء الاصطناعي متعدد اللغات، مع التأكيد على خفض العوائق أمام الابتكار الجماعي، وتقديم أدوات شفافة ومجانية تدعم التنوع اللغوي العالمي، مستفيدة من انتشار منصاتها الاجتماعية الواسع.

 تعاونات مجتمعية لبناء قاعدة بيانات قوية

تم جمع بيانات النظام بالشراكة مع جامعات ومشاريع بحثية في أفريقيا وآسيا، مثل برنامج African Next Voices المدعوم من مؤسسة بيل ومليندا غيتس، ومشروع Common Voice التابع لمؤسسة موزيلا، ومنظمة Lanfrica / NaijaVoices التي ساهمت في تسجيل 11 لغة أفريقية نادرة

ركزت عملية التسجيل على أصوات متحدثين أصليين مقابل تعويض مالي، مع التركيز على حوارات يومية غير مُعدة مسبقًا، لضمان دقة البيانات وتمثيل الثقافات المحلية بشكل أصيل.

أما بالنسبة للمتطلبات الفنية، فيحتاج النموذج الأكبر (omniASR_LLM_7B) إلى حوالي 17 جيجابايت من ذاكرة وحدة معالجة الرسوميات (GPU)، بينما يعمل النماذج الأصغر على أجهزة عادية بسرعة فورية تقريبًا

 أداء استثنائي في الظروف الصعبة

حقق النظام نتائج ممتازة حتى في المناطق الصاخبة أو اللغات ذات الموارد القليلة، مما يجعله مثاليًا لتطبيقات مثل المساعدين الصوتيين الذكيين، وتحويل المحتوى الصوتي والمرئي إلى نص، وإنتاج ترجمات لحظية دقيقة، بالإضافة إلى دعم اللغات المهددة بالزوال.

 فرص مفتوحة للمطورين والمؤسسات

توفر ميتا إمكانية تنزيل النماذج والبيانات مباشرة من منصات مثل GitHub وHugging Face، مع واجهات برمجة مبسطة لاستعراض اللغات المدعومة ودمجها في المنتجات التجارية.

بالنسبة للشركات في مجالات خدمة العملاء الصوتية، والتعليم، وإتاحة الوصول، وتطبيقات التقنيات العامة، يفتح هذا النظام آفاقًا لتطوير حلول صوتية متعددة اللغات بتكاليف منخفضة وبدون قيود ترخيصية.

مع إطلاق Omnilingual ASR، لا تقتصر ميتا على تقديم تقدم تقني فريد في مجال الصوتيات، بل تقدم أيضًا رؤية مستقبلية للذكاء الاصطناعي اللغوي مبنية على الشفافية والمشاركة الجماعية، مع دعم شامل لمعظم اللغات البشرية، في خطوة قد تغير تمامًا مشهد الذكاء الاصطناعي الصوتي على المستوى العالمي.

Mariam Hassan

مريم حسن كاتبة وصحفية متخصصة في الشأن الهندي ـ الباكستاني و جنوب شرق آسيا خبرة سنتين في مجال العمل الصحفي والإعلامي. أماكن العمل : داي نيوز الإخباري. أعمل على ترجمة وتحرير الأخبار والتقارير الصحفية المتنوعة. تحليل و دراسة التحولات السياسية والتهديدات الأمنية في آسيا وانعكاساتها على الأمن القومي المصري والعربي. متابعة التطورات الاقتصادية والتكنولوجية، وتحليل سياسات القوى الإقليمية وأنماط التحالفات بين جنوب آسيا والشرق الأوسط.

مقالات ذات صلة

اترك تعليقاً

زر الذهاب إلى الأعلى