اقتصاد وتكنولوجيا

ميتا تطلق نموذج الذكاء الاصطناعي Spirit LM لتقليد الأصوات البشرية

أعلنت شركة ميتا عن إطلاق نموذج الذكاء الاصطناعي الجديد “Spirit LM”، الذي يمثل طفرة في مجال معالجة الأصوات البشرية.

يستهدف هذا النموذج معالجة التحديات التي تواجه النماذج متعددة الوسائط، ليقدم تجربة صوتية أكثر تعبيرًا وطبيعية، مما يفتح آفاق جديدة في تكنولوجيا الذكاء الاصطناعي.

تفاصيل النموذج الجديد

يعد “Spirit LM” نموذجًا مفتوح المصدر، ويعتمد على بنية لغوية مُدرّبة مسبقًا تحتوي على 7 مليارات معلمة. ويتميز النموذج بقدرته على إنتاج أصوات طبيعية تتجاوز تقنيات التعرف على الكلام التقليدية، والتي غالبًا ما تفقد تعبيرات الصوت الطبيعية.

تستخدم ميتا في تطوير النموذج رموز الفونيم والنغمات ودرجات الصوت، مما يساهم في إنتاج أصوات تعبر بشكل أفضل عن المشاعر والتعابير البشرية. هذه الاستراتيجية تسمح لـ “Spirit LM” بتعلم مهام جديدة تتضمن التعرف على الكلام، وتحويل النص إلى صوت، وتصنيف الكلام.

قامت ميتا بنشر ورقة بحثية تتناول تفاصيل البحث الذي أدى إلى تطوير “Spirit LM”، بما في ذلك عينات من الأداء الصوتي للنموذج.

ويُتوقع أن يتم دمج هذا النموذج ضمن تطبيقات ميتا المختلفة، مثل واتساب وإنستاجرام وفيسبوك، مما يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي بشكل صوتي طبيعي مليء بالتعبيرات، على غرار التقنيات المتقدمة التي قدمتها شركات أخرى مثل OpenAI.

يمثل نموذج “Spirit LM” خطوة هامة نحو تحسين تجارب التفاعل الصوتي مع الذكاء الاصطناعي، حيث يساهم في تجاوز القيود التي تواجه النماذج التقليدية، مما يفتح المجال لتطبيقات جديدة ومتطورة في عالم التكنولوجيا.

مقالات ذات صلة

اترك تعليقاً

زر الذهاب إلى الأعلى