مايكروسوفت تطوّر ذكاءً اصطناعيًا جديدًا قادرًا على التحكم في برامج ويندوز
أعلنت مايكروسوفت عن تطوير نموذج ذكاء اصطناعي جديد يحمل اسم “Large Action Model” (LAM)، يتميز بقدرته على تنفيذ الأوامر مباشرة في بيئة ويندوز.
يهدف هذا النموذج إلى تحويل طلبات المستخدمين النصية إلى أفعال حقيقية، ما يجعله نقلة نوعية مقارنة بالنماذج التقليدية التي تقتصر على فهم النصوص وإنشائها فقط.
LAM قادر على التحكم في تطبيقات مايكروسوفت أوفيس وبرامج ويندوز الأخرى، حيث يمكنه تنفيذ مهام مثل فتح الملفات، تعديل المستندات، وحتى التفاعل مع واجهات المستخدم.
آلية عمل LAM ومميزاته
يعتمد نموذج LAM على أربع مراحل تدريب رئيسية لتحقيق الكفاءة في أداء المهام:
1. تخطيط المهام: يتم تدريب النموذج على تقسيم المهمة إلى خطوات منطقية يمكن تنفيذها.
2. التعلم من نماذج متقدمة: يستفيد من نماذج مثل GPT-4o لتحويل الخطط إلى إجراءات فعلية.
3. الاستكشاف الذاتي: يمكن للنموذج اكتشاف حلول جديدة وتجاوز العقبات التي قد تواجهه أثناء التنفيذ.
4. التعلم المستند إلى المكافآت: يعزز هذا الأسلوب من دقة النموذج في تنفيذ المهام.
على سبيل المثال، يمكن للنموذج تنفيذ عملية شراء عبر الإنترنت بشكل كامل، من تصفح المنتجات وحتى إتمام الدفع، بدلاً من تقديم تعليمات فقط كما تفعل النماذج التقليدية.
نتائج واختبارات الأداء
اختبرت مايكروسوفت نموذج LAM على برنامج “مايكروسوفت وورد”، وحقق نسبة نجاح بلغت 71%، متفوقًا على GPT-4o الذي حقق 63% فقط في نفس المهمة بدون معلومات بصرية. كما كان LAM أسرع في التنفيذ، حيث أكمل المهمة في 30 ثانية مقارنة بـ 86 ثانية لـ GPT-4o.
مع ذلك، عند إضافة معلومات بصرية إلى GPT-4o، تحسنت دقته لتصل إلى 75.5%. هذا يدل على أن نموذج LAM يتميز بمرونة وسرعة أفضل، لكنه قد يحتاج إلى تحسينات إضافية للمنافسة في بيئات معقدة.
رغم المزايا الكبيرة التي يقدمها نموذج LAM، يواجه عدة تحديات، منها:
– تنفيذ الأوامر الخاطئة: قد يرتكب أخطاء أثناء تنفيذ المهام.
– قضايا تنظيمية: تتعلق بالتحكم في كيفية استخدام النموذج.
– قيود تقنية: تتعلق بتوسيع استخدام النموذج في مجالات متنوعة.
يرى الباحثون أن LAM يمثل خطوة مهمة نحو تحقيق الذكاء الاصطناعي العام (AGI)، حيث يمكن للذكاء الاصطناعي أن يتجاوز حدود الفهم النصي إلى تنفيذ المهام اليومية بفعالية، ما يمهد الطريق لمستقبل مليء بالابتكارات في هذا المجال.