نقلة نوعية… مايكروسوفت تطور نموذج ذكاء اصطناعي يتحكم ببرامج ويندوز

2 يناير 2025 - 7:04 م

أعلنت مايكروسوفت تطوير نموذج ذكاء اصطناعي جديد يحمل اسم “Large Action Model أو LAM”، وهو يتميز بقدرته على تشغيل برامج ويندوز وتنفيذ المهام بنحو مستقل، ويشكّل هذا النموذج نقلة نوعية في الذكاء الاصطناعي القادر على تنفيذ الأوامر فعليًا.

وعلى نقيض النماذج اللغوية التقليدية، مثل GPT-4o، التي تقتصر وظيفتها على معالجة النصوص وإنشائها، يتمتع نموذج LAM الحديث من مايكروسوفت بقدرة على تحويل طلبات المستخدمين إلى أفعال حقيقية، سواء كان ذلك تشغيل البرامج أو التحكم في الأجهزة.

وقد كانت هذه الفكرة موجودة سابقًا، لكن LAM يُعد أول نموذج يُدرَّب بنحو خاص للعمل مع منتجات مايكروسوفت أوفيس المكتبية وغيرها من تطبيقات ويندوز.

وعلى سبيل المثال: عند التسوق من خلال الإنترنت، تستطيع النماذج التقليدية تقديم تعليمات نصية حول كيفية الشراء، في حين يمكن لنموذج LAM تنفيذ عملية الشراء ذاتها من أثناء التنقل في واجهة الموقع.

ووفقًا لمايكروسوفت، فإن تطوير هذا النموذج يتطلب أربع مراحل رئيسية: التدريب على تخطيط المهام وتقسيم المهمة إلى خطوات منطقية، والتعلم من نماذج متقدمة (مثل GPT-4o) لتحويل الخطط إلى أفعال، والاستكشاف الذاتي الذي يتيح للنموذج البحث عن حلول حديثة وتجاوز العقبات التي تعجز عنها النماذج الأخرى، بالإضافة إلى التدريب المستند إلى المكافآت لتحسين دقة التنفيذ.

وجرّب الباحثين نموذج LAM في محيط اختبار خاصة ببرنامج تحرير النصوص “ورد”، وقد نجح في تنفيذ المهام بنسبة قدرها 71%، متفوقًا على GPT-4o الذي حقق معدل نجاح بلغت 63% دون معلومات بصرية، كما كان نموذج LAM أسرع، إذ استغرق 30 ثانية فحسب لتنفيذ المهمة مقارنةً بـ 86 ثانية لـ GPT-4o. ومع ذلك، عند تزويد GPT-4o بمعلومات بصرية، تحسنت دقته لتصل إلى 75.5%.

واستند فريق مايكروسوفت إلى آلاف البيانات التدريبية المستخلصة من وثائق مايكروسوفت، ومقالات منصة wikiHow، وعمليات البحث من خلال محرك بينج، ثم استخدم الفريق نموذج GPT-4o لتطوير هذه المهام إلى مهام أخرى أشد تعقيدًا.

ومع هذا التطور، يواجه نموذج LAM عدد من التحديات، منها تنفيذ أفعال بنحو خطأ، وبعض القضايا التنظيمية التي تحتاج إلى حلول، وقيود تقنية تؤثر في قابلية التوسع والتطبيق في مجالات مختلفة.

ويرى الباحثين أن LAM يشكّل تقدمًا كبيرًا في مجال الذكاء الاصطناعي، مشيرين إلى أنه قد يمهد الطريق لتطوير ذكاء اصطناعي عام (AGI)؛ فبدلًا من الأنظمة التي تقتصر على فهم النصوص وإنتاجها، قد توفر الشركات قريبًا مساعدين رقميين يساعدون فعليًا في تنفيذ المهام اليومية بنحو فعّال.