بأقل من 50 دولاراً .. منافس مفتوح لـ “أوبن أيه آي” و “ديب سيك”

7 فبراير 2025 - 5:14 م

اشتعلت المنافسة في مجال الذكاء الاصطناعي بين الشركات لتحقيق التقدّم في هذا المجال الذي يعصف بالعديد من الشركات الكبرى، فقد تمكن باحثو الذكاء الاصطناعي في جامعة ستانفورد وجامعة واشنطن من تدريب نموذج “استدلال” للذكاء الاصطناعي مقابل أقل من 50 دولارًا في رصيد الحوسبة السحابية، وفقًا لورقة بحثية حديثة صدرت يوم الجمعة الماضي.

ويعمل النموذج المعروف باسم s1 بصورة مشابه لنماذج التفكير المتطورة، مثل o1 من OpenAI وR1 من DeepSeek، في الاختبارات التي تقيس قدرات الرياضيات والترميز.

ويتوفر نموذج s1 على GitHub ، إلى جانب البيانات والرمز المستخدم لتدريبه.

وقال الفريق الذي يقف خلف s1 إنهم بدأوا بنموذج أساسي جاهز للاستخدام، ثم قاموا بضبطه من أثناء التقطير، وهي عملية لاستخراج قدرات “الاستدلال” من نموذج ذكاء اصطناعي آخر من أثناء التدريب على إجاباته.

قال الباحثين إن s1 مستمدة من أحد نماذج التفكير المنطقي الخاصة بشركة Google، وهو Gemini 2.0 Flash Thinking Experimental. والتقطير هو نفس النهج الذي استخدمه باحثو بيركلي لإنشاء نموذج تفكير منطقي للذكاء الاصطناعي مقابل حوالي 450 دولاراً في الشهر الماضي ، طبقًا لموقع تك كرانش.

قد يبدو الموضوع مثيرا بالنسبة لبعض الناس، إذ قد يتمكن عدد قليل من الباحثين الذين لا يملكون الملايين من الدولارات من الابتكار في مجال الذكاء الاصطناعي. ولكن الجزء الأول يثير تساؤلات حقيقية حول تحويل نماذج الذكاء الاصطناعي إلى سلعة تجارية.

أين تكمن إذا كان بإمكان شخص ما تكرار نموذج بملايين الدولارات عن كثب بمبلغ بسيط نسبيًا؟

ومن غير المستغرب أن مختبرات الذكاء الاصطناعي الكبيرة ليست سعيدة بهذا الموضوع. فقد اتهمت شركة OpenAI شركة DeepSeek بجمع البيانات بصورة غير صحيح من واجهة برمجة التطبيقات الخاصة بها لأغراض استخلاص النماذج .

كان الباحثين خلف s1 يتطلعون إلى إيجاد أبسط نهج لتحقيق أداء قوي في التفكير و”التوسع في وقت الاختبار”، أو السماح لنموذج الذكاء الاصطناعي بالتفكير أشد قبل الإجابة على سؤال.

وكانت هذه عدد من الاختراقات في o1 من OpenAI، والتي حاولت DeepSeek ومختبرات الذكاء الاصطناعي الأخرى تكرارها من أثناء تقنيات مختلفة.

تشير الورقة البحثية s1 إلى أنه يمكن تقطير نماذج التفكير باستخدام مجموعة بيانات صغيرة نسبيًا باستخدام عملية تسمى الضبط الدقيق الخاضع للإشراف (SFT)، حيث يتم توجيه نموذج الذكاء الاصطناعي صراحةً لمحاكاة سلوكيات معينة في مجموعة بيانات.

تميل تقنية SFT إلى أن تكون أرخص من طريقة التعلم التعزيزي واسعة النطاق التي استخدمتها DeepSeek لتدريب منافستها لنموذج o1 الخاص بـ OpenAI، R1.

وتقدم Google إمكانية الوصول المجاني إلى Gemini 2.0 Flash Thinking Experimental، وإن كان ذلك مع حدود سعرية يومية، من خلال منصة Google AI Studio.

ومع ذلك، تحظر شروط جوجل إجراء هندسة عكسية لنماذجها لتطوير خدمات تتنافس مع عروض الذكاء الاصطناعي التي تقدمها الشركة.

يعتمد S1 على نموذج ذكاء اصطناعي صغير جاهز للاستخدام من مختبر الذكاء الاصطناعي الصيني Qwen المملوك لشركة Alibaba، والذي يتوفر للتنزيل مجانًا.

لتدريب s1، أنشأ الباحثين مجموعة بيانات مكونة من 1000 سؤال فحسب تم اختيارها بعناية، مقترنة بإجابات على تلك الأسئلة، بالإضافة إلى عملية “التفكير” خلف جميع إجابة من برنامج Gemini 2.0 Flash Thinking Experimental من Google.

وبعد تدريب s1، والذي استغرق أقل من 30 دقيقة باستخدام 16 وحدة معالجة رسومية من نوع Nvidia H100، حقق s1 أداءً قويًا في معايير الذكاء الاصطناعي المحددة، وفقًا للباحثين. وقال نيكلاس موينجوف، الباحث في جامعة ستانفورد الذي عمل في المشروع، لـ TechCrunch إنه يمكنه استئجار الحوسبة الضرورية هذا اليوم مقابل حوالي 20 دولارًا.

واستخدم الباحثين خدعة ذكية لجعل s1 يعيد التحقق من عمله ويطيل وقت “التفكير”: لقد طلبوا منه الانتظار. ساعدت إضافة كلمة “انتظر” أثناء تفكير s1 النموذج على الوصول إلى إجابات أشد دقة قليلاً، وفقًا للورقة البحثية.

وتخطط Meta وGoogle وMicrosoft لاستثمار مئات المليارات من الدولارات في البنية التحتية للذكاء الاصطناعي ، والتي ستذهب جزئيًا إلى تدريب نماذج الذكاء الاصطناعي من الجيل التالي.

ولكن هذا المستوى من الاستثمار قد يظل ضرورياً لدفع حدود الابتكار في مجال الذكاء الاصطناعي إلى أقصى حد. فقد أثبتت عملية التقطير أنها وسيلة جيدة لإعادة خلق قدرات نموذج الذكاء الاصطناعي بتكلفة زهيدة، ولكنها لا تخلق نماذج ذكاء اصطناعي حديثة أحسن العديد من النماذج المتاحة هذا اليوم.