تطلق Ai2 نماذج لغة جديدة تنافس لغة Meta’s Llama

هناك عائلة جديدة من نماذج الذكاء الاصطناعي، وهي واحدة من النماذج القليلة التي يمكن إعادة إنتاجها من الصفر.

في يوم الثلاثاء، أصدرت Ai2، وهي منظمة أبحاث الذكاء الاصطناعي غير الربحية التي أسسها الراحل بول ألين، OLMo 2، وهي العائلة الثانية من النماذج في سلسلة OLMo الخاصة بها. (اختصار OLMo لـ “نموذج اللغة المفتوحة”.) على الرغم من عدم وجود نقص في نماذج اللغة “المفتوحة” للاختيار من بينها (انظر: Meta’s Llama)، فإن OLMo 2 يلبي تعريف مبادرة المصدر المفتوح للذكاء الاصطناعي مفتوح المصدر، مما يعني الأدوات والبيانات المستخدمة. لتطويره متاحة للجمهور.

قامت مبادرة المصدر المفتوح، وهي مؤسسة طويلة الأمد تهدف إلى تعريف و”الإشراف” على كل ما هو مفتوح المصدر، بوضع اللمسات الأخيرة على تعريف الذكاء الاصطناعي مفتوح المصدر في أكتوبر. لكن نماذج OLMo الأولى، التي تم إصدارها في فبراير، استوفت هذا المعيار أيضًا.

“أولمو 2 [was] “تم تطويره من البداية إلى النهاية ببيانات تدريب مفتوحة ويمكن الوصول إليها، وكود تدريب مفتوح المصدر، ووصفات تدريب قابلة للتكرار، وتقييمات شفافة، ونقاط تفتيش وسيطة، والمزيد”، كتب AI2 في منشور بالمدونة. “من خلال المشاركة العلنية لبياناتنا ووصفاتنا ونتائجنا، نأمل أن نزود مجتمع المصادر المفتوحة بالموارد اللازمة لاكتشاف أساليب جديدة ومبتكرة.”

يوجد نموذجان في عائلة OLMo 2: أحدهما يحتوي على 7 مليار معلمة (OLMo 7B) والآخر يحتوي على 13 مليار معلمة (OLMo 13B). تتوافق المعلمات تقريبًا مع مهارات حل المشكلات الخاصة بالنموذج، والنماذج التي تحتوي على معلمات أكثر تؤدي عمومًا أداءً أفضل من تلك التي تحتوي على معلمات أقل.

مثل معظم نماذج اللغات، يمكن لـ OLMo 2 7B و13B تنفيذ مجموعة من المهام النصية، مثل الإجابة على الأسئلة وتلخيص المستندات وكتابة التعليمات البرمجية.

لتدريب النماذج، استخدم Ai2 مجموعة بيانات مكونة من 5 تريليون رمز. تمثل الرموز أجزاء من البيانات الأولية؛ 1 مليون رمز يساوي حوالي 750.000 كلمة. تضمنت مجموعة التدريب مواقع ويب “تمت تصفيتها للحصول على جودة عالية”، وأوراق أكاديمية، ولوحات مناقشة للأسئلة والأجوبة، وكتب تمارين رياضية “سواء اصطناعية أو بشرية”.

تدعي Ai2 أن النتيجة هي نماذج تنافسية، من حيث الأداء، مع نماذج مفتوحة مثل إصدار Meta’s Llama 3.1.

اعتمادات الصورة:Ai2

كتب Ai2: “لم نلاحظ فقط تحسنًا كبيرًا في الأداء في جميع المهام مقارنةً بنموذج OLMo السابق، ولكن من الجدير بالذكر أن OLMo 2 7B يتفوق على LLama 3.1 8B”. “أولمو 2 [represents] أفضل نماذج اللغات المفتوحة بالكامل حتى الآن.”

يمكن تنزيل نماذج OLMo 2 وجميع مكوناتها من موقع Ai2 الإلكتروني. وهي تخضع لترخيص Apache 2.0، مما يعني أنه يمكن استخدامها تجاريًا.

كان هناك بعض الجدل مؤخرًا حول سلامة النماذج المفتوحة، حيث يقال إن الباحثين الصينيين يستخدمون نماذج اللاما لتطوير أدوات دفاعية. عندما سألت ديرك جرونفيلد، مهندس Ai2، في فبراير/شباط الماضي، عما إذا كان يشعر بالقلق إزاء إساءة استخدام OLMo، أخبرني أنه يعتقد أن الفوائد تفوق الأضرار في نهاية المطاف.

وقال: “نعم، من المحتمل أن يتم استخدام النماذج المفتوحة بشكل غير لائق أو لأغراض غير مقصودة”. “[However, this] كما يعزز النهج التقدم التقني الذي يؤدي إلى المزيد من النماذج الأخلاقية؛ يعد شرطًا أساسيًا للتحقق وإمكانية التكرار، حيث لا يمكن تحقيق ذلك إلا من خلال الوصول إلى المجموعة الكاملة؛ ويقلل التركيز المتزايد للسلطة، مما يخلق وصولاً أكثر إنصافًا.