في Reddit AMA، اعترف الرئيس التنفيذي لشركة OpenAI Sam Altman بأن الافتقار إلى القدرة الحاسوبية هو أحد العوامل الرئيسية التي تمنع الشركة من شحن المنتجات بقدر ما تريد.
وكتب ردًا على سؤال حول سبب استغراق نماذج الذكاء الاصطناعي التالية من OpenAI وقتًا طويلاً: “لقد أصبحت كل هذه النماذج معقدة للغاية”. “إننا نواجه أيضًا الكثير من القيود والقرارات الصعبة بشأن تخصيص حوسبةنا للعديد من الأفكار الرائعة.”
تشير العديد من التقارير إلى أن OpenAI كافحت لتأمين بنية تحتية حاسوبية كافية لتشغيل وتدريب نماذجها التوليدية. هذا الأسبوع فقط، قالت رويترز، نقلاً عن مصادر، إن OpenAI تعمل منذ أشهر مع Broadcom لإنشاء شريحة ذكاء اصطناعي لتشغيل النماذج، والتي يمكن أن تصل في أقرب وقت بحلول عام 2026.
وقال ألتمان إنه نتيجة جزئية للقدرة المتوترة، فإن ميزة المحادثة الواقعية التي تقدمها OpenAI لـ ChatGPT، الوضع الصوتي المتقدم، لن يتم طرحها لأول مرة في أبريل في أي وقت قريب. في الحدث الصحفي الذي عقدته في أبريل، أظهرت شركة OpenAI تطبيق ChatGPT وهو يعمل على هاتف ذكي ويستجيب للإشارات المرئية، مثل الملابس التي كان يرتديها شخص ما، على مرأى من كاميرا الهاتف.
كشفت التقارير الواردة من Fortune لاحقًا أن العرض التوضيحي تم التعجيل به لجذب الانتباه بعيدًا عن مؤتمر مطوري Google I / O، والذي كان يعقد في نفس الأسبوع. لم يعتقد الكثيرون داخل OpenAI أن GPT-4o كان جاهزًا للكشف عنه، ومن الواضح أن الإصدار الصوتي فقط من Advanced Voice Mode قد تأخر لعدة أشهر.
في AMA، أشار ألتمان إلى أن الإصدار الرئيسي التالي لمولد الصور الخاص بـ OpenAI، DALL-E، ليس له جدول زمني للإطلاق. (وقال: “ليس لدينا خطة للإصدار بعد”.) وفي الوقت نفسه، تم إعاقة Sora، أداة إنشاء الفيديو التابعة لـ OpenAI، بسبب “الحاجة إلى إتقان النموذج، والحصول على السلامة/انتحال الشخصية/الأشياء الأخرى بشكل صحيح، و كتب كيفن ويل، كبير مسؤولي المنتجات في OpenAI، والذي شارك أيضًا في AMA.
وبحسب ما ورد عانى Sora من انتكاسات فنية جعلته في وضع ضعيف أمام الأنظمة المنافسة من Luma وRunway وغيرهما. وفقًا للمعلومات، استغرق النظام الأصلي، الذي تم الكشف عنه في فبراير، أكثر من 10 دقائق من وقت المعالجة لإنشاء مقطع فيديو مدته دقيقة واحدة.
في أكتوبر، غادر تيم بروكس، أحد القادة المشاركين في مشروع Sora، إلى Google.
لاحقًا في AMA، قال ألتمان إن OpenAI لا تزال تفكر في السماح بمحتوى “NSFW” في ChatGPT “في يوم من الأيام” (“نحن نؤمن تمامًا بمعاملة المستخدمين البالغين مثل البالغين”، كما كتب)، وأن الأولوية القصوى للشركة هي تحسين سلسلة o1 من نماذج “الاستدلال” وخلفاؤها. قامت OpenAI بمعاينة عدد من الميزات القادمة إلى o1 في مؤتمر DevDay الذي عقد في لندن هذا الأسبوع، بما في ذلك فهم الصورة.
كتب ألتمان: “لدينا بعض الإصدارات الجيدة جدًا القادمة في وقت لاحق من هذا العام”. “على الرغم من ذلك، لا يوجد شيء سنسميه GPT-5.”
اكتشاف المزيد من موقع شعاع للمعلوماتية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.