بعد سلسلة من الجدل الناشئ عن العوائق الفنية وتغييرات الترخيص، أعلنت شركة Stability AI الناشئة عن الذكاء الاصطناعي عن أحدث مجموعة من نماذج توليد الصور.
تعد سلسلة Stable Diffusion 3.5 الجديدة أكثر قابلية للتخصيص وتنوعًا من تقنية الجيل السابق من Stability، كما تدعي الشركة – فضلاً عن أنها أكثر أداء. هناك ثلاثة نماذج في المجموع:
- انتشار مستقر 3.5 كبير: مع 8 مليار معلمة، فهو أقوى نموذج، قادر على توليد صور بدقة تصل إلى 1 ميجابكسل. (تتوافق المعلمات تقريبًا مع مهارات حل المشكلات الخاصة بالنموذج، والنماذج التي تحتوي على معلمات أكثر تؤدي عمومًا أداءً أفضل من تلك التي تحتوي على عدد أقل.)
- انتشار مستقر 3.5 توربو كبير: نسخة مقطرة من Stable Diffusion 3.5 Large التي تولد الصور بسرعة أكبر، على حساب بعض الجودة.
- انتشار مستقر 3.5 متوسط: نموذج مُحسّن للتشغيل على الأجهزة المتطورة مثل الهواتف الذكية وأجهزة الكمبيوتر المحمولة، وهو قادر على إنشاء صور تتراوح دقتها من 0.25 إلى 2 ميجابكسل.
بينما يتوفر Stable Diffusion 3.5 Large و3.5 Large Turbo اليوم، لن يتم إصدار 3.5 Medium حتى 29 أكتوبر.
يقول الاستقرار أن نماذج Stable Diffusion 3.5 يجب أن تولد مخرجات أكثر “تنوعًا” – أي صورًا تصور أشخاصًا ذوي ألوان وملامح بشرة مختلفة – دون الحاجة إلى حث “شامل”.
قال هانو باس، كبير مسؤولي التكنولوجيا في Stability، لـ TechCrunch في مقابلة: “أثناء التدريب، يتم تعليق كل صورة بإصدارات متعددة من المطالبات، مع إعطاء الأولوية للمطالبات الأقصر”. “وهذا يضمن توزيعًا أوسع وأكثر تنوعًا لمفاهيم الصور لأي وصف نصي محدد. مثل معظم شركات الذكاء الاصطناعي المنتجة، نقوم بالتدريب على مجموعة واسعة من البيانات، بما في ذلك مجموعات البيانات المفلترة المتاحة للجمهور والبيانات الاصطناعية.
قامت بعض الشركات ببناء هذه الأنواع من الميزات “المتنوعة” في مولدات الصور في الماضي، مما أثار احتجاجات على وسائل التواصل الاجتماعي. على سبيل المثال، يُظهِر إصدار قديم من برنامج Gemini chatbot التابع لشركة جوجل مجموعة من الشخصيات التي عفا عليها الزمن لمطالبات تاريخية مثل “الفيلق الروماني” أو “أعضاء مجلس الشيوخ الأمريكي”. اضطرت شركة Google إلى إيقاف إنشاء صور الأشخاص مؤقتًا لمدة ستة أشهر تقريبًا أثناء تطوير الإصلاح.
مع القليل من الحظ، سيكون نهج الاستقرار أكثر تفكيرًا من الآخرين. لا يمكننا إعطاء انطباعات، للأسف، لأن الاستقرار لم يوفر الوصول المبكر.
تم انتقاد منشئ الصور الرئيسي السابق لـ Stability، Stable Diffusion 3 Medium، بشدة بسبب أعماله الفنية الغريبة وضعف التزامه بالمطالبات. وتحذر الشركة من أن نماذج Stable Diffusion 3.5 قد تعاني من أخطاء مطالبة مماثلة؛ فهو يلقي باللوم على المقايضات الهندسية والمعمارية. لكن الاستقرار يؤكد أيضًا أن النماذج أكثر قوة من سابقاتها في توليد الصور عبر مجموعة من الأنماط المختلفة، بما في ذلك الفن ثلاثي الأبعاد.
كتب Stability في منشور مدونة تمت مشاركته مع TechCrunch: “قد يحدث تباين أكبر في المخرجات من نفس الموجه مع بذور مختلفة، وهو أمر مقصود لأنه يساعد في الحفاظ على قاعدة معرفية أوسع وأنماط متنوعة في النماذج الأساسية”. “ومع ذلك، ونتيجة لذلك، فإن المحفزات التي تفتقر إلى التحديد قد تؤدي إلى زيادة عدم اليقين في المخرجات، وقد يختلف المستوى الجمالي.”
الشيء الوحيد الذي لم يتغير مع النماذج الجديدة هو تراخيص الاستقرار.
كما هو الحال مع نماذج Stability السابقة، يمكن استخدام النماذج في سلسلة Stable Diffusion 3.5 مجانًا لأغراض “غير تجارية”، بما في ذلك البحث. يمكن للشركات التي تقل إيراداتها السنوية عن مليون دولار أن تقوم أيضًا بتسويقها دون أي تكلفة. ومع ذلك، يتعين على المؤسسات التي تزيد إيراداتها عن مليون دولار أن تتعاقد مع شركة Stability للحصول على ترخيص مؤسسي.
وقد أثار الاستقرار ضجة هذا الصيف بسبب شروط الضبط الدقيق التقييدية، التي أعطت (أو على الأقل بدا أنها تمنح) الشركة الحق في استخلاص رسوم للنماذج المدربة على الصور من مولدات الصور الخاصة بها. ردًا على رد الفعل العكسي، قامت الشركة بتعديل شروطها للسماح باستخدام تجاري أكثر ليبرالية. أكد الاستقرار مجددًا اليوم أن المستخدمين يمتلكون الوسائط التي ينشئونها باستخدام نماذج الاستقرار.
وقالت آنا جيلين، نائبة رئيس التسويق والاتصالات في شركة Stability، في بيان عبر البريد الإلكتروني: “نحن نشجع المبدعين على توزيع أعمالهم وتحقيق الدخل منها عبر المسار بأكمله، طالما أنهم يقدمون نسخة من ترخيص مجتمعنا لمستخدمي تلك البرامج”. الإبداعات وعرض “مدعوم من Stability AI” بشكل بارز على مواقع الويب ذات الصلة أو واجهات المستخدم أو منشورات المدونات أو الصفحات حول أو وثائق المنتج.
يمكن استضافة Stable Diffusion 3.5 Large وDiffusion 3.5 Large Turbo ذاتيًا أو استخدامه عبر واجهة برمجة تطبيقات Stability ومنصات الطرف الثالث بما في ذلك Hugging Face وFireworks وReplicate وComfyUI. تقول شركة Stability إنها تخطط لإصدار ControlNets للنماذج، والتي تسمح بالضبط الدقيق، في الأيام القليلة المقبلة.
يتم تدريب نماذج الاستقرار، مثل معظم نماذج الذكاء الاصطناعي، على بيانات الويب العامة – والتي قد يكون بعضها محميًا بحقوق الطبع والنشر أو بموجب ترخيص مقيد. يجادل الاستقرار والعديد من بائعي الذكاء الاصطناعي الآخرين بأن مبدأ الاستخدام العادل يحميهم من مطالبات حقوق الطبع والنشر. لكن هذا لم يمنع أصحاب البيانات من رفع عدد متزايد من الدعاوى القضائية الجماعية.
يترك الاستقرار للعملاء الدفاع عن أنفسهم ضد مطالبات حقوق الطبع والنشر، وعلى عكس بعض البائعين الآخرين، لا يوجد لديه أي خصم للدفع في حالة ثبوت مسؤوليته.
استقرار يفعل ومع ذلك، تسمح لأصحاب البيانات بطلب إزالة بياناتهم من مجموعات بيانات التدريب الخاصة بهم. اعتبارًا من مارس 2023، أزال الفنانون 80 مليون صورة من بيانات تدريب Stable Diffusion، وفقًا للشركة.
وردًا على سؤال حول تدابير السلامة المتعلقة بالمعلومات المضللة في ضوء الانتخابات العامة الأمريكية المقبلة، قالت Stability إنها “اتخذت – ولا تزال تتخذ – خطوات معقولة لمنع إساءة استخدام Stable Diffusion من قبل الجهات الفاعلة السيئة”. ومع ذلك، رفضت الشركة الناشئة تقديم تفاصيل فنية محددة حول هذه الخطوات.
اعتبارًا من شهر مارس، حظرت شركة Stability فقط المحتوى “المضلل” الصريح الذي تم إنشاؤه باستخدام أدوات الذكاء الاصطناعي التوليدية الخاصة بها – وليس المحتوى الذي يمكن أن يؤثر على الانتخابات، أو يضر بنزاهة الانتخابات، أو الذي يضم سياسيين وشخصيات عامة.
لدى TechCrunch رسالة إخبارية تركز على الذكاء الاصطناعي! قم بالتسجيل هنا للحصول عليه في بريدك الوارد كل يوم أربعاء.
اكتشاف المزيد من موقع شعاع للمعلوماتية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.