Firefly، عائلة Adobe من نماذج الذكاء الاصطناعي التوليدية، لا تتمتع بأفضل سمعة بين المبدعين.
تم الاستهزاء بنموذج توليد الصور Firefly على وجه الخصوص باعتباره مخيبًا للآمال ومعيبًا مقارنة بـ Midjourney وDALL-E 3 من OpenAI والمنافسين الآخرين، مع ميل إلى تشويه الأطراف والمناظر الطبيعية وتفويت الفروق الدقيقة في المطالبات. لكن شركة Adobe تحاول تصحيح مسار السفينة من خلال نموذج الجيل الثالث، Firefly Image 3، الذي سيتم إطلاقه هذا الأسبوع خلال مؤتمر Max London للشركة.
النموذج، المتوفر الآن في Photoshop (الإصدار التجريبي) وتطبيق الويب Adobe’s Firefly، ينتج صورًا “واقعية” أكثر من سابقتها (الصورة 2) وسابقتها (الصورة 1) بفضل القدرة على فهم المطالبات والمشاهد الأطول والأكثر تعقيدًا بالإضافة إلى تحسين إمكانات الإضاءة وإنشاء النص. يجب أن يعرض أشياء مثل الطباعة والأيقونات والصور النقطية والفن الخطي بشكل أكثر دقة، كما تقول Adobe، كما أنه أكثر مهارة “بشكل كبير” في تصوير الحشود الكثيفة والأشخاص ذوي “الميزات التفصيلية” و”مجموعة متنوعة من الحالات المزاجية والتعبيرات”.
لما يستحق الأمر، في اختباري غير العلمي الموجز، الصورة 3 يفعل يبدو أنها خطوة للأعلى من الصورة 2.
لم أتمكن من تجربة الصورة 3 بنفسي. لكن Adobe PR أرسل بعض المخرجات والمطالبات من النموذج، وتمكنت من تشغيل نفس تلك المطالبات من خلال الصورة 2 على الويب للحصول على عينات لمقارنة مخرجات الصورة 3 بها. (ضع في اعتبارك أن مخرجات الصورة 3 كان من الممكن أن تكون منتقاة بعناية.)
لاحظ الإضاءة في لقطة الرأس هذه من الصورة 3 مقارنة بالإضاءة الموجودة أسفلها، من الصورة 2:
يبدو إخراج الصورة 3 أكثر تفصيلاً وواقعيًا بالنسبة لعيني، مع التظليل والتباين الغائبين إلى حد كبير عن عينة الصورة 2.
فيما يلي مجموعة من الصور التي توضح فهم مشهد الصورة 3 أثناء اللعب:
لاحظ أن عينة الصورة 2 أساسية إلى حد ما مقارنة بمخرجات الصورة 3 من حيث مستوى التفاصيل والتعبير العام. هناك ارتباك يحدث مع الشخص الموجود في قميص عينة الصورة 3 (حول منطقة الخصر)، ولكن الوضع أكثر تعقيدًا من الشخص الموجود في الصورة 2. (وملابس الصورة 2 أيضًا متباعدة بعض الشيء.)
لا شك أن بعض تحسينات الصورة 3 يمكن إرجاعها إلى مجموعة بيانات تدريب أكبر وأكثر تنوعًا.
مثل الصورة 2 والصورة 1، يتم تدريب الصورة 3 على التحميلات إليها أدوبي Stock، مكتبة وسائط Adobe الخالية من حقوق الملكية، بالإضافة إلى محتوى مرخص ومحتوى عام انتهت صلاحية حقوق الطبع والنشر الخاصة به. ينمو Adobe Stock طوال الوقت، وبالتالي تنمو أيضًا مجموعة بيانات التدريب المتاحة.
في محاولة لتجنب الدعاوى القضائية ووضع نفسها كبديل أكثر “أخلاقية” لموردي الذكاء الاصطناعي المنتجين الذين يتدربون على الصور بشكل عشوائي (مثل OpenAI وMidjourney)، لدى Adobe برنامج للدفع لمساهمي Adobe Stock في مجموعة بيانات التدريب. (سنلاحظ أن شروط البرنامج غامضة إلى حد ما.) ومن المثير للجدل، أن Adobe تقوم أيضًا بتدريب نماذج Firefly على الصور التي يتم إنشاؤها بواسطة الذكاء الاصطناعي، والتي يعتبرها البعض شكلاً من أشكال غسيل البيانات.
كشفت تقارير بلومبرج الأخيرة أن الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي في Adobe Stock لا يتم استبعادها من بيانات تدريب نماذج إنشاء الصور Firefly، وهو احتمال مثير للقلق بالنظر إلى أن تلك الصور قد تحتوي على مواد متقيأة محمية بحقوق الطبع والنشر. دافعت شركة Adobe عن هذه الممارسة، مدعية أن الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي لا تشكل سوى جزء صغير من بيانات التدريب الخاصة بها وتخضع لعملية إشراف للتأكد من أنها لا تصور علامات تجارية أو شخصيات يمكن التعرف عليها أو أسماء فنانين مرجعية.
وبطبيعة الحال، لا تضمن بيانات التدريب المتنوعة أو ذات المصادر “الأخلاقية” ولا مرشحات المحتوى وغيرها من الضمانات تجربة خالية تمامًا من العيوب – راجع إنشاء المستخدمين الناس يقلبون الطير مع الصورة 2. سيأتي الاختبار الحقيقي للصورة 3 بمجرد أن يضع المجتمع يديها عليها.
ميزات جديدة مدعومة بالذكاء الاصطناعي
تعمل الصورة 3 على تشغيل العديد من الميزات الجديدة في Photoshop بما يتجاوز تحويل النص إلى صورة محسّنة.
يسمح “محرك النمط” الجديد في الصورة 3، إلى جانب تبديل النمط التلقائي الجديد، للنموذج بإنشاء مجموعة واسعة من الألوان والخلفيات وأوضاع الموضوع. يتم تغذيتها بالصورة المرجعية، وهو خيار يتيح للمستخدمين تكييف النموذج على الصورة التي يريدون أن يتماشى المحتوى الذي تم إنشاؤه في المستقبل مع ألوانها أو درجاتها.
تعمل ثلاث أدوات إنشاءية جديدة – إنشاء الخلفية وإنشاء تفاصيل مماثلة وتحسينها – على الاستفادة من الصورة 3 لإجراء تعديلات دقيقة على الصور. يستبدل إنشاء الخلفية (الوصفي ذاتيًا) الخلفية بأخرى تم إنشاؤها والتي تمتزج مع الصورة الموجودة، بينما يقدم إنشاء مشابه تنوعات في جزء محدد من الصورة (شخص أو كائن، على سبيل المثال). أما بالنسبة لتحسين التفاصيل، فهو يقوم بضبط الصور لتحسين الحدة والوضوح.
إذا كانت هذه الميزات تبدو مألوفة، فذلك لأنها كانت في مرحلة تجريبية في تطبيق الويب Firefly لمدة شهر على الأقل (وMidjourney لفترة أطول من ذلك بكثير). يمثل هذا ظهورهم الأول في برنامج Photoshop – في مرحلة تجريبية.
عند الحديث عن تطبيق الويب، لا تهمل Adobe هذا الطريق البديل لأدوات الذكاء الاصطناعي الخاصة بها.
بالتزامن مع إصدار الصورة 3، يحصل تطبيق الويب Firefly على مرجع البنية ومرجع النمط، والذي تقدمه Adobe كطرق جديدة “لتعزيز التحكم الإبداعي”. (تم الإعلان عن كليهما في شهر مارس، لكنهما أصبحا الآن متاحين على نطاق واسع.) باستخدام Structure Reference، يمكن للمستخدمين إنشاء صور جديدة تتطابق مع “بنية” الصورة المرجعية – على سبيل المثال، منظر مباشر لسيارة سباق. مرجع النمط هو في الأساس نقل النمط باسم آخر، مع الحفاظ على محتوى الصورة (على سبيل المثال، الأفيال في رحلات السفاري الأفريقية) مع محاكاة النمط (على سبيل المثال، رسم بالقلم الرصاص) للصورة المستهدفة.
إليك مرجع الهيكل قيد التنفيذ:
ومرجع النمط:
لقد سألت Adobe عما إذا كان سعر إنشاء صور Firefly سيتغير مع كل الترقيات. حاليًا، أرخص خطة Firefly المميزة هي 4.99 دولارًا أمريكيًا شهريًا، مما يقوض المنافسة مثل Midjourney (10 دولارات أمريكية شهريًا) وOpenAI (الذي يبواب DALL-E 3 خلف اشتراك ChatGPT Plus بقيمة 20 دولارًا أمريكيًا شهريًا).
وقالت Adobe إن مستوياتها الحالية ستظل سارية في الوقت الحالي، إلى جانب نظام الائتمان التوليدي الخاص بها. وقالت أيضًا إن سياسة التعويض الخاصة بها، والتي تنص على أن Adobe ستدفع مطالبات حقوق الطبع والنشر المتعلقة بالأعمال التي تم إنشاؤها في Firefly، لن تتغير أيضًا، ولن يتغير نهجها في وضع العلامات المائية على المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. سيستمر إرفاق بيانات اعتماد المحتوى – البيانات التعريفية لتحديد الوسائط التي تم إنشاؤها بواسطة الذكاء الاصطناعي – تلقائيًا بجميع أجيال صور Firefly على الويب وفي Photoshop، سواء تم إنشاؤها من الصفر أو تم تحريرها جزئيًا باستخدام الميزات العامة.
اكتشاف المزيد من موقع شعاع للمعلوماتية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.