لماذا الانتشار للنص؟
في حين أن مجتمع أبحاث الذكاء الاصطناعي قد استكشف إنشاء النص القائم على الانتشار لسنوات، إلا أن تطبيقه على النماذج الكبيرة ظل يمثل تحديًا. قامت DiffusionGemma بتغيير هذا من خلال تغيير كيفية استخدام النماذج للأجهزة.
المقايضة بالنماذج التقليدية
تعمل معظم نماذج اللغة مثل الآلة الكاتبة، حيث تولد رمزًا واحدًا في كل مرة من اليسار إلى اليمين. يعد هذا فعالاً في السحابة لأن الخوادم يمكنها تجميع آلاف طلبات المستخدمين معًا لمشاركة تحميل الأجهزة. ولكن عند تشغيلها محليًا لمستخدم واحد، فإن هذه العملية كلمة بكلمة تترك وحدة معالجة الرسومات أو وحدة معالجة الرسومات (TPU) المخصصة لديك غير مستغلة بشكل كافٍ – فهي تقضي معظم وقتها في انتظار “ضغطة المفتاح” التالية.
يقوم DiffusionGemma بعكس عدم الكفاءة هذا. فبدلاً من توقع الكلمات بشكل تسلسلي، يقوم بصياغة فقرة كاملة مكونة من 256 رمزًا في وقت واحد. من خلال إعطاء معالج الكمبيوتر جزءًا أكبر من العمل في وقت واحد، يستخدم DiffusionGemma أجهزتك إلى أقصى إمكاناتها. فهو يقوم بترقية استنتاج النموذج الخاص بك من آلة كاتبة واحدة متسلسلة إلى مطبعة ضخمة تقوم بختم كتلة النص بأكملها في وقت واحد.
