البيانات هي كل شيء تقريبًا عندما يتعلق الأمر بتدريب أنظمة الذكاء الاصطناعي، ولكن الوصول إلى ما يكفي من البيانات لإنتاج منتجات عالية الجودة ترقى إلى مستوى وعدها يمثل تحديًا كبيرًا، حتى بالنسبة للشركات التي لديها موارد مالية ثرية.
هذه مشكلة تعمل شركة Advex AI على معالجتها، باستخدام الذكاء الاصطناعي التوليدي والبيانات الاصطناعية “لحل مشكلة البيانات”، على حد تعبير الشركة. وبشكل أكثر تحديدًا، تسمح Advex للعملاء بتدريب أنظمة رؤية الكمبيوتر الخاصة بهم باستخدام عينة صغيرة من الصور، حيث تقوم Advex بإنشاء آلاف الصور “المزيفة” من تلك العينة.
يشير اليوم إلى الإطلاق الرسمي لـ Advex في TechCrunch Disrupt 2024 على مرحلة Startup Battlefield، على الرغم من أنها حصلت بالفعل على عدد قليل من العملاء من خلال مرحلتها التخفي. يتضمن ذلك ما تسميه عملاء المؤسسات السبعة الرئيسيين، الذين تقول إنه ليس من حقهم الكشف عنهم. يمكن لـ TechCrunch أيضًا أن تكشف أن الشركة الناشئة التي يقع مقرها في سان فرانسيسكو قد جمعت 3.6 مليون دولار من التمويل، جاء الجزء الأكبر منها عبر شريحة أولية بقيمة 3.1 مليون دولار في ديسمبر الماضي، مع داعمين بارزين بما في ذلك Construct Capital وPear VC وEmerson Collective من Laurene Powell Jobs.
بدأ الرئيس التنفيذي بيدرو باتشوكا شركة Advex مع المؤسس المشارك لقسم التكنولوجيا قاسم واني منذ أكثر من عام بقليل، ويبلغ عدد موظفي الشركة ستة موظفين. إن حقيقة أن مثل هذه الشركة الناشئة الرشيقة قد دخلت بالفعل إلى الصناعة مع عملاء حقيقيين يدفعون هو أمر جدير بالملاحظة، حيث يعزو باتشوكا بعضًا من هذا على الأقل إلى خلفيته، بالإضافة إلى الشبكات الجيدة القديمة والتواصل البارد. وبالفعل، كان باتشوكا سابقًا باحثًا في مجال التعلم الآلي في بيركلي، ثم انضم لاحقًا إلى فريق البحث في Google Brain قبل اندماجه في DeepMind.
“إذا كان عائد الاستثمار [return on investment] من المنطقي، وأنها سوف [customers] قال باتشوكا: “ثق بنا قليلاً”. “لقد أجريت الكثير من الأبحاث في هذا المجال، ومنحني وجودي في Google Brain من قبل القليل من المصداقية. ولكن في البداية كانت رسائل البريد الإلكتروني باردة، وهذا ما جعلنا أول عميلين كبيرين لدينا. ثم كانت المؤتمرات، ولهذا السبب أذهب إلى الكثير منها!
كان باتشوكا على وشك التوجه إلى أوروبا بعد الانتهاء من مقابلته مع TechCrunch، حيث خطط لحضور اجتماعات ومؤتمرات مختلفة، بما في ذلك المؤتمر الأوروبي حول رؤية الكمبيوتر (ECCV) في ميلانو (إيطاليا) والرؤية في شتوتغارت (ألمانيا).
وقال باتشوكا: “هناك الكثير من المؤتمرات في أوروبا”. وأضاف باتشوكا: “سنذهب إلى ECCV للتعلم والتوظيف بشكل أساسي”. “والرؤية هي أكثر على الجانب الصناعي، لذلك نحن هناك للبيع.”
يشمل العملاء المحتملون المطورين القدامى لأنظمة الرؤية الآلية، على غرار Cognex أو Keyence، الذين يسعون جاهدين لتعزيز منتجاتهم باستخدام ذكاء اصطناعي أفضل. ولكن على الجانب الآخر، قد تبيع Advex مباشرة إلى شركات المستخدم النهائي، مثل شركات تصنيع السيارات أو شركات الخدمات اللوجستية التي تبني أدواتها الداخلية الخاصة.
على سبيل المثال، قد تحتاج شركة تصنيع السيارات إلى تعليم نظام الرؤية الحاسوبية الخاص بها كيفية التعرف على العيوب في مادة مقاعد السيارة الخاصة بها. ومع ذلك، حتى لو تمكنت الشركة من الوصول إلى مئات الصور المميزة، فالحقيقة هي أنه لا يوجد عيبان يبدوان متشابهين. لذا، بدلاً من ذلك، يمكن للشركة المصنعة تحميل عشرات الصور للمقاعد التي تحتوي على تمزقات، مع استقراء Advex من ذلك لإنشاء آلاف صور المقاعد “المعيبة” لبناء مجموعة أكثر شمولاً وتنوعًا من بيانات التدريب.
ويمكن تطبيق الشيء نفسه على أي قطاع تصنيعي تقريبًا، بدءًا من النفط والغاز وحتى الأثاث الخشبي – فالأمر كله يتعلق بتقليل وقت جمع البيانات وتكاليفه عن طريق إنشاء صور تدريبية بشكل مصطنع.
البيانات الاصطناعية ليست مفهومًا جديدًا بالطبع، ولكن مع تقدم ثورة الذكاء الاصطناعي على قدم وساق، تسعى الشركات إلى سد فجوات البيانات – وهذا يشمل مجالات مثل أبحاث السوق، حيث قد تكون عينات المسح صغيرة جدًا، بالإضافة إلى الكمبيوتر الرؤية كما نشهدها مع أمثال Advex، من بين الشركات الناشئة الأخرى المدعومة برأس المال الاستثماري مثل Synthesis AI وParallel Domain.
بشكل عام، هناك نوعان من النماذج التي تتعامل معها Advex. إن النموذج الذي يتم نشره في موقع العميل، وهو النموذج الذي تدربه صور العميل الخاصة، هو مجرد “أشياء مفتوحة المصدر” قياسية جاهزة للاستخدام، كما يقول باتشوكا. وقال: “هذا لأنها يجب أن تكون صغيرة، كما أننا لا نعتقد أن المكاسب تأتي من بنية النموذج – فهي تأتي من التدريب على البيانات الصحيحة”.
لكن الخلطة السرية الحقيقية تكمن في نموذج الانتشار الخاص بالشركة، والذي يشبه شيئًا مثل Midjourney أو Dall-E، وهو ما يُستخدم لإنشاء البيانات الاصطناعية. وأضاف باتشوكا: “هذا الخيار مخصص ومعقد للغاية، وهذا هو المكان الذي نبذل فيه كل جهودنا”.
على الرغم من أن تركيز Advex على التصنيع هو إحدى الطرق التي تميزها، إلا أنه في الواقع نهج نموذج الانتشار حيث ترى الشركة نفسها على أنها متميزة.
بالمقارنة مع تقنيات المحاكاة والنمذجة الأخرى، مثل تلك المتوافقة مع محركات الألعاب/الفيزياء (مثل Unity)، يقول باتشوكا إن استخدام الانتشار يعني عدم الحاجة إلى أي إعداد، ويستغرق الإنشاء ثوانٍ فقط لكل زوج من الصور/الملصقات – بالإضافة إلى أنه أقرب بكثير إلى بيانات واقعية.
وقال باتشوكا: “نحن لا نصنع أي صور فحسب، بل نصنع الصور التي لا تملكها – ونحاول على وجه التحديد فهم ما هو مفقود، وخلق ذلك”. “وهذا الجزء من “ما هو مفقود” صعب حقًا، وهو غير مرئي للغاية، ولكنه أحد أكبر الابتكارات التي قمنا بها.”
اكتشاف المزيد من موقع شعاع للمعلوماتية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.