تحصل تطبيقات الرؤية الحاسوبية على دفعة كبيرة من التقدم في الهواتف الذكية جنبًا إلى جنب مع الذكاء الاصطناعي الذي يساعد على سد الفجوات التي لا تستطيع الأجهزة اليومية رؤيتها. باستخدام هذه الأدوات، تعتقد شركة ناشئة من ميونيخ تدعى Beyond Presence أنها تحمل مفاتيح ما سيأتي بعد ذلك: الصور الرمزية شديدة الواقعية التي تبدو تمامًا مثل نظيراتها البشرية ويمكن استخدامها في مواقف المحادثة في الوقت الفعلي.
قالت الشركة الناشئة اليوم إنها جمعت أول تمويل خارجي لها، وهو جولة تمهيدية بقيمة 3.1 مليون دولار من عدد من الداعمين. تتصدر شركة HV Capital الألمانية الجولة، بمشاركة مؤسسي 10x وAlba VC وأفراد من Meta وDeepMind وZalando.
وقال عويس شفيق، الرئيس التنفيذي والمؤسس المشارك للشركة الناشئة، لـ TechCrunch، إن شركة Beyond Presence لم تطلق تقنيتها إلى العالم حتى الآن، لكنها قريبة.
وقال إن جزءًا من رأس المال الجديد سيتم استخدامه لمواصلة تطوير النماذج الأساسية للشركة، وسيقوم البعض بتمويل إصدار النسخة التجريبية العامة بحلول نهاية هذا الشهر.
وحتى الآن، هناك حوالي 300 شركة مدرجة على قائمة الانتظار للمنتج، والذي من المرجح أن يكون له تطبيقات مبكرة في مجالات مثل خدمة العملاء والدعم، والتوظيف، والمبيعات، والتعليم الإلكتروني. كل هذه هي المجالات التي تتطلع فيها الشركات إلى توسيع نطاق التفاعلات مع المستخدمين دون الحاجة إلى توظيف وتدريب المزيد من الأشخاص.
تشرح خلفيات المؤسسين كيف تمكنت الشركة الناشئة من جمع عدة ملايين من الدولارات حتى قبل إطلاق منتجها، ووصلت إلى هذا الحد كشركة ذكاء اصطناعي كثيفة الاستخدام للموارد دون أي تمويل خارجي.
شارك شفيق سابقًا في تأسيس شركة Presize، وهي شركة ناشئة للرؤية الحاسوبية يمكنها أخذ قياسات المستخدمين بدقة عن طريق تسجيل مقطع للمستخدمين وهم يستديرون مرة واحدة أمام كاميرات هواتفهم الذكية. ويمكن بعد ذلك استخدام هذه القياسات للمساعدة في شراء الملابس عبر الإنترنت. كان للشركة الناشئة التي يقع مقرها في ميونيخ مكانة كبيرة في موطنها الأصلي لأن المؤسسين شاركوا في النسخة التلفزيونية الألمانية من “Dragons Den”/”Shark Tank” في عام 2020، حيث جمعوا مبلغًا قياسيًا قدره 650 ألف يورو.
ثم في أبريل 2022، تبين أن Meta قد استحوذت على Presize. على الرغم من أنه لم يتم الكشف عن السعر والتاريخ الدقيق للصفقة، إلا أن بعض الإشارات تشير إلى صفقة كبيرة.
تُظهر الإيداعات اللاحقة لهيئة الأوراق المالية والبورصة أن شركة Meta أنفقت ما بين 774 مليون دولار (من يناير إلى مارس) و1.15 مليار دولار (في الأشهر الستة الأولى من العام) على عمليات الاستحواذ. كانت Presize هي الصفقة الوحيدة التي تم الكشف عنها علنًا في ذلك الوقت. وفي الوقت نفسه، تم تحرير قائمة ويكيبيديا لعمليات الاستحواذ على Meta بتقدير أكثر تواضعًا: 100 مليون دولار.
أخبرت مصادر مطلعة على الأمر موقع TechCrunch أن قيمة الصفقة بالأرقام التسعة الأقل ستكون أكثر دقة من عشرة أرقام، في هذه الحالة.
وبغض النظر عن موقع شركة Presize في هذا النطاق، نظرًا لأن الشركة الناشئة لم تجمع سوى “بضعة ملايين”، وفقًا لتقديرات شفيق، فقد خرج هو وشركاؤه المؤسسون بشكل جيد للغاية.
وقال في مقابلة: “إنه أمر مربح بما فيه الكفاية بحيث لا نضطر إلى العمل”.
(ما زالوا جميعًا يعملون على أي حال. بالإضافة إلى أحدث شركة ناشئة لشفيق، لا يزال المؤسسون المشاركون الآخرون لشركة Presize، ليون سيزيلي وتوميسلاف توموف، في ميتا، يعملون على مشاريع الذكاء الاصطناعي التوليدية. ومع ذلك، يظلون على اتصال مع شفيق: كلاهما: يستثمرون في ما وراء الوجود.)
في جوهره، كان Presize يهدف إلى حل مشكلة رؤية الكمبيوتر الشائكة، وهذا ما يهدف Beyond Presence إلى القيام به أيضًا.
من المسلم به أن أفكاري الأولية حول عرض Beyond Presence كانت متشككة.
الصور الرمزية الرقمية ليست منطقة مجهولة تمامًا. لم يقتصر الأمر على وجودهم منذ عقود فحسب، بل حصلوا على دفعة من الاهتمام في الآونة الأخيرة – وربما بعض الضجيج – مع أحدث الابتكارات في الذكاء الاصطناعي والمعالجة، ناهيك عن الهوس بكل ما يتعلق ببرامج الدردشة الآلية.
لا توجد أيضًا أفكار واضحة حول ما سينجح في مجال الصور الرمزية كعمل تجاري طويل الأمد. بعضها، مثل Hyper وReady Player Me (المدعومين على التوالي من Amazon وA16Z)، يستمدان من ثقافة الألعاب والنظرية القائلة بأن الصور الرمزية يجب أن تكون لا تكون نسخًا واقعية للأشخاص الذين يستخدمونها. أولئك الذين يريدون إخفاء هوياتهم للحفاظ على خصوصيتهم قد يختارون هذه الأساليب بدلاً من تلك التي تكرر تشابههم الدقيق.
آخرون، مثل سينثيسيا، يستطيع خلق التشابه من الناس. ولكنها تتطلب زيارات إلى الاستوديو، وليست أساس المنتج الرئيسي، الذي يستخدم أجهزة متواضعة مثل كاميرات الهاتف لالتقاط تعبيراتك لتشغيل الصور الرمزية التي تفعل ذلك. لا تبدو مثلك.
ويحاول البعض الآخر إنشاء أدوات يمكنك التفاعل معها باستخدام الأجهزة اليومية، بما في ذلك Veed وDeepbrain.
لا يهدف برنامج Beyond Presence إلى إنشاء صورة رمزية يمكن إنشاؤها أثناء التنقل باستخدام هاتفك فحسب، بل أيضًا صورة تشبهك ويمكن استخدامها في مواقف محادثة غير مكتوبة في الوقت الفعلي. شيء يشبه نسخة فيديو من برامج الدردشة النصية التي تقدمها OpenAI وAnthropic وMeta وغيرها الكثير.
الشركة الناشئة ليست الوحيدة في هذا المجال بالطبع. يبدو أن Zoom يعمل على صور رمزية مخصصة شديدة الواقعية، وتقوم CommonGround أيضًا بتطوير شيء على نفس المنوال.
في الوقت الحالي، تركز شركة Beyond Presence على بناء شيء فريد من نوعه في مكون الفيديو الخاص بمنتجها.
تعمل Eleven Labs على تشغيل الجزء الصوتي من التجربة، وGPT الخاص بـ OpenAI هو نموذج الذكاء الاصطناعي التوليدي الذي يعمل على تشغيل المحتوى. يمكن لعملاء الأعمال تغيير النموذج الذي يستخدمونه بمرونة.
“يمكنك أيضًا ترك كل شيء لنا، [or use] أي ماجستير في القانون تريده، أو أي وكيل صوتي تريده. وقال: “ثم نقوم بعمل الوجه فوقه”. وأشار إلى أن هذه الميزة تعالج حقيقة أن عملاء المؤسسات ربما يعملون بالفعل مع موفري خدمات LLM محددين، على سبيل المثال، أو لا يرغبون في مشاركة أي بيانات خاصة خارجيًا.
هناك تفاصيل مثيرة للاهتمام حول قرارات Beyond Presence المبكرة بشأن التمويل: فقد تبين أنه تم قبول الشركة للمشاركة في Y Combinator في وقت سابق من هذا العام، لكنها انسحبت من الحاضنة المرموقة.
على الرغم من أن YC تمنح بالتأكيد إمكانية الوصول إلى شبكات رائعة، إلا أن شفيق ومؤسسه المشارك فيليكس ألتنبرجر (CTO؛ ومتخصص سابق في التعلم العميق في Presize) اختارا عدم التخلي عن المساواة والاستقلالية للوصول إلى ذلك.
في حين أن شركاء YC ربما كان لديهم مدخلاتهم الخاصة حول كيفية تنمية الشركة من خلال المبيعات، إلا أن شفيق قال إنه وألتنبيرجر كان لديهما نهج “أفقي” يريدان اتباعه.
وقال: “أردنا أن نتحرك أكثر بشأن التكنولوجيا الأساسية وطبقة النموذج الأساسي”.
اكتشاف المزيد من موقع شعاع للمعلوماتية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.