إذا كنت قد استخدمت بحث ChatGPT أو Perplexity، فأنت تعلم أن القدرة على البحث في الويب والحصول على الاستشهادات مضمنة تعمل على تحسين روبوتات الدردشة المدعومة بالذكاء الاصطناعي بشكل كبير. تكون النتائج أفضل عندما تتضمن معلومات في الوقت المناسب، وقد يؤدي البحث على الويب إلى تقليل ما يسمى بالهلوسة (أي عندما ينتج الذكاء الاصطناعي معلومات غير صحيحة).
لهذا السبب، تقوم شركة Linkup الفرنسية الناشئة ببناء واجهة برمجة تطبيقات تتيح للمطورين الوصول إلى محتوى الويب من مصادر متميزة وموثوقة وتسليم النتائج إلى نموذج لغة كبير (LLM) لإثراء إجاباتها. يسمي العديد من مطوري الذكاء الاصطناعي هذا الجيل من الاسترجاع المعزز لسير العمل (أو RAG).
والأهم من ذلك، أن مستقبل تجريف الروبوتات غير مؤكد. إذا لم تكن هناك اتفاقية مالية موجودة مسبقًا بين ناشري المحتوى والكيانات التي تقوم بجمع صفحات الويب، فإن هذه الروبوتات تقوم برفع المحتوى من الويب المفتوح دون الدفع والعديد من الأشخاص غير راضين عن هذه الصفقة – مما يزيد من التدقيق التنظيمي حول التدريب على الذكاء الاصطناعي.
هناك الآن أيضًا قضايا قانونية رفيعة المستوى في الإطار، مثل الدعوى القضائية الجارية بين OpenAI، الشركة المصنعة لـ ChatGPT، وصحيفة نيويورك تايمز – لذلك قد يتغير الوضع حول استخراج البيانات من الويب في المستقبل القريب. ولهذا السبب قامت OpenAI بتوقيع اتفاقيات ترخيص محتوى متعددة السنوات مع كبار الناشرين مثل AP، وAxel Springer، وCondé Nast، وEl País، وFinancial Times، وLe Monde، وغيرها.
“لقد أنشأنا الشركة في الوقت الذي كانت فيه شركة OpenAI تعقد صفقات مع مصادر الأخبار… لأغراض التدريب أو الاستدلال، لزيادة الإجابات من نماذج OpenAI ومنتجاتها. وقال فيليب مزراحي، المؤسس المشارك والرئيس التنفيذي لشركة Linkup، لـ TechCrunch: “حسنًا، هذا شيء عظيم لأن لدينا أخيرًا شركات ذكاء اصطناعي تدفع لمصادرها”، موضحًا ما دفع المؤسسين إلى إنشاء شركة لربط مطوري الذكاء الاصطناعي مع مقدمي المحتوى – كما نأمل – لمصلحتهم المتبادلة.
في الوقت الحالي، يواجه ناشرو المحتوى قرارًا صعبًا بشأن ما يجب فعله بشأن تعطش GenAI للبيانات. يمكنهم حظر أدوات استخراج بيانات الويب باستخدام ملف البيانات الوصفية robots.txt (غير الملزم قانونًا) (والذي يشير إلى ما إذا كان من الممكن استخدام موقع الويب لتدريب نموذج الذكاء الاصطناعي أم لا). علاوة على ذلك، يمكنهم مقاضاة شركات الذكاء الاصطناعي التي يعتقدون أنها انتهكت حقوق النشر الخاصة بها. وبدلاً من ذلك، يمكنهم السماح للروبوتات بفهرسة محتواها بحرية (أي، YOLO؟). أو قد يكون بمقدورهم ترخيص المحتوى لمطوري الذكاء الاصطناعي للحصول على بعض التعويضات مقابل ملكيتهم الفكرية.
ولكن هناك الآلاف من شركات الذكاء الاصطناعي (أو شركات التكنولوجيا التي تستخدم الذكاء الاصطناعي) التي لا تتمتع بحجم ومدى وصول OpenAI. وفي الوقت نفسه، فإن الشيء الرائع في الويب هو أن هناك سلسلة طويلة من ناشري المحتوى. ولكن هذا يعني أن ناشر المحتوى الصغير عادةً لا يملك الموارد المالية الكافية لرفع دعوى قضائية. وهذا يعني أيضًا أنه سيكون من الصعب التحول من نموذج التجريد إلى نموذج الترخيص لملايين مواقع الويب.
ولهذا السبب فإن Linkup ليس مجرد حل تقني. إنه سوق. وسيط بين ناشري المحتوى والشركات التي ترغب في زيادة إجابات LLM الخاصة بهم بمحتوى الويب.
يقوم Linkup بتوقيع صفقات ترخيص المحتوى مع الناشرين ويتكامل مع نظام إدارة المحتوى (CMS) الخاص بهم حتى يتمكن من جلب المحتوى من الناشرين دون أي استخلاص. يقوم Linkup بعد ذلك بالدفع لشركاء المحتوى بناءً على عدد المرات التي يتم فيها الوصول إلى المحتوى الخاص بهم بواسطة عملاء Linkup.
قال مزراحي: “نحن نستهدف حقًا التطبيقات التي تطبق الذكاء الاصطناعي في منتجاتها الخاصة”. “لذا، فإن حالة الاستخدام النموذجية هي أنني أقوم بإنشاء تطبيق ذكاء اصطناعي باستخدام نموذج من Mistral أو OpenAI. أقوم ببناء خط الأنابيب الخاص بي، ولكنني بحاجة إلى إثراء هذا الخط بالمعلومات الخارجية.
كملاحظة جانبية، بينما يستطيع ChatGPT تصفح الويب، لا تستطيع نماذج GPT ذلك. يوفر OpenAI تطبيقًا شائعًا على نطاق واسع (ChatGPT) وLLMs يمكن للمطورين استخدامه مع واجهة برمجة التطبيقات (GPT). لكن البحث على الويب يعد إحدى ميزات ChatGPT.
“هناك مثال يعجبني، وهو أحد عملائنا… قام ببناء تطبيق داخلي لموظفي المبيعات لديهم”، أخبرنا مزراحي أيضًا. “من ناحية، فقد أدرجوا جميع مزايا منتجاتهم الخاصة. وبفضلنا، يحصلون على معلومات جديدة وعالية الجودة عن آفاقهم ويضعونها في برنامج Mistral LLM. وسوف يقوم برنامج LLM من ميسترال بإنشاء نوع من عروض المبيعات لمندوبي المبيعات، والتي سيكونون أمامهم عندما يقومون بإجراء المكالمات مع العملاء المحتملين.
في البداية، قررت Linkup التركيز على معلومات الشركات والأعمال. بالإضافة إلى المواقع الإخبارية، تعمل الشركة الناشئة مع قواعد بيانات المعرفة – فكر في Statista أو Xerfi أو موارد أخرى في نفس السياق.
إنها ليست الشركة الناشئة الوحيدة التي تعمل على تقديم محتوى متميز إلى LLMs من خلال عقود ترخيص خلف الكواليس. المنافس الأكثر وضوحًا هو ScalePost، وهي شركة ناشئة تعمل مع Perplexity لتسريع صفقات الترخيص مع الناشرين.
جمعت Linkup جولة تأسيسية بقيمة 3 ملايين يورو (3.2 مليون دولار بأسعار الصرف الحالية) قبل بضعة أشهر من Axeleo Capital وMotier Ventures وSeedcamp ومائة من المستثمرين الملائكة. يوجد حوالي 10 أشخاص يعملون في الشركة الناشئة في الوقت الحالي، وتخطط لتوظيف 10 موظفين آخرين خلال العام المقبل.
اكتشاف المزيد من موقع شعاع للمعلوماتية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.