يسعى أحد منشئي المحتوى على YouTube إلى رفع دعوى قضائية جماعية ضد OpenAI، مدعيًا أن الشركة قامت بتدريب نماذج الذكاء الاصطناعي التوليدية الخاصة بها على ملايين النصوص من مقاطع فيديو YouTube دون إخطار أصحاب مقاطع الفيديو أو تعويضهم.
في شكوى تم تقديمها يوم الجمعة الماضي في المحكمة الجزئية الأمريكية للمنطقة الشمالية من كاليفورنيا، زعم محامو ديفيد ميليت، وهو مستخدم يوتيوب مقيم في ماساتشوستس، أن OpenAI قامت خلسة بنسخ مقاطع فيديو ميليت ومبدعين آخرين لتدريب النماذج التي تدعم الذكاء الاصطناعي للشركة. منصة chatbot المدعومة وChatGPT وأدوات ومنتجات الذكاء الاصطناعي الأخرى. من خلال جمع هذه البيانات، استفادت OpenAI بشكل كبير من عمل المبدعين، كما تزعم الشكوى، مع انتهاك قانون حقوق الطبع والنشر وشروط خدمة YouTube التي تحظر استخدام مقاطع الفيديو لتطبيقات مستقلة عن خدمتها.
“مثل [OpenAI’s] أصبحت منتجات الذكاء الاصطناعي أكثر تطورًا من خلال استخدام مجموعات بيانات التدريب، وأصبحت أكثر قيمة للمستخدمين المحتملين والحاليين، الذين يشترون اشتراكات للوصول. [OpenAI’s] وجاء في الشكوى: “منتجات الذكاء الاصطناعي”. “ومع ذلك، فإن الكثير من المواد الموجودة في مجموعات بيانات التدريب الخاصة بـ OpenAI تأتي من أعمال تم نسخها بواسطة OpenAI دون موافقة، ودون رصيد، ودون تعويض.”
تسعى شركة Millette، التي تمثلها شركة المحاماة Bursor and Fisher، إلى الحصول على محاكمة أمام هيئة محلفين وتعويضات تزيد عن 5 ملايين دولار لجميع مستخدمي YouTube الذين ربما تم مسح بياناتهم في تدريب OpenAI.
نماذج الذكاء الاصطناعي التوليدية مثل OpenAI لا تتمتع بذكاء حقيقي. وبتغذية عدد هائل من الأمثلة (مثل الأفلام والتسجيلات الصوتية والمقالات وما إلى ذلك)، “تتعلم” النماذج مدى احتمالية ظهور البيانات بناءً على الأنماط، بما في ذلك سياق أي بيانات محيطة.
يتم تدريب معظم النماذج على البيانات المستمدة من مواقع الويب العامة ومجموعات البيانات الموجودة على الويب. تجادل الشركات بأن الاستخدام العادل يحمي جهودها الرامية إلى استخراج البيانات بشكل عشوائي واستخدامها لتدريب النماذج التجارية. ومع ذلك، فإن العديد من أصحاب حقوق الطبع والنشر لا يوافقون على ذلك – ويقومون برفع دعاوى تهدف إلى وقف هذه الممارسة.
أصبحت عمليات نسخ الفيديو مكونًا رئيسيًا لبيانات التدريب مع نضوب آبار البيانات الأخرى، إذا جاز التعبير.
أكثر من 35% من أفضل 1000 موقع ويب في العالم تحظر الآن زاحف الويب الخاص بـ OpenAI، وفقًا لبيانات من Originality.AI. وقد وجدت دراسة أجرتها مبادرة مصدر البيانات التابعة لمعهد ماساتشوستس للتكنولوجيا أن حوالي 25% من البيانات الواردة من مصادر “عالية الجودة” تم تقييدها من مجموعات البيانات الرئيسية المستخدمة لتدريب نماذج الذكاء الاصطناعي. إذا استمر الاتجاه الحالي لحظر الوصول، تتوقع مجموعة الأبحاث Epoch AI أن المطورين سوف ينفد منهم البيانات اللازمة لتدريب نماذج الذكاء الاصطناعي التوليدية بين عامي 2026 و2032.
في أبريل، ذكرت صحيفة نيويورك تايمز أن OpenAI أنشأت أول نموذج للتعرف على الكلام، Whisper، بغرض نسخ الصوت من مقاطع الفيديو لجمع بيانات تدريب إضافية. قام فريق OpenAI الذي ضم رئيس الشركة، جريج بروكمان، بنسخ أكثر من مليون ساعة من الفيديو من يوتيوب باستخدام Whisper، وفقًا لصحيفة التايمز، واستخدم النصوص لتدريب نموذج OpenAI لإنشاء النصوص وتحليلها GPT-4.
ناقش بعض موظفي OpenAI كيف يمكن أن تتعارض هذه الخطوة مع قواعد يوتيوب، وفقًا لصحيفة التايمز.
في يوليو، ذكرت Proof News أن الشركات بما في ذلك Anthropic وApple وSalesforce وNvidia استخدمت مجموعة بيانات تسمى The Pile، والتي تحتوي على ترجمات لمئات الآلاف من مقاطع الفيديو على YouTube، لتدريب نماذج الذكاء الاصطناعي التوليدية. لم يكن العديد من منشئي المحتوى على YouTube الذين ظهرت ترجماتهم في The Pile على علم بذلك ولم يوافقوا عليه؛ أصدرت شركة Apple لاحقًا بيانًا قالت فيه إنها لا تنوي استخدام هذه النماذج لتشغيل أي ميزات الذكاء الاصطناعي في منتجاتها.
كما سعت جوجل، الشركة الأم لموقع يوتيوب، إلى استخدام النصوص لتدريب نماذجها.
في العام الماضي، قامت جوجل بتوسيع شروط الخدمة (ToS) جزئيًا للسماح للشركة بالاستفادة من المزيد من بيانات المستخدم للتدريب على نماذج الذكاء الاصطناعي. وبموجب شروط الخدمة القديمة، لم يكن من الواضح ما إذا كان بإمكان جوجل استخدام بيانات يوتيوب لإنشاء منتجات خارج منصة الفيديو. لكن الأمر ليس كذلك في ظل الشروط الجديدة، التي تخفف القيود إلى حد كبير.
لقد تواصلنا مع OpenAI وGoogle للتعليق على الدعوى الجماعية وسنقوم بتحديث هذه القطعة إذا استجابوا.
لقد كانت بداية صعبة لهذا الشهر بالنسبة لـ OpenAI.
رفع الرئيس التنفيذي لشركة Tesla and X Elon Musk يوم الاثنين دعوى جديدة ضد OpenAI والرئيس التنفيذي Sam Altman متهمًا الشركة بالتخلي عن مهمتها الأصلية غير الربحية من خلال الاحتفاظ ببعض تقنياتها الأكثر تطوراً للعملاء التجاريين. قدم Musk نفس الادعاءات في دعوى قضائية رفعها في فبراير ضد OpenAI، لكن الدعوى الجديدة تزعم أن OpenAI منخرطة في نشاط ابتزاز أيضًا.
اكتشاف المزيد من موقع شعاع للمعلوماتية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.