أصدرت Meta تطبيقًا “مفتوحًا” لميزة إنشاء البث الصوتي الفيروسية في NotebookLM من Google.
يستخدم المشروع، المسمى NotebookLlama، نماذج Llama الخاصة بشركة Meta في معظم عمليات المعالجة، وهو ما لا يثير الدهشة. مثل NotebookLM، يمكنه إنشاء ملخصات متبادلة على غرار البودكاست للملفات النصية التي تم تحميلها إليه.
يقوم NotebookLlama أولاً بإنشاء نص من ملف – على سبيل المثال ملف PDF لمقال إخباري أو منشور مدونة. ثم يضيف “المزيد من التمثيل الدرامي” والمقاطعات قبل تغذية النص لفتح نماذج تحويل النص إلى كلام.
لا تبدو النتائج جيدة تقريبًا مثل NotebookLM. في عينات NotebookLlama التي استمعت إليها، تتمتع الأصوات بجودة آلية واضحة للغاية، وتميل إلى التحدث مع بعضها البعض في نقاط غريبة.
لكن باحثي ميتا الذين يقفون وراء المشروع يقولون إنه يمكن تحسين الجودة باستخدام نماذج أقوى.
وكتبوا على صفحة GitHub الخاصة بـ NotebookLlama: “إن نموذج تحويل النص إلى كلام هو الحد من مدى طبيعية هذا الأمر”. “[Also,] هناك طريقة أخرى لكتابة البودكاست تتمثل في جعل وكيلين يناقشان الموضوع محل الاهتمام ويكتبان مخطط البودكاست. نستخدم حاليًا نموذجًا واحدًا لكتابة الخطوط العريضة للبودكاست.
NotebookLlama ليست المحاولة الأولى لتكرار ميزة البودكاست الخاصة بـ NotebookLM. حققت بعض المشاريع نجاحًا أكبر من غيرها. لكن لم يتمكن أي منها – ولا حتى NotebookLM نفسه – من حل مشكلة الهلوسة التي تعاني منها الذكاء الاصطناعي. وهذا يعني أن ملفات البودكاست التي ينشئها الذكاء الاصطناعي لا بد أن تحتوي على بعض العناصر المختلقة.
اكتشاف المزيد من موقع شعاع للمعلوماتية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.