تحقيق يظهر أن شركات التكنولوجيا دربت الذكاء الاصطناعي على نصوص يوتيوب

ديب لاب

ديب لاب

Moderator
مشـــرف
17 ديسمبر 2023
1,579
4
36
Ai trained youtube video transcripts featured

الذكاء الاصطناعي ليس سحريًا، بل إنه موجود في الاسم: “اصطناعي”. نحن نعلم أن المحتوى نشأ من مكان ما. أظهر تحقيق أن بعض الأسماء الكبيرة في مجال التكنولوجيا، بما في ذلك شركة Apple، دربت تقنية الذكاء الاصطناعي الخاصة بها على نصوص من مقاطع فيديو YouTube – كل ذلك دون إذن.

تحقيق يظهر استخدام نصوص يوتيوب​


أجرى موقع Proof News تحقيقًا شمل أداة بحث للبحث عن YouTube في مجموعة البيانات.
من فضلك قم , تسجيل الدخول أو تسجيل لعرض المحتوى
أن شركات التكنولوجيا استخدمت ترجمات من حوالي 175 ألف مقطع فيديو على يوتيوب من أكثر من 48 ألف قناة.

وتضمنت مقاطع الفيديو المستخدمة حلقات تلفزيونية في وقت متأخر من الليل من العرض المتأخر مع ستيفن كولبير و جيمي كيميل مباشركما ظهرت في التحقيق مقاطع فيديو لـ MrBeast وPewDiePie وMarques Brownlee.

جاءت مجموعة البيانات من “الكومة”. في عام 2020، تم وصف الكومة بأنها مزيج من 22 مجموعة بيانات من EleutherAI، وهي منظمة غير ربحية.

قال متحدث باسم جوجل في رسالة بالبريد الإلكتروني إلى CNET إن الشركة تتمسك بما قالته سابقًا، وذلك في تعليق يعود إلى شهر أبريل. قال الرئيس التنفيذي نيل موهان في ذلك الوقت إنه لا يعرف ما إذا كانت OpenAI تستخدم مقاطع فيديو YouTube. ولكن إذا فعلت ذلك، فقد أدرك أن ذلك سيكون انتهاكًا لشروط خدمة YouTube.

من أين يأتي محتوى الذكاء الاصطناعي أيضًا؟​


أعلنت كل شركة تقنية تقريبًا مؤخرًا أنها تعمل على تطوير أو طورت نظام ذكاء اصطناعي. وكما ذكرنا في البداية، فإننا نعلم أن هذا ليس سحرًا وأن المحتوى يأتي من مكان ما. ولكن لم يكن من المتوقع أن يأتي الذكاء الاصطناعي من نصوص يوتيوب.

ذكرت شركة OpenAI، مبتكرو ChatGPT، سابقًا أنه أصبح من الصعب العثور على مجموعات بيانات لتدريب الذكاء الاصطناعي، مما دفعها إلى عقد صفقات مع Reddit وNews Corp. للحصول على محتواها. قالت Google إنها لديها اتفاقية مع منشئي المحتوى تسمح لها باستخدام محتوى YouTube في تدريب الذكاء الاصطناعي. تمت إضافة نظرة عامة على الذكاء الاصطناعي مؤخرًا إلى بحث Google. تعرف على كيفية إيقاف تشغيل نظرة عامة على الذكاء الاصطناعي إذا لم تكن تحبها.

ومع ذلك، اعترف متحدث باسم شركة Anthropic لـ Proof News بأنها استخدمت Pile لتدريب Claude، مساعد الذكاء الاصطناعي الخاص بها. كما اعترف المتحدث أيضًا بوجود بعض ترجمات YouTube في Pile.

سواء كنت تستخدم Claude أو ChatGPT أو أي تقنية ذكاء اصطناعي أخرى، فقد تم تدريبها على مجموعة بيانات. والسؤال هو ما إذا كان تم تدريبها على مقدمي محتوى راغبين، مثل Reddit، أو ما إذا كان البحث عن مقدمي المحتوى قد توسع ليشمل المحتوى الذي تم استخدامه دون علم المبدعين. إنه بالتأكيد شيء يجب أن تفكر فيه في المرة القادمة التي تستخدم فيها روبوت محادثة يعمل بالذكاء الاصطناعي.