اپل، آمازون و OpenAI به استخراج غیرقانونی میلیونها ویدیوی یوتیوب متهم شدند
براساس یک دادخواست حقوقی جدید، شرکت اپل متهم است که از مجموعهای شامل میلیونها ویدیوی یوتیوب برای آموزش مدل هوش مصنوعی خود استفاده کرده؛ موضوعی که ردپای آن در یک مقالهی تحقیقاتی منتشرشده در اواخر سال ۲۰۲۴ نیز دیده میشود.
بهگزارش وبسایت مکرومرز، در دادخواست گروهی علیه اپل که از سوی تد اینترتینمنت، مت فیشر و گلفهولیکس تنظیم شده، ادعا شده که اپل برای دانلود میلیونها ویدیو، سیستمهای محافظتی و ضداستخراج یوتیوب را دور زده است.
طبق اسناد موجود در پرونده، تیمی از پژوهشگران اپل پیشتر مقالهای با عنوان «STIV: تولید ویدیوی مقیاسپذیر مشروط به متن و تصویر» منتشر کرده بودند. آنها در این مقاله صراحتا اعلام کردند که برای آموزش مدل تولید ویدیوی خود، از دیتاستی به نام Panda-70M استفاده کردهاند.
در متن دادخواست، مکانیزم دیتاست Panda-70M اینگونه تشریح شده است:
«دیتاست Panda 70M مانند یک نقشه یا فایلایندکس عمل کرده و ویدیوهای خاص یوتیوب را از طریق آدرس اینترنتی، شناسهی ویدیو و زمانبندی مشخص میکند. یک ویدیوی واحد یوتیوب ممکن است به چندین کلیپ تقسیم شود که هر کدام بهعنوان یک نمونهی آموزشی مجزا [برای تعلیم AI] در نظر گرفته میشوند. استخراج هر کلیپ نیازمند دسترسی مستقل به ویدیوی منبع در یوتیوب و جداسازی بخش تعیینشده است؛ فرآیندی که برای دریافت هر کلیپ، یک اقدام مجزا برای دور زدن سیستمهای امنیتی محسوب میشود.»
شاکیان ادعا میکنند که محتوای متعلق به آنها بیش از ۵۰۰ بار در دیتاست Panda 70M ظاهر شده است و اکنون قصد دارند بهنمایندگی از «تمام افراد در شرایط مشابه»، شکایت گروهی را پیش ببرند. آنها چنین استدلال میکنند که اگرچه دیتاست پاندا تنها لینک ویدیوها را ارائه میدهد؛ اما اپل برای دانلود و استفاده از محتوای اصلی جهت آموزش هوش مصنوعی خود، بهطور غیرقانونی محدودیتهای یوتیوب را دور زده است.
شاکیان خواستار برگزاری دادگاه با حضور هیئت منصفه شده و مطالبات صریح زیر را مطرح کردهاند:
- تأیید پرونده بهعنوان یک «شکایت گروهی» و تعیین شاکیان و وکلای آنها بهعنوان نمایندگان قانونی این گروه؛
- اعلام رسمی دادگاه مبنیبر اینکه اپل بهطور عمدی سیستمهای حفاظت از کپیرایت یوتیوب را دور زده است؛
- دریافت غرامتهای قانونی تا حداکثر میزان مجاز برای هر تخلف، صدور حکم توقف فعالیت و پرداخت هزینههای دادرسی براساس بند ۱۲۰۳ از عنوان ۱۷ قوانین فدرال؛
- صدور احکام پیشگیرانه و دائمی براساس عناوین ۱۷ و ۲۸ برای توقف استفادهی اپل و تمامی عوامل، کارمندان و شرکای آن از محتوای دارای حق کپیرایت شاکیان و جلوگیری از هرگونه ترویج، تسهیل یا مشارکت در نقض این حقوق؛
- صدور حکم برای پرداخت بهره قبلاز صدور حکم و بهره پساز صدور حکم تا حداکثر حد ممکن، نسبت به هر مبلغ مالی که در حکم علیه اپل تعیین شود؛
- و هرگونه حکم و دستور اضافی دیگری که دادگاه آن را عادلانه و مناسب تشخیص دهد.
بحران حقوقی اخیر تنها گریبانگیر اپل نیست؛ شاکیان پرونده، دادخواستهای گروهی مشابهی را نیز علیه آمازون و OpenAI تنظیم کردهاند. آنها مدعی هستند که این دو شرکت نیز در فرآیند آموزش مدلهای هوش مصنوعی اختصاصی خود، از دیتاست Panda-70M و با روشهای مشابه استفاده کردهاند. پیامد این دادگاهها میتواند تأثیری عمیق بر نحوهی جمعآوری داده توسط غولهای هوش مصنوعی در آینده داشته باشد.