اتهام استفاده غیرمجاز OpenAI از کتاب‌های پولی OReilly

0 120 خواندن این مطلب 3 دقیقه زمان میبرد

ادعای تازه علیه OpenAI: استفاده از کتاب‌های پولی بدون اجازه؟

در تازه‌ترین حاشیه پیرامون هوش مصنوعی، برخی محققان ادعا کرده‌اند که OpenAI، سازنده مدل‌های معروفی مثل ChatGPT، ممکن است برای آموزش مدل‌های خود از محتوای کتاب‌های پولی O’Reilly Media بدون اجازه استفاده کرده باشد. این موضوع نگرانی‌هایی را درباره‌ی نقض کپی‌رایت و حقوق ناشران در دوران رشد شتاب‌زده فناوری هوش مصنوعی ایجاد کرده است. همچنین این اتفاق بحث‌های جدیدی را پیرامون شفافیت در فرآیند آموزش مدل‌های زبان بزرگ (LLM) به‌وجود آورده است.

شائبه استفاده از منابع دارای حقوق کپی‌رایت

بر اساس تحقیقاتی که اخیراً منتشر شده، برخی از پژوهشگران با بررسی خروجی‌های مدل‌های زبانی توسعه‌داده‌شده توسط OpenAI متوجه شباهت‌های زیادی میان محتوای این مدل‌ها و کتاب‌های فنی منتشرشده توسط O’Reilly شده‌اند. به گفته آن‌ها، این مدل‌ها توانسته‌اند اطلاعات تخصصی را از کتاب‌هایی که مشخصاً در دسترس عمومی نبوده‌اند، بازتولید کنند.
مجموعه کتاب‌های O’Reilly از مهم‌ترین منابع آموزشی در حوزه علوم کامپیوتر، برنامه‌نویسی و داده‌کاوی هستند که بسیاری از آن‌ها فقط از طریق خرید اشتراک یا پرداخت هزینه در دسترس قرار دارند. بنابراین، اگر ادعاهای مطرح‌شده صحت داشته باشد، استفاده غیرمجاز از محتوای دارای حق مالکیت معنوی در مقیاس بالا اتفاق افتاده است.

واکنش OpenAI به اتهامات

OpenAI هنوز به‌طور رسمی پاسخی به این گزارش و ادعاها نداده است، اما پیش‌تر در پاسخ به سؤالات مشابه اعلام کرده بود که آن‌ها مدل‌های زبانی خود را بر پایه مجموعه‌ای وسیع از منابع عمومی و دارای مجوز مناسب آموزش داده‌اند. همچنین، شفاف‌سازی در مورد منبع داده‌ها به‌ویژه هنگام استفاده از اطلاعات دارای محدودیت، همچنان موضوعی حساس و پیچیده برای شرکت‌های فعال در این فضا به‌شمار می‌رود.
به گفته کارشناسان، حتی اگر استفاده از بخش‌هایی از این منابع تحت بندهای خاصی از قانون کپی‌رایت آمریکا (مانند fair use) انجام شده باشد، مشخص نبودن این موضوع باعث افزایش نگرانی‌ها در سطح عمومی شده است.

اختلاف نظر درباره استفاده منصفانه یا نقض قانون؟

اصطلاح استفاده منصفانه (Fair Use) در قوانین مالکیت فکری آمریکا، گاهی به توسعه‌دهندگان این حق را می‌دهد که بخش‌هایی از محتوای دارای حق‌کپی را به‌گونه‌ای خاص برای اهداف آموزشی، پژوهشی یا نوآوری مورد استفاده قرار دهند. با این حال، بسیاری از منتقدان معتقدند که آموزش هوش مصنوعی با حجم بالای داده‌های دارای حق مالکیت فراتر از این چارچوب‌ها رفته و نیازمند اخذ مجوزهای رسمی است.
در صورتی که مشخص شود محتوای کتاب‌های O’Reilly به‌صورت کامل یا گسترده وارد فرایند آموزش شده‌اند، ممکن است این اقدام به عنوان نقض آشکار کپی‌رایت تفسیر شده و عواقب حقوقی برای OpenAI در پی داشته باشد.

نقش شفافیت داده‌ها در اعتماد به هوش مصنوعی

یکی از چالش‌های اساسی در توسعه مدل‌های زبانی پیشرفته، مسئله شفافیت در منابع آموزشی این مدل‌هاست. کاربران، پژوهشگران و ناشران فنی نیاز دارند بدانند که چه محتوایی برای “پرورش” این مدل‌ها استفاده شده است.
پژوهشگران این حوزه پیشنهاد می‌کنند که شرکت‌های بزرگ هوش مصنوعی مانند OpenAI، لیستی از منابع آموزشی خود را – حداقل به‌صورت اجمالی – منتشر کنند تا اعتماد جامعه علمی و عمومی را جلب کنند.
شایان ذکر است که این ماجرا تنها یک نمونه از جدال‌های حقوقی در حال گسترش درباره مالکیت داده‌ها در حوزه هوش مصنوعی است. با پیشرفت سریع این فناوری‌ها، ضرورت دارد که قوانین آموزشی و حقوقی نیز با فناوری همگام شوند.

O’Reilly Media چه می‌گوید؟

شرکت O’Reilly Media که یکی از بزرگ‌ترین ناشران کتاب‌های فنی در دنیاست، در زمان انتشار این مقاله، اظهارنظری رسمی درباره این ادعاها منتشر نکرده است. اما سابقه این شرکت در دفاع از حقوق مالکیت معنوی نشان می‌دهد که بعید است چنین موضوعی را بدون واکنش باقی بگذارد.
به گفته بسیاری از تحلیلگران بازار، ممکن است طی ماه‌های آینده پرونده‌های حقوقی جدیدی پیرامون نحوه استفاده از داده‌های انتشاراتی توسط شرکت‌های بزرگ فعال در زمینه هوش مصنوعی شکل بگیرد.
برای مطالعه درباره شرکت O’Reilly، می‌توانید به صفحه O’Reilly Media در ویکی‌پدیا مراجعه کنید.
برای کسب اطلاعات و اخبار روز با ما در بیسلند همراه باشید.

Post Views: 174

مدیر مجله بیسلندفروردین 13, 1404

0 120 خواندن این مطلب 3 دقیقه زمان میبرد