ادعای تازه علیه OpenAI: استفاده از کتابهای پولی بدون اجازه؟
در تازهترین حاشیه پیرامون هوش مصنوعی، برخی محققان ادعا کردهاند که
OpenAI، سازنده مدلهای معروفی مثل ChatGPT، ممکن است برای آموزش مدلهای خود از محتوای کتابهای
پولی O’Reilly Media بدون اجازه استفاده کرده باشد. این موضوع نگرانیهایی را دربارهی
نقض کپیرایت و حقوق ناشران در دوران رشد شتابزده فناوری هوش مصنوعی ایجاد کرده است. همچنین این اتفاق بحثهای جدیدی را پیرامون شفافیت در
فرآیند آموزش مدلهای زبان بزرگ (LLM) بهوجود آورده است.
شائبه استفاده از منابع دارای حقوق کپیرایت
بر اساس تحقیقاتی که اخیراً منتشر شده، برخی از پژوهشگران با بررسی خروجیهای مدلهای زبانی توسعهدادهشده توسط OpenAI متوجه شباهتهای زیادی میان محتوای این مدلها و کتابهای
فنی منتشرشده توسط O’Reilly شدهاند. به گفته آنها، این مدلها توانستهاند اطلاعات تخصصی را از کتابهایی که مشخصاً در دسترس عمومی نبودهاند، بازتولید کنند.
مجموعه کتابهای O’Reilly از مهمترین منابع آموزشی در حوزه علوم کامپیوتر، برنامهنویسی و دادهکاوی هستند که بسیاری از آنها فقط از طریق خرید اشتراک یا پرداخت هزینه در دسترس قرار دارند. بنابراین، اگر ادعاهای مطرحشده صحت داشته باشد،
استفاده غیرمجاز از محتوای دارای حق مالکیت معنوی در مقیاس بالا اتفاق افتاده است.
واکنش OpenAI به اتهامات
OpenAI هنوز بهطور رسمی پاسخی به این گزارش و ادعاها نداده است، اما پیشتر در پاسخ به سؤالات مشابه اعلام کرده بود که آنها مدلهای زبانی خود را بر پایه مجموعهای وسیع از منابع عمومی و دارای مجوز مناسب آموزش دادهاند. همچنین، شفافسازی در مورد منبع دادهها بهویژه هنگام استفاده از اطلاعات دارای محدودیت، همچنان موضوعی حساس و پیچیده برای شرکتهای فعال در این فضا بهشمار میرود.
به گفته کارشناسان، حتی اگر استفاده از بخشهایی از این منابع تحت بندهای خاصی از قانون کپیرایت آمریکا (مانند
fair use) انجام شده باشد، مشخص نبودن این موضوع باعث افزایش نگرانیها در سطح عمومی شده است.
اختلاف نظر درباره استفاده منصفانه یا نقض قانون؟
اصطلاح
استفاده منصفانه (Fair Use) در قوانین مالکیت فکری آمریکا، گاهی به توسعهدهندگان این حق را میدهد که بخشهایی از محتوای دارای حقکپی را بهگونهای خاص برای اهداف آموزشی، پژوهشی یا نوآوری مورد استفاده قرار دهند. با این حال، بسیاری از منتقدان معتقدند که
آموزش هوش مصنوعی با حجم بالای دادههای دارای حق مالکیت فراتر از این چارچوبها رفته و نیازمند اخذ مجوزهای رسمی است.
در صورتی که مشخص شود محتوای کتابهای O’Reilly بهصورت کامل یا گسترده وارد فرایند آموزش شدهاند، ممکن است این اقدام به عنوان
نقض آشکار کپیرایت تفسیر شده و عواقب حقوقی برای OpenAI در پی داشته باشد.
نقش شفافیت دادهها در اعتماد به هوش مصنوعی
یکی از چالشهای اساسی در توسعه مدلهای زبانی پیشرفته، مسئله شفافیت در
منابع آموزشی این مدلهاست. کاربران، پژوهشگران و ناشران فنی نیاز دارند بدانند که چه محتوایی برای “پرورش” این مدلها استفاده شده است.
پژوهشگران این حوزه پیشنهاد میکنند که شرکتهای بزرگ هوش مصنوعی مانند OpenAI،
لیستی از منابع آموزشی خود را – حداقل بهصورت اجمالی – منتشر کنند تا اعتماد جامعه علمی و عمومی را جلب کنند.
شایان ذکر است که این ماجرا تنها یک نمونه از جدالهای حقوقی در حال گسترش درباره مالکیت دادهها در حوزه هوش مصنوعی است. با پیشرفت سریع این فناوریها، ضرورت دارد که قوانین آموزشی و حقوقی نیز با فناوری همگام شوند.
O’Reilly Media چه میگوید؟
شرکت O’Reilly Media که یکی از بزرگترین ناشران کتابهای فنی در دنیاست، در زمان انتشار این مقاله، اظهارنظری رسمی درباره این ادعاها منتشر نکرده است. اما سابقه این شرکت در دفاع از حقوق مالکیت معنوی نشان میدهد که بعید است چنین موضوعی را بدون واکنش باقی بگذارد.
به گفته بسیاری از تحلیلگران بازار، ممکن است طی ماههای آینده پروندههای حقوقی جدیدی پیرامون نحوه استفاده از دادههای انتشاراتی توسط شرکتهای بزرگ فعال در
زمینه هوش مصنوعی شکل بگیرد.
برای مطالعه درباره شرکت O’Reilly، میتوانید به صفحه
O’Reilly Media در ویکیپدیا مراجعه کنید.
برای کسب اطلاعات و اخبار روز با ما در
بیسلند همراه باشید.
Post Views: 44