شرکتهای همکار OpenAI در آموزش ChatGPT را بشناسید
روز چهارشنبه هفته گذشته، شرکت OpenAI قراردادی با شرکت News Corp امضا کرد که بر اساس آن، منبع داده عظیم و جدیدی در دسترس چتباتهای اپنایآی قرار میگیرد.
با این قرارداد جدید،ChatGPT و سایر خدمات شرکت OpenAI به دادههای روزنامه وال استریت ژورنال، نیویورک پست، MarketWatch، Barron’s و سایر نشریات دسترسی پیدا کردند.
این قرارداد که شامل محتوای شبکه فاکس نیوز نمیشود، آخرین مورد از سری توافقهای بزرگ اشتراک دادهای است که OpenAI در تلاش برای آموزش سیستمهای خود و گسترش تخصص فناوری این شرکت امضا کرده است. OpenAI به تازگی قراردادی مشابه با Reddit نیز امضا کرده تا محتوای آن را در ChatGPT و محصولات جدید خود بگنجاند.
این قراردادها در دوران حساسی برای OpenAI امضا شدهاند زیرا اخیرا برخی از رسانهها، از جمله شرکت نیویورک تایمز، از این شرکت و مایکروسافت به دلیل استفاده بدون اجازه از محتواهای دارای حق کپیرایت آنها در آموزش چتباتها، شکایت کردهاند.
این شکایت در دادگاه فدرال ناحیه منهتن ثبت شده و بر اساس آن ادعا میشود که میلیونها مقاله نیویورک تایمز، برای آموزش چتباتها استفاده شده و این چتباتها به عنوان منابع اطلاعاتی، شروع به رقابت با این رسانه کردهاند. یک گروه از نویسندگان مشهور نیز از این شرکت شکایت کردهاند و آن را به “سرقت سیستماتیک در مقیاس بزرگ” متهم کردهاند.
استفاده از دادهها تنها نیمی از این نبرد است و بدون شک OpenAI باید راهی پیدا کند تا با تعصبات موجود در دادههایی که وارد میکند مقابله کرده و اطلاعاتی را که طنز یا تقلید محض است، از سیستم حذف کند.
اوایل همین هفته، سیستم جستجوی هوش مصنوعی گوگل، یک پست مضحک در Reddit را به عنوان واقعیت به اشتراک گذاشت که پیشنهاد میکرد «حدود 1/8 فنجان چسب غیر سمی را به سس اضافه کنید» تا از سُر خوردن پنیر از روی برش پیتزا جلوگیری شود! این خبر نشان داد که گوگل هنوز در این زمینه راه زیادی در پیش دارد.
پس، چه کسانی با OpenAI همکاری کرده و اجازه دسترسی به منابع داده و محتوای خود را به این شرکت دادهاند؟ در ادامه با این شرکتها آشنا شوید.
THE ASSOCIATED PRESS
در ماه جولای سال گذشته، AP و OpenAI قراردادی را اعلام کردند که به این غول هوش مصنوعی اجازه میدهد تا از آرشیو داستانها و محتواهای خبری AP از سال 1985 به بعد استفاده کند. در همین حال،AP نیز این فرصت را پیدا کرد تا از فناوری OpenAI بهرهبرداری کند.
AXEL SPRINGER
ناشر آلمانی آکسل اشپرینگر، اولین رسانه بزرگی بود که با OpenAI همکاری کرد و آرشیوهای خود را برای چتبات این شرکت ارائه کرد. آکسل اشپرینگر مجموعه بزرگی از رسانهها را کنترل میکند، از جمله Politico، Business Insider و رسانههای آلمانی Bild وWelt.
DOTDASH MEREDITH
DOTDASH MEREDITH یکی از بزرگترین ناشران دیجیتال در ایالات متحده است و بر اساس قرارداد این شرکت که در ماه می(اردیبهشت) امضا شد، به OpenAI دسترسی به بیش از ۴۰ برند مختلف از جمله People، Travel & Leisure، Entertainment Weekly، Allrecipes، Real Simple، Food & Wine، Parents، Investopedia، Better Homes & Garden و InStyle داده شده است.
این قرارداد پس از آن منعقد شد که شرکت مادر این مجموعه(IAC)، تلاش کرده بود تا ائتلافی از ناشران بزرگ ایجاد کند تا محتواهای دارای حق کپیرایت را از شرکتهای هوش مصنوعی محافظت کنند که البته این تلاش در نهایت شکست خورد.
THE FINANCIAL TIMES
فایننشال تایمز (FT) در ماه آوریل با OpenAI همکاری خود را آغاز کرد و بر اساس قرارداد امضا شده بین این دو شرکت، به ChatGPT اجازه داده میشود تا از محتوای FT برای ایجاد متن، تصاویر و کدها استفاده شود. همچنین، در این قرارداد به ChatGPT اجازه داده شده تا به سؤالات یا پرامپتهای کاربران، با خلاصههای کوتاهی از مقالات FT پاسخ داده و لینکهایی به منبع FT.com ارجاع دهد.
LE MONDE
در ماه مارس(فروردین)، سازمان رسانهای فرانسوی LE MONDE با OpenAI یک قرارداد چند ساله امضا کرد و بر اساس آن، مجوز دسترسی به کتابخانه محتوای این سازمان ارائه شد. عکسها، بخشی از این قرارداد نبودند و OpenAI موافقت کرد که ارجاعات به مقالات لو موند، همراه با با لوگو، هایپرلینک و عناوین مقالات استفاده شده این سازمان بهعنوان مرجع مشخص شوند.
.NEWS CORP
قرارداد چند ساله News Corp ، به OpenAI اجازه دسترسی به مجموعهای از معتبرترین گزارشهای مالی از جمله داستانهای وال استریت ژورنال، MarketWatch، Barron’s و دیگر نشریات را میدهد. این قرارداد همچنین دسترسی به نیویورک پست و نشریات بریتانیایی The Times و The Sun و همچنین چندین نشریه استرالیایی از جمله The Herald Sun و The Courier Mail را فراهم میکند.
با این حال، این توافق شامل محتوای فاکس نیوز یا سایر کسبوکارهایNews Corp، مانند خدمات املاک دیجیتال یا HarperCollins، نمیشود.
PRISA MEDIA
همزمان با انعقاد قرارداد با لو موند، OpenAI همچنین با رسانه اسپانیایی Prisa Media نیز همکاری خود را آغاز کرد. PRISA MEDIA، برندهایی وابسته در اسپانیا، آمریکای لاتین و ایالات متحده دارد، از جمله ال پائیس و ال هافپست و نسخه اسپانیایی هافینگتون پست.
Reddit با بیش از ۱ میلیون پست در روز، یک منبع دائمی از محتوا برای ChatGPT فراهم کرده تا از آن استفاده کند. این سایت همچنین دادههای گستردهای در مورد موضوعات مختلف به چتبات ارائه میدهد، از جلسات “از من هر چیزی بپرس” با افراد مشهور و کسانی که شغلهای غیرعادی دارند تا بحثهای ورزشی. انجمنهای NSFW نیز قسمت دیگری از دادهها را برای این چتبات فراهم میکنند.
Reddit همچنین در فوریه یک قرارداد ۶۰ میلیون دلار «مجوز دستسرسی به محتوا»، با گوگل منعقد کرد.
SHUTTERSTOCK
شراکت OpenAI با وبسایت عکس SHUTTERSTOCK به سال ۲۰۲۱ بازمیگردد. در سال ۲۰۲۳، OpenAI اعلام کرد که این همکاری را برای شش سال دیگر تمدید کرده و Shutterstock حجم وسیعی از دادههای آموزشی از جمله کتابخانه تصاویر، ویدئوها، موسیقیها و همچنین فرادادههای مرتبط را به این شرکت ارائه میدهد.
این قراردادها میتوانند فقط نوک کوه یخ باشند. با ادامه رشد ChatGPT، OpenAI به دادههای بیشتری برای مدلهای زبان بزرگ خود نیاز خواهد داشت. چندین ناشر بزرگ، از جمله خانههای کتاب یا رسانههای خبری، همچنان در حاشیه هستند، اما ممکن است با کاهش درآمدهایشان و ارائه قراردادهای پرسود توسط OpenAI، در ماههای آینده به امضای شراکت ترغیب شوند.
منبع:fastcompany