هوش مصنوعی

شرکت‌های همکار OpenAI در آموزش ChatGPT را بشناسید

روز چهارشنبه هفته گذشته، شرکت OpenAI  قراردادی با شرکت News Corp امضا کرد که بر اساس آن، منبع داده‌ عظیم و جدیدی در دسترس چت‌بات‌های اپن‌ای‌آی قرار می‌گیرد.

با این قرارداد جدید،ChatGPT و سایر خدمات شرکت OpenAI به داده‌های روزنامه وال استریت ژورنال، نیویورک پست، MarketWatch، Barron’s و سایر نشریات دسترسی پیدا کردند.

این قرارداد که شامل محتوای شبکه فاکس نیوز نمی‌شود، آخرین مورد از سری توافق‌های بزرگ اشتراک داده‌ای است که OpenAI در تلاش برای آموزش سیستم‌های خود و گسترش تخصص فناوری این شرکت امضا کرده است. OpenAI به تازگی قراردادی مشابه با Reddit نیز امضا کرده تا محتوای آن را در ChatGPT و محصولات جدید خود بگنجاند.

این قراردادها در دوران حساسی برای OpenAI امضا شده‌اند زیرا اخیرا برخی از رسانه‌ها، از جمله شرکت نیویورک تایمز، از این شرکت و مایکروسافت به دلیل استفاده بدون اجازه از محتواهای دارای حق کپی‌رایت آنها در آموزش چت‌بات‌ها، شکایت کرده‌اند.

این شکایت در دادگاه فدرال ناحیه منهتن ثبت شده و بر اساس آن ادعا می‌شود که میلیون‌ها مقاله نیویورک تایمز، برای آموزش چت‌بات‌ها استفاده شده و این چت‌بات‌ها به عنوان منابع اطلاعاتی، شروع به رقابت با این رسانه کرده‌اند. یک گروه از نویسندگان مشهور نیز از این شرکت شکایت کرده‌اند و آن را به “سرقت سیستماتیک در مقیاس بزرگ” متهم کرده‌اند.

استفاده از داده‌ها تنها نیمی از این نبرد است و بدون شک OpenAI  باید راهی پیدا کند تا با تعصبات موجود در داده‌هایی که وارد می‌کند مقابله کرده و اطلاعاتی را که طنز یا تقلید محض است، از سیستم حذف کند.

اوایل همین هفته، سیستم جستجوی هوش مصنوعی گوگل، یک پست مضحک در Reddit را به عنوان واقعیت به اشتراک گذاشت که پیشنهاد می‌کرد «حدود 1/8 فنجان چسب غیر سمی را به سس اضافه کنید» تا از سُر خوردن پنیر از روی برش پیتزا جلوگیری شود! این خبر نشان داد که گوگل هنوز در این زمینه راه زیادی در پیش دارد.

پس، چه کسانی با OpenAI همکاری کرده‌ و اجازه دسترسی به منابع داده و محتوای خود را به این شرکت داده‌اند؟ در ادامه با این شرکت‌ها آشنا شوید.

THE ASSOCIATED PRESS

در ماه جولای سال گذشته، AP  و OpenAI قراردادی را اعلام کردند که به این غول هوش مصنوعی اجازه می‌دهد تا از آرشیو داستان‌ها و محتواهای خبری AP از سال 1985 به بعد استفاده کند. در همین حال،AP نیز این فرصت را پیدا کرد تا از فناوری OpenAI بهره‌برداری کند.

AXEL SPRINGER

ناشر آلمانی آکسل اشپرینگر، اولین رسانه بزرگی بود که با OpenAI همکاری کرد و آرشیوهای خود را برای چت‌بات این شرکت ارائه کرد. آکسل اشپرینگر مجموعه بزرگی از رسانه‌ها را کنترل می‌کند، از جمله Politico، Business Insider و رسانه‌های آلمانی Bild وWelt.

DOTDASH MEREDITH

DOTDASH MEREDITH یکی از بزرگ‌ترین ناشران دیجیتال در ایالات متحده است و بر اساس قرارداد این شرکت که در ماه می(اردیبهشت) امضا شد، به OpenAI دسترسی به بیش از ۴۰ برند مختلف از جمله People، Travel & Leisure، Entertainment Weekly، Allrecipes، Real Simple، Food & Wine، Parents، Investopedia، Better Homes & Garden و InStyle  داده شده است.

این قرارداد پس از آن منعقد شد که شرکت مادر این مجموعه(IAC)، تلاش کرده بود تا ائتلافی از ناشران بزرگ ایجاد کند تا محتواهای دارای حق کپی‌رایت را از شرکت‌های هوش مصنوعی محافظت کنند که البته این تلاش در نهایت شکست خورد.

THE FINANCIAL TIMES

فایننشال تایمز (FT) در ماه آوریل با OpenAI همکاری خود را آغاز کرد و بر اساس قرارداد امضا شده بین این دو شرکت، به ChatGPT اجازه داده می‌شود تا از محتوای FT برای ایجاد متن، تصاویر و کدها استفاده شود. همچنین، در این قرارداد به ChatGPT اجازه داده شده تا به سؤالات یا پرامپت‌های کاربران، با خلاصه‌های کوتاهی از مقالات FT پاسخ داده و لینک‌هایی به منبع FT.com   ارجاع دهد.

LE MONDE

در ماه مارس(فروردین)، سازمان رسانه‌ای فرانسوی LE MONDE با OpenAI یک قرارداد چند ساله امضا کرد و بر اساس آن، مجوز دسترسی به کتابخانه محتوای این سازمان ارائه شد. عکس‌ها، بخشی از این قرارداد نبودند و OpenAI موافقت کرد که ارجاعات به مقالات لو موند، همراه با با لوگو، هایپرلینک و عناوین مقالات استفاده‌ شده این سازمان به‌عنوان مرجع مشخص شوند.

.NEWS CORP

قرارداد چند ساله News Corp ، به OpenAI  اجازه دسترسی به مجموعه‌ای از معتبرترین گزارش‌های مالی از جمله داستان‌های وال استریت ژورنال، MarketWatch، Barron’s و دیگر نشریات را می‌دهد. این قرارداد همچنین دسترسی به نیویورک پست و نشریات بریتانیایی The Times و The Sun و همچنین چندین نشریه استرالیایی از جمله The Herald Sun و The Courier Mail را فراهم می‌کند.

با این حال، این توافق شامل محتوای فاکس نیوز یا سایر کسب‌وکارهایNews Corp، مانند خدمات املاک دیجیتال یا HarperCollins، نمی‌شود.

PRISA MEDIA

همزمان با انعقاد قرارداد با لو موند، OpenAI  همچنین با رسانه اسپانیایی Prisa Media نیز همکاری خود را آغاز کرد. PRISA MEDIA، برندهایی وابسته در اسپانیا، آمریکای لاتین و ایالات متحده دارد، از جمله ال پائیس و ال هافپست و نسخه اسپانیایی هافینگتون پست.

REDDIT

Reddit  با بیش از ۱ میلیون پست در روز، یک منبع دائمی از محتوا برای ChatGPT فراهم کرده تا از آن استفاده کند. این سایت همچنین داده‌های گسترده‌ای در مورد موضوعات مختلف به چت‌بات ارائه می‌دهد، از جلسات “از من هر چیزی بپرس” با افراد مشهور و کسانی که شغل‌های غیرعادی دارند تا بحث‌های ورزشی. انجمن‌های NSFW نیز  قسمت دیگری از داده‌ها را برای این چت‌بات فراهم می‌کنند.

Reddit همچنین در فوریه یک قرارداد ۶۰ میلیون دلار «مجوز دستسرسی به محتوا»، با گوگل منعقد کرد.

SHUTTERSTOCK

شراکت OpenAI با وب‌سایت عکس‌ SHUTTERSTOCK به سال ۲۰۲۱ بازمی‌گردد. در سال ۲۰۲۳، OpenAI اعلام کرد که این همکاری را برای شش سال دیگر تمدید کرده و Shutterstock  حجم وسیعی از داده‌های آموزشی از جمله کتابخانه‌ تصاویر، ویدئوها، موسیقی‌ها و همچنین فراداده‌های مرتبط را به این شرکت ارائه می‌دهد.

این قراردادها می‌توانند فقط نوک کوه یخ باشند. با ادامه رشد ChatGPT، OpenAI  به داده‌های بیشتری برای مدل‌های زبان بزرگ خود نیاز خواهد داشت. چندین ناشر بزرگ، از جمله خانه‌های کتاب یا رسانه‌های خبری، همچنان در حاشیه هستند، اما ممکن است با کاهش درآمدهایشان و ارائه قراردادهای پرسود توسط OpenAI، در ماه‌های آینده به امضای شراکت ترغیب شوند.

منبع:fastcompany

نوشته های مشابه

دکمه بازگشت به بالا