دستاورد جدید اوپن ایآی؛ سرویس تبدیل متن به ویدیو «Sora»
سردمدار دنیای هوش مصنوعی، شرکت اوپنایآی، اخیرا مدل جدیدی از این تکنولوژی معرفی کرده که Sora نام دارد. این شرکت مدعی است که مدل سورا میتواند با دریافت دستورات متنی ساده تنها در چند دقیقه، ویدیوهای کوتاهی بسازد که واقع گرایانه و خلاقانه هستند.
شرکت اوپنایآی روز چهارشنبه، در یک پست وبلاگی اعلام کرد که سرویس سورا میتواند بر اساس پرامپ یا دستورات متنی، ویدیوهای ۶۰ ثانیهای تولید کند که شامل صحنهها و شخصیتهای مختلف است. این شخصیتها میتوانند حرکات مختلف انجام داده مانند راه رفتن، دویدن و رقصیدن و همچنین تصاویر پشت زمینه نیز با جزئیات فراوان و پیچیده تولید میشود.
در این پست وبلاگی نوشته شده: «این مدل نه تنها درخواست مطرح شده در پرامپت را به خوبی درک میکند، بلکه کاملا آگاه است که اِلمانها و عناصر موجود در درخواست، در دنیای واقعی چگونه ارائه و نمایش داده شده و تعامل دارند.»
اوپنایآی اعلام کرده که تصمیم دارد در مراحل بعد، این مدلهای هوش مصنوعی را به گونهای آموزش دهد تا بتوانند برای حل مشکلات در دنیای واقعی به کمک مردم بیایند.
سرویس سورا، جدیدترین دستاورد خالق چتبات محبوب، چتجیپیتی محسوب میشود که تکنولوژی هوش مصنوعی مولد را به طور اساسی ارتقا داده است. ریس هیدن، تحلیلگر ارشد موسسه تحقیقاتی ABI Research است، اشاره میکند که «مدلهای چند مداله» و «مدلهای تبدیل کننده متن به ویدیو»، پدیده جدیدی محسوب نمیشوند اما وجه تمایز پروژه سورا این است که میتواند ویدیوها را دقیقا بر اساس طول مدت و دقت ادعا شده تولید کند.
هیدن معتقد است که مدلهای هوش مصنوعی مشابه سورا میتوانند بازار سرگرمیهای دیجتال را به طور قابل ملاحظهای متحول کنند زیرا در این پلتفرم میتوان محتواهای شخصی سازی شده تولید و از طریق کانالهای متعدد پخش کرد.
هیدن اشاره میکند: «یک از موارد مصرف سورا، تلویزیون است. از طریق این سرویس میتوان سناریوهای کوتاه با مضمونی مشخص تولید کرد. البته قابلیتهای این مدل فعلا محدود است اما جهت حرکت این پدیده را به خوبی نمایان است.»
اوپن ایآی اعلام کرده که سورا هنوز در حال تکامل است و محدودیتها وضعفهای زیادی دارد، به خصوص در زمینه جزئیات اشکال مختلف فضایی و درک رابطه علت و معلول در پرامپتها. به عنوان مثال، سورا ممکن است جهات چپ و راست را با یکدیگر قاطی کند یا نتواند معلول ایجاد شده توسط علت را در لحظه نشان دهد مثلا بعد از اینکه شخصی، تکه بیسکوییتی را گاز زد، جای گاز در همان لحظه نمایان نمیشود.
در حال حاضر اوپن ایآی برنامه دارد با همکاری یک تیم از متخصصان، آخرین نسخههای این مدل را بازنگری کرده و با دقت بیشتری به معضلاتی همچون پخش اطلاعات نادرست، محتوای نفرت پراکنی و گرایشهای متعصبانه رسیدگی کنند. اوپن ایآی همچنین در حال توسعه یک نوع ابزار برای تشخیص اطلاعات غلط و گمراه کننده است.
سرویس سورا قرار است ابتدا برای متخصصان امنیت سایبری ارائه شود که «رد تیمرز» نام دارند و تخصص آنها این است که محصولات مختلف را از لحاظ وجود خطر یا ریسکهای احتمالی ارزیابی کنند. به علاوه اوپنایآی قرار است برای متخصصان هنرهای بصری، طراحان و سازندگان فیلم نیز امکان دسترسی به سورا را فراهم کند تا بتواند با جمع آوری بازخوردها از افراد حرفهای، این سرویس را توسعه دهد.
خبر معرفی سورا، با خبر ارتقا پلتفرم چت جیپیتی همزمان شده است. این شرکت اخیرا اعلام کرده که در حال آزمایش چند قابلیت جدید چتجیپیتی است که به کاربران این امکان را میدهد تا حافظه چت جیپیتی را کنترل کنند. کاربران از این طریق میتوانند این چت بات را به گونهای تنظیم کنند تا سوال و جوابهای گذشته را به خاطر بسپارد، که باعث خواهد شد تعاملات آینده کاربر با این سیستم، هدفمندتر و شخصیسازه شده شود.
منبع: cnn