تکنولوژی

دستاورد جدید اوپن ای‌آی؛ سرویس تبدیل متن به ویدیو «Sora»

سردمدار دنیای هوش مصنوعی، شرکت اوپن‌ای‌آی، اخیرا مدل جدیدی از این تکنولوژی معرفی کرده که Sora  نام دارد. این شرکت مدعی است که مدل سورا می‌تواند با دریافت دستورات متنی ساده تنها در چند دقیقه، ویدیوهای کوتاهی بسازد که واقع گرایانه و خلاقانه هستند.

شرکت اوپن‌ای‌آی روز چهارشنبه، در یک پست وبلاگی اعلام کرد که سرویس سورا می‌تواند بر اساس پرامپ یا دستورات متنی، ویدیوهای ۶۰ ثانیه‌ای تولید کند که شامل صحنه‌ها و شخصیت‌های مختلف است. این شخصیت‌ها می‌توانند حرکات مختلف انجام داده مانند راه رفتن، دویدن و رقصیدن و همچنین تصاویر پشت زمینه نیز با جزئیات فراوان و پیچیده تولید می‌شود.

در این پست وبلاگی نوشته شده: «این مدل نه تنها درخواست مطرح شده در پرامپت را به خوبی درک می‌کند، بلکه کاملا آگاه است که اِلمان‌ها و عناصر موجود در درخواست، در دنیای واقعی چگونه ارائه و نمایش داده شده و تعامل دارند.»

اوپن‌ای‌آی اعلام کرده که تصمیم دارد در مراحل بعد، این مدل‌های هوش مصنوعی را به گونه‌ای آموزش دهد تا بتوانند برای حل مشکلات در دنیای واقعی به کمک مردم بیایند.

سرویس سورا، جدیدترین دستاورد خالق چت‌بات محبوب، چت‌جی‌پی‌تی محسوب می‌شود که تکنولوژی هوش مصنوعی مولد را به طور اساسی ارتقا داده است. ریس هیدن، تحلیلگر ارشد موسسه تحقیقاتی ABI Research است، اشاره می‌کند که «مدل‌های چند مداله» و «مدل‌های تبدیل کننده متن به ویدیو»، پدیده جدیدی محسوب نمی‌شوند اما وجه تمایز پروژه سورا این است که می‌تواند ویدیوها را دقیقا بر اساس طول مدت و دقت ادعا شده تولید کند.

هیدن معتقد است که مدل‌های هوش مصنوعی مشابه سورا می‌توانند بازار سرگرمی‌های دیجتال را به طور قابل ملاحظه‌ای متحول کنند زیرا در این پلتفرم می‌توان محتواهای شخصی سازی شده تولید و از طریق کانال‌های متعدد پخش کرد.

هیدن اشاره می‌کند: «یک از موارد مصرف سورا، تلویزیون است. از طریق این سرویس می‌توان سناریوهای کوتاه با مضمونی مشخص تولید کرد. البته قابلیت‌های این مدل فعلا محدود است اما جهت حرکت این پدیده را به خوبی نمایان است.»

اوپن ای‌آی اعلام کرده که سورا هنوز در حال تکامل است و محدودیت‌ها وضعف‌های زیادی دارد،  به خصوص در زمینه جزئیات اشکال مختلف فضایی و درک رابطه علت و معلول در پرامپت‌ها. به عنوان مثال، سورا ممکن است جهات چپ و راست را با یکدیگر قاطی کند یا نتواند معلول ایجاد شده توسط علت را در لحظه نشان دهد مثلا بعد از اینکه شخصی، تکه بیسکوییتی را گاز زد، جای گاز در همان لحظه نمایان نمی‌شود.

در حال حاضر اوپن ای‌آی برنامه دارد با همکاری یک تیم از متخصصان، آخرین نسخه‌های این مدل را بازنگری کرده و با دقت بیشتری به معضلاتی همچون پخش اطلاعات نادرست، محتوای نفرت پراکنی و گرایش‌های متعصبانه رسیدگی کنند. اوپن ای‌آی همچنین در حال توسعه یک نوع ابزار برای تشخیص اطلاعات غلط و گمراه کننده است.

سرویس سورا قرار است ابتدا برای متخصصان امنیت سایبری ارائه شود که «رد تیمرز» نام دارند و تخصص آنها این است که محصولات مختلف را از لحاظ وجود خطر یا ریسک‌های احتمالی ارزیابی کنند. به علاوه اوپن‌ای‌آی قرار است برای متخصصان هنرهای بصری، طراحان و سازندگان فیلم نیز امکان دسترسی به سورا را فراهم کند تا بتواند با جمع آوری بازخوردها از افراد حرفه‌ای، این سرویس را توسعه دهد.

خبر معرفی سورا، با خبر ارتقا پلتفرم چت جی‌پی‌تی همزمان شده است. این شرکت اخیرا اعلام کرده که در حال آزمایش چند قابلیت جدید چت‌جی‌پی‌تی است که به کاربران این امکان را می‌دهد تا حافظه چت جی‌پی‌تی را کنترل کنند. کاربران از این طریق می‌توانند این چت بات را به گونه‌ای تنظیم کنند تا سوال و جواب‌های گذشته را به خاطر بسپارد، که باعث خواهد شد تعاملات آینده کاربر با این سیستم، هدفمندتر و شخصی‌سازه شده شود.

منبع: cnn

نوشته های مشابه

دکمه بازگشت به بالا