نسخه جدید DALL-E با همکاری ChatGPT عرضه خواهد شد
شرکت OpenAI بنا دارد سومین نسخه از DALL-E (سیستم هوش مصنوعی تبدیل متن به تصویر) را به زودی معرفی کند که بر اساس گزارشها، قابلیتهای پردازنده آن توسعه پیدا کرده و میتواند نتایج را از طریق برنامه ChatGPT ارائه دهد.
نحوه کار این نسخه جدید از سیستم DALL-E با چتجیبیتی توسط شرکت اوپن ایآی، به صورت دمو برای ورج نمایش داده شد و در آن نشان داده میشود که کاربر چگونه میتواند از chatbot درخواست کند یک متن بلند بالا و با جزئیات فراوان را در یک تصویر به وی ارائه دهد.
OpenAI در مصاحبهای با آکسیوس اعلام کرد که نسخه جدید DALL-E ۳ در درک نیت کاربر، حرفهایتر و بهتر عمل میکند، به خصوص اگر متن ارائه شده بلند و پر جزئیات باشد.
اگر کاربر نتواند به خوبی بیان کند که دقیقا چه چیزی میخواهد، سیستم ChatGPT میتواند به وی کمک کند تا یک متن کامل نوشته شود. در دِمویی که برای ورج نمایش داده شد، DALL-E موفق شد برای یک متن، ۴ نتیجه متفاوت تولید کند.
DALL-E ۳ همچنین طراحی شده تا بتواند بهترعناصر مختلف را خلق کند، چیزی که سیستمهای قبلی با آن مشکل داشتند مانند به تصویر کشیدن دست و وارد کردن متن داخل تصویر نتیجه.
این سیستم جدید همچنین از قابلیتهای امنیتی پیشرفتهتری نیز بهره برده است- شرکت سازنده گفته که DALL-E جدید به گونهای آموزش دیده تا برخی از کلمات داخل پاراگراف را نادیده بگیرد تا تصاویر غیر اخلاقی یا حاوی نفرت و خشونت نمایش داده نشود.
به علاوه، OpenAI قابلیتهایی به این نسخه جدید اضافه کرده تا از بروز مشکلات قضایی و شکایتهای احتمالی در آینده جلوگیری شود. نسخه کنونی DALL-E میتواند تصاویری با استایل یک هنرمند واقعی (که همین حالا زنده است) خلق کند اما در نسخه بعدی، درخواست دریافت تصویر نهایی به تقلید از سبک یک هنرمند واقعی، توسط سیستم رد میشود. همچنین هنرمندان میتوانند اثر هنری خود را از طریق یک فرم در وبسایت این شرکت ثبت کرده و حذف اثر خود را تقاضا کنند.
OpenAI برنامه دارد DALL-E ۳ را ماه آینده برای مشتریان نسخه ChatGPT Plusارائه کند. پاییز امسال، این سیستم تولید تصویر، به آزمایشگاههای تحقیقاتی OpenAI راه خواهد یافت و همچنین در دسترس مشتریان API نیز قرار خواهد گرفت. این شرکت هنوز اعلام نکرده که عرضه عمومی این سیستم چه زمانی خواهد بود.
منبع: engadget