نسخه جدید مدل تبدیل متن به تصویر Imagen 3 گوگل منتشر شد
آخرین نسخه مدل تبدیل متن به تصویر گوگل که در ماه می در رویداد Google I/O معرفی شد، Imagen 3 نام دارد و پیشرفتهترین مولد هوش مصنوعی این شرکت است که با مدلهایی مانند Midjourney، DALL-E 3، و Grok-2 رقابت میکند. برخلاف مدل هوش مصنوعی ایلان ماسک که به دلیل تولید تصاویر دارای کپیرایت و دیپفیک شخصیتهای عمومی شناخته شده ، گوگل رویکرد متفاوتی اتخاذ کرده است. این شرکت اعلام کرده که از فیلترینگ گسترده و برچسبگذاری دادهها برای کاهش محتوای مضر در مجموعه دادهها استفاده کرده و احتمال تولید خروجیهای آسیبزا را کاهش داده است. همچنین تصاویر تولید شده توسط Imagen 3 دارای نشان دیجیتالی SynthID گوگل هستند که برای شناسایی منشأ تصویر استفاده میشود.
جدای از پروتکلهای ایمنی، گوگل میگوید که Imagen 3 دارای انعطافپذیری بیشتر بوده و با درک بهتری از دستورات، تصاویر با کیفیت بالاتر و طبیعیتری ارائه میدهد.
کاربران هماکنون در حال آزمایش این مدل هستند و نتایج چشمگیری به دست آوردهاند.اما برخی از کاربران در وبسایت ردیت از این مدل انتقاد کرده و مدعی شدهاند که در تولید تصاویری که مجاز به تولید آنها است، بیش از حد محدودکننده عمل میکند.
چگونه مدل Imagen 3 گوگل را امتحان کنیم؟
اگر میخواهید خودتان Imagen 3 و مرزهای آن را امتحان و بررسی کنید، این مدل از طریق ImageFX و VertexAI در دسترس است. همچنین Imagen 3 به زودی از طریق Workspace و Gemini- هم در وب و هم در موبایل – در دسترس قرار خواهد گرفت.
منبع:mashable