هوش مصنوعی

نسخه جدید مدل تبدیل متن به تصویر Imagen 3 گوگل منتشر شد

آخرین نسخه مدل تبدیل متن به تصویر گوگل که در ماه می در رویداد Google I/O معرفی شد، Imagen 3 نام دارد و پیشرفته‌ترین مولد هوش مصنوعی این شرکت است که با مدل‌هایی مانند Midjourney، DALL-E 3، و Grok-2 رقابت می‌کند. برخلاف مدل هوش مصنوعی ایلان ماسک که به دلیل تولید تصاویر دارای کپی‌رایت و دیپ‌فیک شخصیت‌های عمومی شناخته شده ، گوگل رویکرد متفاوتی اتخاذ کرده است. این شرکت اعلام کرده که از فیلترینگ گسترده و برچسب‌گذاری داده‌ها برای کاهش محتوای مضر در مجموعه‌ داده‌ها استفاده کرده و احتمال تولید خروجی‌های آسیب‌زا را کاهش داده است. همچنین تصاویر تولید شده توسط Imagen 3 دارای نشان دیجیتالی SynthID گوگل هستند که برای شناسایی منشأ تصویر استفاده می‌شود.

جدای از پروتکل‌های ایمنی، گوگل می‌گوید که Imagen 3 دارای انعطاف‌پذیری بیشتر بوده و با درک بهتری از دستورات، تصاویر با کیفیت بالاتر و طبیعی‌تری ارائه می‌دهد.

کاربران هم‌اکنون در حال آزمایش این مدل هستند و نتایج چشمگیری به دست آورده‌اند.اما برخی از کاربران در وبسایت ردیت از این مدل انتقاد کرده‌ و مدعی شده‌اند که در تولید تصاویری که مجاز به تولید آن‌ها است، بیش از حد محدودکننده عمل می‌کند.

چگونه مدل Imagen 3 گوگل را امتحان کنیم؟

اگر می‌خواهید خودتان Imagen 3  و مرزهای آن را امتحان و بررسی کنید، این مدل از طریق ImageFX و VertexAI  در دسترس است. همچنین Imagen 3  به زودی از طریق Workspace و Gemini- هم در وب و هم در موبایل – در دسترس قرار خواهد گرفت.

منبع:mashable

نوشته های مشابه

دکمه بازگشت به بالا