هوش مصنوعی

هوش مصنوعی تبدیل متن به صوت Eleven v3 منتشر شد؛ صدایی طبیعی‌تر و احساسی‌تر

شرکت آمریکایی ElevenLabs که یکی از پیشگامان فناوری صوتی مبتنی بر هوش مصنوعی به شمار می‌رود، از نسخه جدید ابزار تبدیل متن به گفتار خود با نام Eleven v3 (alpha) رونمایی کرد. این مدل جدید به‌گونه‌ای طراحی شده که نه‌تنها متن را با دقت بالا قرائت می‌کند، بلکه با صدایی بسیار طبیعی، احساسی و حتی نمایشی، تجربه‌ای مشابه با اجرای یک دوبلور حرفه‌ای ارائه می‌دهد. این تحول به‌ویژه برای تولیدکنندگان محتوای ویدیویی، پادکست، کتاب صوتی و اپلیکیشن‌های تعاملی اهمیت فراوانی دارد.

Eleven v3 می‌تواند بیش از ۷۰ زبان مختلف از جمله زبان‌های اصلی هند مانند هندی، تامیل و بنگالی را پشتیبانی کند. این مدل توانایی تغییر لحن در طول یک جمله، استفاده از عناصر غیرکلامی مانند [خنده]، [آه] و [زمزمه] و همچنین ایفای نقش چند شخصیت را در قالب یک فایل صوتی دارد. به‌گفته مدیرعامل شرکت، این نسخه پیشرفته‌ترین مدل متن به گفتار تاکنون است که کنترل کاملی بر احساسات، سرعت بیان و سبک اجرا فراهم می‌کند.

یکی از نوآوری‌های مهم Eleven v3، قابلیت تگ‌گذاری صوتی است که به کاربران امکان می‌دهد مدل را وادار به خندیدن، تغییر لهجه، آواز خواندن یا حتی بیان زمزمه‌آمیز کنند. این ویژگی‌ها به‌ویژه برای سازندگان بازی، داستان‌های صوتی و پروژه‌های خلاقانه ارزشمند خواهد بود. به‌علاوه، از منظر فنی نیز این ابزار با سرعت و کیفیت بالایی خروجی صوتی تولید می‌کند.

ElevenLabs اعلام کرده که هدف از توسعه این ابزار، فراهم‌کردن بستری برای بهره‌گیری جهانی از صدای مصنوعی با کیفیتی کم‌نظیر است. کاربران در حوزه‌های مختلف مانند آموزش، سرگرمی، تجارت، توسعه اپلیکیشن و خدمات مشتری می‌توانند از این ابزار بهره‌برداری کنند. با توجه به جهش فناوری در زمینه صدا و نقش پررنگ آن در تجربه کاربری، Eleven v3 گامی مهم در مسیر انسانی‌تر شدن تعاملات دیجیتال محسوب می‌شود.

نوشته های مشابه

دکمه بازگشت به بالا