ترجمه گفتار به گفتار، با سیستم جدید هوش مصنوعی گوگل
این سیستم تا حد زیادی لحن صدای گوینده را در نتیجه ترجمه حفظ می کند
محققان شرگت گوگل موفق شدند سیستمی طراحی کنند که با استفاده از شاخصهای صوتی شخص گوینده، بتواند ترجمه گفتار وی را ارائه دهد.
به این کلیپ صوتی به زبان اسپانیایی گوش دهید.
در زیر، نسخه ترجمه این کلیپ صوتی را میشنوید که توسط سیستم اتوماتیک سنتی به انگلیسی برگشته است.
کلیپ زیر، توسط سیستم جدید ترجمه هوش مصنوعی گوگل را به انگلیسی ترجمه شده است.
گرچه نتیجه کار، بدون عیب و نقص نیست اما میبینید که سیستم گوگل موفق شده با حفظ تُن صدای گوینده، ترجمه را ارائه دهد.
این سیستم مراحل تجزیه و تحلیل صوتی کمتری دارد و میتواند در کمترین زمان ممکن، دادههای ورودی صدا را به دادههای خروجی صدا تبدیل کند.
در سیستمهای سنتی ترجمه گفتار، صدای شخص گوینده به متن تبدیل شده و ترجمه میشود. بعد، خصوصیتهای صدای اصلی برداشته شده و نسخه صوتی نهایی به زبان مقصد، ارائه میشود.
سیستم جدید، که به اصطلاح Translatotron نام دارد، شامل سه قسمت میشود.
همه بخشهای این سیستم، به روی طیف نگاره سخنان گوینده تمرکز دارند.
طیف نگاره یا spectrogram، عکسی است که از فرکانسهای کلام صوتی گوینده تهیه میشود.
اولین بخش سیستم، با استفاده از شبکه توسعه یافته عصبی- neural network-، میتواند دادههای صوتی ورودی را را به تصویری از فرکانسهای دادههای خروجی به زبان مقصد تبدیل کند.
بخش دوم، تصویر به دست آمده را به امواج صوتی تبدیل میکند که میتوان آن را اجرا و پخش کرد.
قسمت سوم، میتواند خصوصیات صدای اصلی گوینده را تجزیه کرده و آن را در نتیجه نهایی، اعمال کند.
نتایج به دست آمده از این سیستم، میتواند ترجمهای بدون نقصتر از شیوههای دیگر ارائه دهد زیرا مراحل کمتری برای تحلیل و ترجمه به کار میگیرد.
محققان در طی دوران آزمایش این سیستم، تنها از ترجمه گفتار اسپانیایی به انگلیسی استفاده کردند.
اما این سیستم توسعه یافته قطعا به زودی به زبانهای بیشتری نیز ارائه خواهد شد.
مرتبط: ترجمه همزمان مکالمات در مسنجر فیسبوک