گوگلهوش مصنوعی

ترجمه گفتار به گفتار، با سیستم جدید هوش مصنوعی گوگل

این سیستم تا حد زیادی لحن صدای گوینده را در نتیجه ترجمه حفظ می کند

محققان شرگت گوگل موفق شدند سیستمی طراحی کنند که با استفاده از شاخص‌های صوتی شخص گوینده، بتواند ترجمه گفتار وی را ارائه دهد.

به این کلیپ صوتی به زبان اسپانیایی گوش دهید.

در زیر، نسخه ترجمه این کلیپ صوتی را می‌شنوید که توسط سیستم اتوماتیک سنتی به انگلیسی برگشته است.

کلیپ زیر، توسط سیستم جدید ترجمه هوش مصنوعی گوگل را به انگلیسی ترجمه شده است.

گرچه نتیجه کار، بدون عیب و نقص نیست اما می‌بینید که سیستم گوگل موفق شده با حفظ تُن صدای گوینده، ترجمه را ارائه دهد.

این سیستم مراحل تجزیه و تحلیل صوتی کمتری دارد و می‌تواند در کمترین زمان ممکن، داد‌‌ه‌های ورودی صدا را به داده‌های خروجی صدا تبدیل کند.

در سیستم‌های سنتی ترجمه گفتار، صدای شخص گوینده به متن تبدیل شده و ترجمه می‌شود. بعد، خصوصیت‌های صدای اصلی برداشته شده و نسخه صوتی نهایی به زبان مقصد، ارائه می‌شود.

سیستم جدید، که به اصطلاح Translatotron نام دارد، شامل سه قسمت می‌شود.

همه بخش‌های این سیستم، به روی طیف نگاره سخنان گوینده تمرکز دارند.

طیف نگاره یا spectrogram، عکسی است که از فرکانس‌های کلام صوتی گوینده تهیه می‌شود.

اولین بخش سیستم، با استفاده از شبکه توسعه یافته عصبی- neural network-، می‌تواند داده‌های صوتی ورودی را را به تصویری از فرکانس‌های داده‌های خروجی به زبان مقصد تبدیل کند.

بخش دوم، تصویر به دست آمده را به امواج صوتی تبدیل می‌کند که می‌توان آن را اجرا و پخش کرد.

قسمت سوم، می‌تواند خصوصیات صدای اصلی گوینده را تجزیه کرده و آن را در نتیجه نهایی، اعمال کند.

نتایج به دست آمده از این سیستم، می‌تواند ترجمه‌ای بدون نقص‌تر از شیوه‌های دیگر ارائه دهد زیرا مراحل کمتری برای تحلیل و ترجمه به کار می‌گیرد.

محققان در طی دوران آزمایش این سیستم، تنها از ترجمه گفتار اسپانیایی به انگلیسی استفاده کردند.

اما این سیستم توسعه یافته قطعا به زودی به زبان‌های بیشتری نیز ارائه خواهد شد.

مرتبط: ترجمه همزمان مکالمات در مسنجر فیسبوک

ترجمه همزمان مکالمات در مسنجر فیس‌بوک

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا