ترجمه گفتار به گفتار، با سیستم جدید هوش مصنوعی گوگل

این سیستم تا حد زیادی لحن صدای گوینده را در نتیجه ترجمه حفظ می کند

حانیه شریف4 خرداد , 1398

ترجمه گفتار به گفتار، با سیستم جدید هوش مصنوعی گوگل

محققان شرگت گوگل موفق شدند سیستمی طراحی کنند که با استفاده از شاخص‌های صوتی شخص گوینده، بتواند ترجمه گفتار وی را ارائه دهد.

به این کلیپ صوتی به زبان اسپانیایی گوش دهید.

در زیر، نسخه ترجمه این کلیپ صوتی را می‌شنوید که توسط سیستم اتوماتیک سنتی به انگلیسی برگشته است.

مقالات مرتبط:

کلیپ زیر، توسط سیستم جدید ترجمه هوش مصنوعی گوگل را به انگلیسی ترجمه شده است.

گرچه نتیجه کار، بدون عیب و نقص نیست اما می‌بینید که سیستم گوگل موفق شده با حفظ تُن صدای گوینده، ترجمه را ارائه دهد.

این سیستم مراحل تجزیه و تحلیل صوتی کمتری دارد و می‌تواند در کمترین زمان ممکن، داد‌‌ه‌های ورودی صدا را به داده‌های خروجی صدا تبدیل کند.

در سیستم‌های سنتی ترجمه گفتار، صدای شخص گوینده به متن تبدیل شده و ترجمه می‌شود. بعد، خصوصیت‌های صدای اصلی برداشته شده و نسخه صوتی نهایی به زبان مقصد، ارائه می‌شود.

سیستم جدید، که به اصطلاح Translatotron نام دارد، شامل سه قسمت می‌شود.

همه بخش‌های این سیستم، به روی طیف نگاره سخنان گوینده تمرکز دارند.

طیف نگاره یا spectrogram، عکسی است که از فرکانس‌های کلام صوتی گوینده تهیه می‌شود.

اولین بخش سیستم، با استفاده از شبکه توسعه یافته عصبی- neural network-، می‌تواند داده‌های صوتی ورودی را را به تصویری از فرکانس‌های داده‌های خروجی به زبان مقصد تبدیل کند.

بخش دوم، تصویر به دست آمده را به امواج صوتی تبدیل می‌کند که می‌توان آن را اجرا و پخش کرد.

قسمت سوم، می‌تواند خصوصیات صدای اصلی گوینده را تجزیه کرده و آن را در نتیجه نهایی، اعمال کند.

نتایج به دست آمده از این سیستم، می‌تواند ترجمه‌ای بدون نقص‌تر از شیوه‌های دیگر ارائه دهد زیرا مراحل کمتری برای تحلیل و ترجمه به کار می‌گیرد.

محققان در طی دوران آزمایش این سیستم، تنها از ترجمه گفتار اسپانیایی به انگلیسی استفاده کردند.

اما این سیستم توسعه یافته قطعا به زودی به زبان‌های بیشتری نیز ارائه خواهد شد.

مرتبط: ترجمه همزمان مکالمات در مسنجر فیسبوک

ترجمه همزمان مکالمات در مسنجر فیس‌بوک

حانیه شریف4 خرداد , 1398

ترجمه گفتار به گفتار، با سیستم جدید هوش مصنوعی گوگل

این سیستم تا حد زیادی لحن صدای گوینده را در نتیجه ترجمه حفظ می کند

مقالات مرتبط:

دیدگاهتان را بنویسید لغو پاسخ

شورای عالی فضای مجازی خبر برخورد با بلاگرها را تکذیب کرد

«مدال آباکوس ۲۰۲۶» به یک دانشمند ایرانی‌تبار رسید

رونمایی جاباما از سرویس راهکارهای سازمانی برای مدیریت سفرهای کاری

بسته ۳هزار میلیاردی وزارت ارتباطات برای حمایت شرکت‌های دانش‌بنیان آسیب دیده در جنگ

آپدیت جدید «رادیو نشان»؛ آرشیو موسیقی‌ متنوع‌تر و پخش پایدارتر

ارسال پیام های زمانبندی شده در چت تلگرام

چگونه لوکیشن خود را در واتس‌اپ، تلگرام و دیگر اپ ها برای دیگران بفرستیم؟

چند دقیقه فیلم 4K روی آیفون 16 گیگابایتی جا می‌گیرد؟

نحوه ویرایش یا لغو ارسال پیام‌ها در iOS ۱۶

آموزش اسکن کدهای QR در آیفون و آیپد