زنی که پشت صدای Siri است
بسیاری از اوقات ممکن است از خود پرسیده باشیم آیا پشت صداهای الکترونیکی که این روزها در دستیارهای شخصی صوتی روی موبایل و تبلت میشنویم انسان واقعی وجود دارد؟ ( احتمالا اگر فیلم The Her را دیده باشید به وجود انسانی پشت این دستیارهای شخصی باور ندارید). در مورد دستیار شخصی اپل یعنی Siri اما یک انسان واقعی وجود دارد. «سوزان بنت».
«سوزان بنت» یک صداپیشه است که صدای او پشت صدای آهنین Siri قرار دارد و البته صدای او روی بسیاری از سرویسهای صوتی دیگر هم هست.
گفت و گو با «سوزان بنت» شما را شگفت زده میکند. او در عین حال که میتواند بسیار عادی و معمولی صحبت کند ناگهان هم میتواند صدای خود را به صدایی که همه ما در دستیار صوتی Siri شنیدهایم تغییر دهد و شما تصور میکنید دارید با کامپیوتر صحبت میکنید.
«سوزان بنت» در برلینگتن کانادا به دنیا آمد اما وقتی خیلی جوان بود به نیویورک نقل مکان کرد. حضور او در نیویورک باعث شد که او سبک گفتاری آمریکایی داشته باشد. او در دانشگاه Brown آواز و بازیگری را فراگرفت و بعد به آتلانتا رفت جایی که صدای بدون لهجهاش فرصتهای مناسبی را برای کار برایش فراهم کرد.
در دهه ۱۹۷۰ صدای «سوزان بنت» نخستین بار روی سیستم صوتی دستگاههای ATM قرار گرفت و برای چند دهه صدای خاص او روی سرویسهای پاسخدهی خودکار صوتی، سیستمهای PA و … قرار گرفته است.
در سال ۲۰۰۵ وقتی «سوزان بنت» برای Siri صدای خود را ضبط میکرد هیچ ایدهای از اینکه قرار است بعدا صدای او روی میلیونها آیفون قرار بگیرد نداشت. در واقع هنوز حتی آیفونی به وجود نیامده بود. ( سیری نخستین بار به صورت اپلکیشن روی فروشگاه نرمافزار اپل قرار گرفت و در سال ۲۰۱۰ توسط اپل خریده شد) . او حتی تا سال ۲۰۱۱ که برای نخستین بار Siri روی آیفون 4S عرضه شد نمیدانست که صدای او روی این سرویس قرار دارد.
صدای سیری چگونه ضبط شد؟
Siri باید قادر باشد هر چیزی را به زبان انگلیسی بگوید و این چالش این کار بوده است. «سوزان بنت» میگوید: در طی ماه جولای من چهارساعت در روز و در پنج روز هفته مشغول ضبط Siri بودم. این زمان برای یک صدا پیشه زمان زیادی است چراکه شما در یک مدت طولانی و مداوم باید صحبت کنید و این شما را خسته میکند.
در عین حال لحن صدای Siri هم یک حالت شوخطبعانه هم دارد به گفته «سوزان بنت» این صدا باید یک کاراکتر خاص خود را میداشت و من یک حالت شوخطبعی را به آن اضافه کردم و این در عین استواری و وضوحی بود که باید در بیان کلمات به کار برده میشد.
صداپیشگی به گفته «سوزان بنت» نیازمند نوعی هوشمندی تکنیکی هم هست چیزی که به گفته او یک متنی که ۶۵ ثانیه قابل خواندن است را باید ۶۰ ثانیه گفت. اما موضوع سیری از این هم سختتر بود. ضبط صدا برای این کاربرد کامپیوتری به شیوه ادای همه کلمات و جملات موجود در زبان انگلیسی نبود و به جای آن او باید صداهای پایه را بیان میکرد. به تکنیک کامپیوتری برای ساخت کلمات و جملات از صداهای پایه توسط کامپیوتر concatenated speech ( تسلسل گفتار) گفته میشود. هدف در این مدل ترکیب همه صداهای موجود به شکلی است که از ترکیب آنها کلمات ایجاد شود.
برای ضبط صداپیشه باید انواع جملات ناتمام را با تمام آواهای مختلف زبان انگلیسی بیان کند. این موضوع باعث میشودکه زمان زیادی گرفته شود چراکه صداپیشه باید یک جمله را با انواع و اقسام آواها بیان کند تا نتیجه کار به صدای انسانی بیشتر شبیه شود. به عنوان مثال صدا پیشه باید در کلماتی مانند “hiss,” “snakes,” یا “rose.” حرف S را آواهای مختلف بیان کند. بقیه کار ترکیب توسط کامپیوتر انجام میشود.
«سوزان بنت» اما حالا معتقد است صدای Siri نیاز به یک ضبط جدید دارد تا بتوان آن را بهبود داد. البته اپل نشان داده به مرور زمان توانسته با استفاده از بهبودهای نرمافزاری و تکنیکهای دیگر به صدای Siri جنبه انسانیتری بدهد.
نکته قابل توجه در مورد «سوزان بنت» این است که او کار ضبط صداو کارهای مرتبط با آن را در استودیوی خانگی خود انجام میدهد. جایی که هزینه تجهیزات آن هم بسیار بالا بوده است.
منبع: vox
منبع : آی تی ایران
Unhustled 6-Figure Freedom Price & Program.