مایکروسافت دقیقترین سیستم تشخیص گفتار را دارد
تیمی از محققان مایکروسافت با ثبت نتیجه 6.3 درصد خطا در آزمایش سیستم تشخیص گفتار، رکورد قبلی یعنی 6.9 درصد که در اختیار سیستم واتسون شرکت IBM بود را جابهجا کردند.
به گزارش وبسایت بیزینس اینسایدر این موفقیت، مایکروسافت را یک قدم دیگر به جلو میبرد تا بتواند بهتر فرمانهای صوتی کاربران در سرویسهای مختلف مانند کورتانا را تشخیص دهد. موضوعی که در نهایت امر میتواند سطح خدمات ارائه شده در سرویسهایی مثل کورتانا، مترجم اسکایپ و سرویسهای تشخیص درخواستهای صوتی را بهبود دهد. این در حالی است که دستیارهای صوتی رفته رفته به رابط کاربری فراگیر در کامپیوترها تبدیل میشوند. در حال حاضر دستیارهای صوتی مثل سیری به بخش مهمی از اکوسیستم دستگاههای اپل تبدیل شدهاند اما این تکنولوژیها همچنان باید راه زیادی را برای رسیدن به تکامل طی کنند.
پیشرفتهای جدید که از طریق بهکارگیری هوش مصنوعی و یا یادگیری عمیق بهدست آمدهاند، سهم زیادی را در افزایش دقت راحتی استفاده از دستیارهای صوتی داشتهاند. در تلاش برای عقب نماندن از قافله، شرکتهایی مثل آمازون، اپل، گوگل و IBM هم استفاده از سیستمهای تشخیص گفتار را در دستورکار قرار دادهاند. به عنوان مثال اپل در سیاست جدید خود ادغام سیری در نرمافزارهای عرضه شده توسط شرکتهای مختلف را امکانپذیر ساخته است. این امر ارسال فرمانهای صوتی به نرمافزارهای مختلف را ممکن میکند تا به عنوان مثال با استفاده از سیری بتوانید از اوبر تاکسی بگیرید.
مری میکر تحلیلگر Kleiner Perkins معتقد است تا قبل از اینکه “صدا” به رابط کاربری اصلی در میان انتخابهای پیش روی کاربران تبدیل شود، سیستم تشخیص گفتار باید به دقتی در حدود 99 درصد برسد. در حال حاضر با توجه به رکورد اخیر مایکروسافت این دقت در حد نهایی آن 93.7 درصد است. دیوید مارکو مدیر ارشد پیامرسان فیسبوک معتقد است شرکتهایی که روی پلتفرمهای صوتی سرمایهگذاری نکنند خطر کرده و ممکن است از رقابت با فعالان حوزه تکنولوژی عقب بمانند.
منبع : آیتیایران