نویسنده: جولین چکاتو | WIRED
اگر در سال گذشته کمی به اخبار اپل توجه کرده باشید، احتمالاً از چالشهای این شرکت در رقابت هوش مصنوعی باخبر شدهاید. سامانه «هوش اپلی» که اندکی پس از عرضه آیفون ۱۶ معرفی شد، کمتر از حد انتظار ظاهر شد و اپل هنوز نتوانسته نسخهی بهبودیافتهی وعدهدادهشدهی سیری را که در کنفرانس WWDC 2024 معرفی کرده بود، عرضه کند. اگرچه سیری ظاهر جدیدی به خود گرفته و به ChatGPT متصل شده، اما قابلیت درک «زمینه شخصی» از طریق ایمیلها، پیامها، یادداشتها و تقویم، در اوایل امسال «به طور نامحدود» به تعویق افتاد. ظاهراً اپل با چالشهایی جدی روبهرو است.
اما حتی اگر اپل نسخه بهتری از سیری را عرضه کند، آیا کسی از آن استفاده خواهد کرد؟ با وجود آنکه سیری نخستین دستیار صوتی بود، اما از همان ابتدا مورد تمسخر کاربران آیفون قرار گرفت، در حالی که Google Assistant و Alexa به سرعت محبوب شدند. اگر اپل میخواهد کاربران به این بهبودهای وعدهدادهشده باور داشته باشند، شاید باید از گوگل الگوبرداری کند و سیری را کنار بگذارد و چیزی کاملاً جدید خلق کند.
گوگل در توقف پروژههایی که دیگر اولویت نیستند، تردیدی ندارد. این شرکت تاریخچهای طولانی از کنار گذاشتن سرویسهایش دارد، آنقدر که سایتی برای ردیابی گورستان این سرویسها ایجاد شده است. یکی از جدیدترین موارد؟ دستیار صوتی Google Assistant.
نزدیک به ۱۰ سال پس از معرفی، گوگل دستیار خود را از اغلب اکوسیستمهایش حذف میکند: از ساعتهای Wear OS گرفته تا Android Auto. در حال حاضر نیز این دستیار دیگر گزینه پیشفرض اندروید نیست. احتمالاً تا سال ۲۰۲۶ اثری از برند آن باقی نخواهد ماند. این پایان یکی از موفقترین دستیارهای صوتی تاریخ است که بدون سروصدا کنار گذاشته میشود.
اما تصمیم گوگل برای حذف کامل آن و عدم استفاده از نام «Google Assistant 2.0» اقدامی هوشمندانه بود. به گفتهی کریس هریسون، مدیر گروه Future Interfaces در دانشگاه کارنگی ملون، «این بیشتر به برندینگ مربوط میشود، اما یک دلیل فناورانه نیز دارد: نسل قبلی این دستیارها واقعاً شبیه دستیار نبودند. کارهایی مثل پرسیدن آبوهوا یا تنظیم تایمر، پیچیده نیستند. شما این درخواستها را از یک دستیار انسانی نمیکنید.»
Gemini متفاوت است. این مدل میتواند در ایمیلها به دنبال محل مسابقهی فوتبال فرزندتان بگردد، اسناد بزرگ را تحلیل کند و در صورت اتصال به دوربین، آنچه را که میبینید درک کرده و کمک ارائه دهد. قابلیتهای آن بسیار فراتر از Google Assistant است. هدف اپل نیز رسیدن به این سطح از توانایی است، البته با رعایت اصول حریم خصوصی؛ بهطوریکه هنگام اتصال سیری به ChatGPT، اطلاعات کاربر به OpenAI ارسال نشود.
هریسون میگوید: «اپل تصور میکرد سیری به تدریج پیشرفت میکند، اما این اتفاق نیفتاد؛ سیری از همان ابتدا دچار ضعف بود.» حالا ما در دورهای هستیم که نسل جدیدی از دستیارهای واقعاً توانمند ظهور کردهاند—قابلیت استدلال دارند و شخصیسازی میشوند. با وجود آنکه Google Assistant و Gemini هر دو رابط صوتی دارند و ممکن است در نگاه اول شبیه باشند، در واقع دو اپلیکیشن کاملاً متفاوت هستند. «تغییر نام آن به Google Assistant 2.0، باعث نمیشد مردم به شکلی fundamentally متفاوت از آن استفاده کنند.» این تغییر برند، در واقع کلید تغییر درک کاربران بود.
با این حال، نمیتوان انکار کرد که اپل و حتی آمازون، از لحاظ فرهنگی تأثیری گذاشتهاند که گوگل هرگز به آن نرسید. در فیلمها و سریالها نام سیری یا الکسا بهراحتی شنیده میشود، اما دستیار بینام گوگل چنین جایگاهی نداشت. شاید به همین دلیل است که آمازون نام Alexa را نگه داشته و تنها علامت «+» را برای نسخه پیشرفته مبتنی بر مدلهای زبانی بزرگ افزوده—و شاید هم به همین دلیل اپل همچنان به نام سیری چسبیده است.
شاید همه اینها قابل قبول بود اگر اپل واقعاً به وعدهاش عمل میکرد و نسخهی بهبود یافتهی سیری را در همان زمان وعده دادهشده عرضه میکرد. با کمپین تبلیغاتی بزرگ برای معرفی «هوش اپلی»، این یک فرصت طلایی بود تا کاربران را تحت تأثیر قرار دهد. اما ماهها گذشته و کاربران هنوز با سیریای مواجهاند که—با وجود ظاهر جدید—از رقبا عقب است.
مسأله بزرگتر همهی مدلهای زبانی فقط برند نیست، بلکه رابط کاربری آنهاست. هریسون این وضعیت را با دوران کامند-لاین و گذار به رابطهای گرافیکی در دهه ۸۰ و ۹۰ مقایسه میکند. آنچه رابط گرافیکی را محبوب کرد، گرافیک نبود، بلکه «کشفپذیری» آن بود. در دوران کامند-لاین باید دقیقاً میدانستید چه دستوری وارد کنید. اما با رابط گرافیکی، هر کسی میتوانست پشت کامپیوتر بنشیند و آن را یاد بگیرد.
هریسون میگوید وقتی کسی را جلوی ChatGPT یا Gemini مینشانید و به او میگویید «هر چیزی بخواهی میتونی بپرسی»، او فقط به صفحهی چشمکزن نگاه میکند. «ما انگار ۳۰ سال در طراحی رابط کاربری عقب افتادهایم. یک فرد معمولی—نه یک متخصص فناوری—که ۱۰ سال فقط از سیری برای تایمر استفاده کرده، حالا باید به شیوهای کاملاً متفاوت فکر کند، و این کار بسیار دشواری است. تغییر نام اپلیکیشن میتواند بخشی از این گذار باشد.»
خداحافظی با سیری برای اپل یک تصمیم بزرگ خواهد بود—شرکتی که بیش از یک دهه روی این سامانه سرمایهگذاری کرده است. اما هنوز هم اکثر کاربران فقط از آن برای پخش موسیقی، بررسی آبوهوا و تنظیم تایمر استفاده میکنند و کمتر از حد ظرفیت آن بهره میبرند. بعید است این وضعیت بهزودی تغییر کند، حتی اگر نسخهی بعدی سیری با تمام قابلیتهای وعدهدادهشده عرضه شود.
هریسون در پایان میگوید: «برای ۹۹ درصد مردم جهان، این انقلاب هوش مصنوعی کاملاً از بالای سرشان گذشته است.» درست مانند گذار ۱۰ ساله از کامند-لاین به رابط گرافیکی، بازاندیشی در شیوه استفاده از دستیارهای صوتی زمانبر خواهد بود، اما شاید یک نام جدید به اپل در این گذار کمک کند.