اپلتکنولوژی

وقت آن است که Siri را کنار بگذاریم | تحلیلی از WIRED درباره دستیار هوشمند اپل

نویسنده: جولین چکاتو | WIRED

اگر در سال گذشته کمی به اخبار اپل توجه کرده باشید، احتمالاً از چالش‌های این شرکت در رقابت هوش مصنوعی باخبر شده‌اید. سامانه «هوش اپلی» که اندکی پس از عرضه آیفون ۱۶ معرفی شد، کمتر از حد انتظار ظاهر شد و اپل هنوز نتوانسته نسخه‌ی بهبود‌یافته‌ی وعده‌داده‌شده‌ی سیری را که در کنفرانس WWDC 2024 معرفی کرده بود، عرضه کند. اگرچه سیری ظاهر جدیدی به خود گرفته و به ChatGPT متصل شده، اما قابلیت درک «زمینه شخصی» از طریق ایمیل‌ها، پیام‌ها، یادداشت‌ها و تقویم، در اوایل امسال «به طور نامحدود» به تعویق افتاد. ظاهراً اپل با چالش‌هایی جدی روبه‌رو است.

اما حتی اگر اپل نسخه بهتری از سیری را عرضه کند، آیا کسی از آن استفاده خواهد کرد؟ با وجود آنکه سیری نخستین دستیار صوتی بود، اما از همان ابتدا مورد تمسخر کاربران آیفون قرار گرفت، در حالی که Google Assistant و Alexa به سرعت محبوب شدند. اگر اپل می‌خواهد کاربران به این بهبودهای وعده‌داده‌شده باور داشته باشند، شاید باید از گوگل الگوبرداری کند و سیری را کنار بگذارد و چیزی کاملاً جدید خلق کند.

گوگل در توقف پروژه‌هایی که دیگر اولویت نیستند، تردیدی ندارد. این شرکت تاریخچه‌ای طولانی از کنار گذاشتن سرویس‌هایش دارد، آن‌قدر که سایتی برای ردیابی گورستان این سرویس‌ها ایجاد شده است. یکی از جدیدترین موارد؟ دستیار صوتی Google Assistant.

نزدیک به ۱۰ سال پس از معرفی، گوگل دستیار خود را از اغلب اکوسیستم‌هایش حذف می‌کند: از ساعت‌های Wear OS گرفته تا Android Auto. در حال حاضر نیز این دستیار دیگر گزینه پیش‌فرض اندروید نیست. احتمالاً تا سال ۲۰۲۶ اثری از برند آن باقی نخواهد ماند. این پایان یکی از موفق‌ترین دستیارهای صوتی تاریخ است که بدون سروصدا کنار گذاشته می‌شود.

اما تصمیم گوگل برای حذف کامل آن و عدم استفاده از نام «Google Assistant 2.0» اقدامی هوشمندانه بود. به گفته‌ی کریس هریسون، مدیر گروه Future Interfaces در دانشگاه کارنگی ملون، «این بیشتر به برندینگ مربوط می‌شود، اما یک دلیل فناورانه نیز دارد: نسل قبلی این دستیارها واقعاً شبیه دستیار نبودند. کارهایی مثل پرسیدن آب‌وهوا یا تنظیم تایمر، پیچیده نیستند. شما این درخواست‌ها را از یک دستیار انسانی نمی‌کنید.»

Gemini متفاوت است. این مدل می‌تواند در ایمیل‌ها به دنبال محل مسابقه‌ی فوتبال فرزندتان بگردد، اسناد بزرگ را تحلیل کند و در صورت اتصال به دوربین، آنچه را که می‌بینید درک کرده و کمک ارائه دهد. قابلیت‌های آن بسیار فراتر از Google Assistant است. هدف اپل نیز رسیدن به این سطح از توانایی است، البته با رعایت اصول حریم خصوصی؛ به‌طوری‌که هنگام اتصال سیری به ChatGPT، اطلاعات کاربر به OpenAI ارسال نشود.

هریسون می‌گوید: «اپل تصور می‌کرد سیری به تدریج پیشرفت می‌کند، اما این اتفاق نیفتاد؛ سیری از همان ابتدا دچار ضعف بود.» حالا ما در دوره‌ای هستیم که نسل جدیدی از دستیارهای واقعاً توانمند ظهور کرده‌اند—قابلیت استدلال دارند و شخصی‌سازی می‌شوند. با وجود آن‌که Google Assistant و Gemini هر دو رابط صوتی دارند و ممکن است در نگاه اول شبیه باشند، در واقع دو اپلیکیشن کاملاً متفاوت هستند. «تغییر نام آن به Google Assistant 2.0، باعث نمی‌شد مردم به شکلی fundamentally متفاوت از آن استفاده کنند.» این تغییر برند، در واقع کلید تغییر درک کاربران بود.

با این حال، نمی‌توان انکار کرد که اپل و حتی آمازون، از لحاظ فرهنگی تأثیری گذاشته‌اند که گوگل هرگز به آن نرسید. در فیلم‌ها و سریال‌ها نام سیری یا الکسا به‌راحتی شنیده می‌شود، اما دستیار بی‌نام گوگل چنین جایگاهی نداشت. شاید به همین دلیل است که آمازون نام Alexa را نگه داشته و تنها علامت «+» را برای نسخه پیشرفته مبتنی بر مدل‌های زبانی بزرگ افزوده—و شاید هم به همین دلیل اپل همچنان به نام سیری چسبیده است.

شاید همه این‌ها قابل قبول بود اگر اپل واقعاً به وعده‌اش عمل می‌کرد و نسخه‌ی بهبود یافته‌ی سیری را در همان زمان وعده داده‌شده عرضه می‌کرد. با کمپین تبلیغاتی بزرگ برای معرفی «هوش اپلی»، این یک فرصت طلایی بود تا کاربران را تحت تأثیر قرار دهد. اما ماه‌ها گذشته و کاربران هنوز با سیری‌ای مواجه‌اند که—با وجود ظاهر جدید—از رقبا عقب است.

مسأله‌ بزرگ‌تر همه‌ی مدل‌های زبانی فقط برند نیست، بلکه رابط کاربری آن‌هاست. هریسون این وضعیت را با دوران کامند-لاین و گذار به رابط‌های گرافیکی در دهه ۸۰ و ۹۰ مقایسه می‌کند. آنچه رابط گرافیکی را محبوب کرد، گرافیک نبود، بلکه «کشف‌پذیری» آن بود. در دوران کامند-لاین باید دقیقاً می‌دانستید چه دستوری وارد کنید. اما با رابط گرافیکی، هر کسی می‌توانست پشت کامپیوتر بنشیند و آن را یاد بگیرد.

هریسون می‌گوید وقتی کسی را جلوی ChatGPT یا Gemini می‌نشانید و به او می‌گویید «هر چیزی بخواهی می‌تونی بپرسی»، او فقط به صفحه‌ی چشمک‌زن نگاه می‌کند. «ما انگار ۳۰ سال در طراحی رابط کاربری عقب افتاده‌ایم. یک فرد معمولی—نه یک متخصص فناوری—که ۱۰ سال فقط از سیری برای تایمر استفاده کرده، حالا باید به شیوه‌ای کاملاً متفاوت فکر کند، و این کار بسیار دشواری است. تغییر نام اپلیکیشن می‌تواند بخشی از این گذار باشد.»

خداحافظی با سیری برای اپل یک تصمیم بزرگ خواهد بود—شرکتی که بیش از یک دهه روی این سامانه سرمایه‌گذاری کرده است. اما هنوز هم اکثر کاربران فقط از آن برای پخش موسیقی، بررسی آب‌وهوا و تنظیم تایمر استفاده می‌کنند و کمتر از حد ظرفیت آن بهره می‌برند. بعید است این وضعیت به‌زودی تغییر کند، حتی اگر نسخه‌ی بعدی سیری با تمام قابلیت‌های وعده‌داده‌شده عرضه شود.

هریسون در پایان می‌گوید: «برای ۹۹ درصد مردم جهان، این انقلاب هوش مصنوعی کاملاً از بالای سرشان گذشته است.» درست مانند گذار ۱۰ ساله از کامند-لاین به رابط گرافیکی، بازاندیشی در شیوه استفاده از دستیارهای صوتی زمان‌بر خواهد بود، اما شاید یک نام جدید به اپل در این گذار کمک کند.

نوشته های مشابه

دکمه بازگشت به بالا