اوپن ای آیتکنولوژیهوش مصنوعی

همه چیز درباره منوس: آغاز عصر جدید هوش مصنوعی خودمختار

چین با معرفی Manus سیلیکون ولی را در شوک بزرگ فرو برده است

منوس (Manus)، نخستین عامل هوش مصنوعی خودمختار جهان، به‌تازگی رونمایی شده و توجه گسترده‌ای را در دنیای فناوری به خود جلب کرده است. این سیستم هوشمند جدید فراتر از یک چت‌بات معمولی عمل می‌کند و می‌تواند کارهایی را انجام دهد که تاکنون از دستیاران مجازی سنتی برنمی‌آمد. منوس قادر است وظایف پیچیده را به‌صورت مستقل، از مرحله برنامه‌ریزی تا اجرا پیش ببرد و نتیجه نهایی را تحویل دهد. همین ویژگی آن را به یک دستیار دیجیتال تمام‌عیار و جذاب تبدیل کرده که بسیاری آن را نویدبخش نسل آینده‌ی هوش مصنوعی می‌دانند.

یکی از قابلیت‌های چشمگیر منوس، توانایی انجام طیف متنوعی از وظایف عملی است. برای مثال، این عامل هوشمند می‌تواند به‌طور خودکار رزومه‌های کاری را بررسی و بهترین گزینه‌ها را پیشنهاد کند، یک وب‌سایت سفارشی را از صفر طراحی و پیاده‌سازی نماید، یا برنامه‌ی سفری مفصل به مقصدی مانند ژاپن را تنظیم کند. دامنه‌ی کاری منوس تنها به این‌ها محدود نمی‌شود؛ بر اساس موارد استفاده‌ی اعلام‌شده، منوس می‌تواند تحلیل عمیق داده‌های مالی (مثلاً بررسی و پیش‌بینی روند سهام شرکت‌ها مانند تسلا)، ایجاد محتوای آموزشی تعاملی برای معلمان، مقایسه‌ی خدمات بیمه‌ای مختلف و حتی کمک به کسب‌وکارها در یافتن تأمین‌کنندگان مناسب را انجام دهد. انجام چنین کارهای متنوعی به شکل خودکار، تجربه‌ای شبیه داشتن یک دستیار شخصی همه‌فن‌حریف است که می‌تواند بسیاری از امور روزمره‌ی افراد و شرکت‌ها را تسهیل کند.

ظهور منوس به عنوان اولین AI Agent خودمختار، می‌تواند آغازی بر تحولی بزرگ در صنایع و بازار کار باشد.

علاوه بر گستره وظایف، خودمختاری در انجام کارها مهم‌ترین جذابیت منوس است. برخلاف ابزارهای هوش مصنوعی معمول که صرفاً بر اساس ورودی کاربر پاسخ می‌دهند یا توصیه ارائه می‌کنند، منوس می‌تواند مسئله‌ای را دریافت کرده و خود به تنهایی برای حل آن برنامه‌ریزی و اقدام کند. به عنوان نمونه، در حالتی که کاربر از منوس بخواهد فهرستی از نامزدهای برتر یک موقعیت شغلی را بیابد، منوس می‌تواند فایل‌های رزومه را دریافت کرده، آن‌ها را باز کند، اطلاعات کلیدی هر رزومه را استخراج و مقایسه کند و در نهایت گزارش نهایی شامل رتبه‌بندی داوطلبان و توصیه‌های استخدامی را تحویل دهد. جالب اینکه این فرایندها روی سرورهای ابری به‌صورت غیرهمزمان انجام می‌شود؛ یعنی کاربر می‌تواند پس از تعریف وظیفه، سیستم را ترک کند و منوس پس از اتمام کار نتیجه را اطلاع دهد. چنین سطحی از استقلال در عملکرد، تحول بزرگی نسبت به دستیاران قبلی محسوب می‌شود و از دید کاربران، به معنای واقعی کلمه مانند داشتن یک همکار دیجیتال است که بسیاری از کارهای زمان‌بر را انجام می‌دهد.

لازم به ذکر است که کارایی منوس در آزمون‌ها و ارزیابی‌های تخصصی نیز تایید شده است. در یک معیار ارزیابی جدید به نام GAIA (طراحی‌شده برای سنجش توانایی دستیاران هوش مصنوعی در حل مسائل واقعی)، منوس موفق شده در تمامی سطوح دشواری به امتیازات رکوردشکنی (سطح State-of-the-Art) دست یابد. گزارش‌ها حاکی است عملکرد منوس در این آزمون حتی از مدل‌های پیشرفته‌ی OpenAI در رده‌ی مشابه فراتر رفته است. این دستاورد نشان می‌دهد که منوس نه‌تنها در تئوری، بلکه در عمل نیز یک سروگردن بالاتر از نسل‌های قبلی دستیارهای هوشمند قرار می‌گیرد و می‌تواند استاندارد جدیدی را در این حوزه تعریف کند.

مقایسه منوس با GPT-4 و جمینی

موفقیت و نوآوری منوس در حالی رقم خورده که پیش از آن مدل‌های هوش مصنوعی قدرتمندی مانند GPT-4 و جمینی (Gemini) توجه همگان را به خود جلب کرده بودند. GPT-4 که توسط شرکت OpenAI توسعه یافته، یک مدل زبانی بسیار بزرگ و تواناست که می‌تواند متون را در سطحی نزدیک به انسان تولید کند و به سوالات پیچیده پاسخ دهد. این مدل در طیف گسترده‌ای از وظایف زبانی (از جمله ترجمه، نوشتن مقاله، برنامه‌نویسی و غیره) عملکرد شگفت‌انگیزی داشته و به عنوان نسل چهارم GPT، نشان‌دهنده جهشی بزرگ نسبت به نسخه‌های قبلی خود است. با این حال، GPT-4 ماهیتاً یک مدل مولد متن است، نه یک عامل خودمختار. به بیان دیگر، GPT-4 برای پاسخ‌گویی و تولید محتوا طراحی شده و همواره نیازمند تعامل کاربر در قالب پرسش و پاسخ است و خودش ابتکار عمل مستقلی در انجام یک پروژه کامل را بر عهده نمی‌گیرد. به عنوان نمونه، GPT-4 می‌تواند در نوشتن بخش‌هایی از کد یا ارائه‌ی ایده‌ها کمک کند، اما این کاربر است که باید مراحل مختلف یک پروژه (مثلاً ساخت یک وب‌سایت) را مدیریت و قطعه‌قطعه به مدل دستور دهد.

در مقایسه با GPT-4 و جمینی، وجه تمایز اصلی منوس در خودمختاری و عمل‌گرایی آن است.

از سوی دیگر، جمینی مدل جدیدی است که توسط شرکت گوگل (بخش DeepMind) معرفی شده و بسیاری از کارشناسان آن را رقیب جدی GPT-4 می‌دانند. گفته می‌شود جمینی یک مدل چندوجهی (Multimodal) خواهد بود که توانایی درک و تولید انواع داده‌ها (متن، تصویر و شاید ویدئو) را به‌طور یکپارچه دارد.

گوگل در توسعه جمینی از تجربیات موفقی مانند AlphaGo (هوش مصنوعی بازی شطرنج و گو) بهره برده تا قدرت استدلال و برنامه‌ریزی را با قابلیت‌های زبانی ترکیب کند. انتظار می‌رود جمینی بتواند از لحاظ وسعت دانش و توان پردازشی حتی به GPT-4 نزدیک شود یا از آن پیشی بگیرد. با این حال، جمینی نیز در اصل یک مدل پایه هوش مصنوعی است که برای استفاده در محصولات مختلف (مثل موتور جستجو، دستیار گوگل یا برنامه‌های ثالث) طراحی شده و تاکنون به عنوان یک عامل خودمختار کامل معرفی نشده است. یعنی همچنان نقش اصلی جمینی، تسهیل و بهبود تولید محتوا و پاسخ‌گویی در چارچوب دستورهای کاربر خواهد بود، نه مدیریت مستقل یک وظیفه از ابتدا تا انتها.

در مقایسه با این دو مدل پرآوازه، وجه تمایز اصلی منوس در خودمختاری و عمل‌گرایی آن است. GPT-4 و احتمالاً جمینی هر دو به عنوان مغزهای متفکر هوش مصنوعی شناخته می‌شوند که محتوای غنی و پاسخ‌های دقیق تولید می‌کنند، اما فاقد ابتکار عمل مستقل هستند؛ در واقع یک انسان باید به آن‌ها بگوید چه زمانی و چگونه از توانایی‌شان استفاده کنند. این در حالی است که منوس از پایه با رویکرد عامل (Agent) توسعه یافته است: ترکیبی از چند مدل هوش مصنوعی و ماژول‌های نرم‌افزاری که هماهنگ با هم قادرند مسئله‌ای را فهمیده، برنامه‌ریزی و حل کنند. به بیان ساده‌تر، اگر GPT-4 و جمینی را به یک نابغه تشبیه کنیم که دانش زیادی در مغز خود دارند، منوس نقش یک کارگزار هوشمند را ایفا می‌کند که می‌تواند آن دانش را با دستان خود به کار گیرد. منوس از مدل‌های زبانی (احتمالاً حتی مدل‌هایی مشابه GPT-4) به عنوان زیرمجموعه استفاده می‌کند، اما بر روی آن‌ها لایه‌ای از برنامه‌ریزی و کنترل افزوده تا بتواند وظایف چندمرحله‌ای را بدون نظارت انسان به انجام برساند. نتیجه این رویکرد آن است که منوس خروجی نهایی را (مثلاً یک گزارش تحلیلی، یک وب‌سایت آماده یا یک سند برنامه‌ریزی شده) تحویل می‌دهد؛ در حالی که GPT-4 یا جمینی بیشتر ابزار فکر هستند که خروجی خام (متن یا کد) تولید کرده و این کاربر است که باید از آن خروجی‌ها برای تکمیل کار بهره گیرد.

 

نکته دیگر مقایسه، کاربردپذیری این فناوری‌هاست. GPT-4 در حال حاضر از طریق محصولات مختلفی مانند ChatGPT، بینگ چت و سایر سرویس‌ها در دسترس عموم قرار گرفته و میلیون‌ها کاربر روزانه با آن سر و کار دارند. جمینی نیز احتمالاً در محصولات گوگل مانند موتور جستجو یا دستیار هوشمند ادغام خواهد شد. اما منوس در گام نخست به شکل یک پلتفرم مستقل عرضه شده است که فعلاً در مرحله آزمایشی (نسخه پیش‌نمایش) و فقط با دعوتنامه قابل استفاده است. برخلاف GPT-4 که بر محور تعامل زبانی ساخته شده، کار با منوس بیشتر شبیه سپردن پروژه‌ها به یک دستیار دیجیتال است. این دستیار ممکن است برای انجام وظیفه خود در پشت صحنه ده‌ها مکالمه و پردازش را انجام دهد، اما کاربر صرفاً درخواست کلی را مطرح می‌کند و نتیجه‌ی نهایی را تحویل می‌گیرد. بنابراین تجربه کاربری منوس با یک مدل صرف متفاوت خواهد بود و بیشتر به برون‌سپاری کارها شباهت دارد. در مجموع، می‌توان گفت GPT-4 و جمینی مغزهای قدرتمندی هستند و منوس دست‌های توانمند؛ ترکیبی که احتمالاً در آینده با هم ادغام خواهد شد، اما در شرایط کنونی منوس نمایانگر رویکردی یک گام فراتر از مدل‌های صرفاً زبانی است.

 

از ایده تا اجرا: تیم توسعه و اهداف منوس

در یک معیار ارزیابی جدید به نام GAIA، منوس موفق شده رکورد شکنی کرده و حتی از مدل‌های پیشرفته‌ی OpenAI در رده‌ی مشابه هم فراتر رود.

پشت موفقیت منوس، تیمی از کارآفرینان و پژوهشگران جوان قرار دارد که سابقه قابل‌توجهی در حوزه هوش مصنوعی دارند. این پروژه توسط استارت‌آپ چینی Monica (مونیکا) توسعه یافته است. مؤسس اصلی این تیم فردی به نام شیائو هونگ (Xiao Hong) است؛ کارآفرینی متولد دهه ۹۰ میلادی که پیش‌تر نیز دستاوردهای فناورانه مهمی در کارنامه خود ثبت کرده است. شیائو هونگ در دوران دانشجویی علاقه و استعداد خود در کارهای نوآورانه را نشان داد و چندین پروژه موفق دانشجویی را رهبری کرد. پس از فارغ‌التحصیلی، او در سال ۲۰۱۵ شرکت فناوری Nightingale را بنیان گذاشت و با جذب سرمایه از غول‌هایی مانند تنسنت، محصولاتی در حوزه دستیارهای کسب‌وکار عرضه کرد که به بیش از دو میلیون کاربر سازمانی خدمات دادند.

در سال ۲۰۲۲، هم‌زمان با موج جدید هوش مصنوعی و یادگیری عمیق، شیائو هونگ شرکت جدیدی موسوم به اثر پروانه‌ای تأسیس کرد و دستیار هوشمند مونیکا (Monica AI) را عرضه نمود. مونیکا یک افزونه مرورگر و پلتفرم دستیار مبتنی بر هوش مصنوعی بود که با یکپارچه‌سازی مدل‌های زبانی بزرگ مختلف (از جمله مدل‌های مطرح آن زمان) به کاربران امکان می‌داد در هر زمان و مکان از قابلیت‌های AI برای گفتگو، ترجمه، تولید محتوا، و حتی خلق تصویر استفاده کنند. این محصول به سرعت شهرت جهانی پیدا کرد و تا سال ۲۰۲۴ شمار کاربران آن به حدود ۱۰ میلیون نفر رسید که موفقیتی چشمگیر برای یک دستیار هوشمند به‌شمار می‌آید.

منوس را می‌توان نسل بعدی فلسفه‌ی مونیکا دانست. تیم توسعه‌دهنده در سکوت خبری و طی حدود یک سال گذشته، بر روی ایده‌ای کار می‌کرد که خود آن را «نسل آینده‌ی هوش مصنوعی» می‌نامد. نتیجه، تولد منوس به عنوان اولین عامل هوش مصنوعی عمومی در اوایل سال ۲۰۲۵ بود. نام «منوس» برگرفته از واژه‌ای لاتین به معنی «دست» است. عبارت معروف لاتین «Mens et Manus» به معنای «ذهن و دست»، شعار موسسه فناوری ماساچوست (MIT) است که بر پیوند دانش نظری و عمل تاکید دارد. انتخاب نام Manus از سوی سازندگان آن نیز نشان‌دهنده‌ی همین دیدگاه است: هوش مصنوعی باید علاوه بر فکر کردن، بتواند دست به عمل بزند و دانش خود را در دنیای واقعی پیاده کند. هدف اصلی پروژه منوس نیز بر همین اساس شکل گرفته است؛ یعنی ایجاد عاملی هوشمند که بتواند مستقیماً در انجام کارهای واقعی به انسان کمک کند، نه صرفاً پاسخگوی سوالات باشد. به گفته‌ی اعضای تیم، رویکرد فنی آن‌ها «انعطاف بیشتر و هوشمندی بالاتر به جای ساختارهای از پیش تعیین‌شده» بوده است؛ بدین معنا که به‌جای محدود کردن سیستم به قابلیت‌های مشخص، تلاش شده با تمرکز بر کیفیت داده، قدرت مدل‌ها و معماری منعطف، هوشمندی عام و تطبیق‌پذیری بالایی حاصل شود.

عامل هوشمند منوس حاصل ترکیب چندین فناوری پیشرفته است. اطلاعات فنی دقیق درباره معماری داخلی آن هنوز به‌طور کامل عمومی نشده، اما می‌دانیم که چند مدل بزرگ زبانی و تخصصی در پشت صحنه‌ی منوس مشغول به همکاری هستند و تصمیم‌گیری‌های آن را شکل می‌دهند. سازندگان منوس اعلام کرده‌اند که به‌دنبال اشتراک‌گذاری بخشی از کدها و فناوری‌های پروژه با جامعه متن‌باز هوش مصنوعی هستند تا توسعه این اکوسیستم شتاب بیشتری بگیرد. این تصمیم می‌تواند به جذب مشارکت پژوهشگران و توسعه‌دهندگان بیشتری منجر شود و از سوی دیگر نشان می‌دهد که هدف تیم منوس صرفاً عرضه یک محصول تجاری بسته نیست، بلکه آن‌ها به ایجاد یک پلتفرم و استاندارد جدید در دنیای AI می‌اندیشند. پشتیبانی مالی سرمایه‌گذاران مطرح چینی از این پروژه نیز بیانگر امیدواری آن‌ها به موفقیت و تجاری‌سازی گسترده آن در سال‌های آتی است.

تأثیرات بالقوه بر صنعت، بازار کار و آینده‌ی هوش مصنوعی

ظهور منوس به عنوان اولین AI Agent خودمختار، می‌تواند آغازی بر تحولی بزرگ در صنایع و بازار کار باشد. در سال‌های اخیر، اتوماسیون هوشمند به یکی از اولویت‌های شرکت‌ها در بخش‌های مختلف تبدیل شده است؛ از تولید و لجستیک گرفته تا خدمات مالی و سلامت. تاکنون ابزارهای هوش مصنوعی عمدتاً در حد دستیار تصمیم‌گیری یا تحلیل داده به کار گرفته می‌شدند و نیاز به مداخله نیروی انسانی برای اجرای نتایج احساس می‌شد. اما عواملی مانند منوس قادرند مستقیماً وارد عمل شوند و بخش‌های عملیاتی کار را نیز انجام دهند. این بدان معناست که در صنعت می‌توان وظایفی را به طور کامل به یک AI Agent سپرد. برای مثال، در یک شرکت مالی ممکن است منوس مأمور تهیه‌ی یک گزارش دوره‌ای شود: از گردآوری داده‌های پراکنده در اینترنت و پایگاه‌های داده گرفته تا تحلیل آن‌ها و نوشتن گزارش نهایی. یا در یک شرکت تولیدی، می‌توان مدیریت زنجیره تأمین یا زمان‌بندی تولید را به یک عامل هوشمند واگذار کرد تا با دریافت اهداف کلان، بهترین برنامه‌ریزی را انجام داده و حتی اقدامات لازم (مانند سفارش مواد اولیه به تأمین‌کنندگان) را به صورت خودکار پیش ببرد. چنین سناریوهایی که زمانی علمی-تخیلی به‌نظر می‌رسید، اکنون با حضور منوس و فناوری‌های مشابه رنگ واقعیت گرفته‌اند.

تأثیر این سطح از خودکارسازی قطعاً در بازار کار نیز محسوس خواهد بود. همان‌طور که انقلاب‌های صنعتی گذشته مشاغل را دستخوش تغییر کردند، ورود عوامل هوش مصنوعی خودمختار نیز برخی نقش‌های شغلی را متحول می‌کند. از یک سو، بهره‌وری نیروی کار افزایش می‌یابد چون کارهای تکراری و پردازش‌های زمان‌بر به ماشین سپرده می‌شود و نیروی انسانی می‌تواند بر وظایف خلاقانه‌تر یا نظارت بر خروجی‌ها متمرکز شود. برای نمونه، تیم‌های منابع انسانی به جای صرف ساعت‌ها زمان برای غربالگری رزومه‌ها، می‌توانند این کار را به AI Agent بسپارند و خود بر مصاحبه‌های نهایی و ارزیابی‌های انسانی تمرکز کنند. یا تحلیل‌گران مالی به جای گردآوری دستی اطلاعات بازار، بر استراتژی‌سازی بر مبنای گزارش‌های آماده‌شده توسط عامل هوشمند تمرکز خواهند کرد. از سوی دیگر، نگرانی‌هایی درباره کاهش نیاز به نیروی کار انسانی در برخی حوزه‌ها وجود دارد. برخی مشاغل در سطوح پایه که عمدتاً اجرای فرآیندهای استاندارد را شامل می‌شوند، احتمالاً با سیستم‌هایی مانند منوس قابل جایگزینی یا ادغام هستند.

با نگاهی کلان‌تر، منوس می‌تواند نماینده‌ای از آینده‌ی هوش مصنوعی باشد؛ آینده‌ای که در آن ماشین‌ها نه فقط فکر می‌کنند، بلکه عمل هم می‌کنند.

هرچند کاملاً حذف شدن انسان از چرخه‌ی کار بعید است، اما نقش‌های شغلی تغییر می‌یابد؛ به عنوان مثال، شاید به جای چندین کارمند اداری برای پیگیری امور، یک مدیر هوش مصنوعی حضور داشته باشد و یک یا دو نفر ناظر بر عملکرد آن. بنابراین افراد شاغل نیاز خواهند داشت مهارت‌های خود را ارتقاء دهند و در کنار عوامل هوشمند کار کنند. همان‌گونه که ظهور رایانه‌ها مشاغل جدیدی (مثل متخصص IT) ایجاد کرد، گسترش AI Agents نیز فرصت‌های شغلی تازه‌ای خلق خواهد کرد؛ از مربیان و تنظیم‌گران این عوامل گرفته تا تحلیل‌گران نتایج آن‌ها و متخصصان بهبود تعامل انسان و AI.

با نگاهی کلان‌تر، منوس می‌تواند نماینده‌ای از آینده‌ی هوش مصنوعی باشد؛ آینده‌ای که در آن ماشین‌ها نه فقط فکر می‌کنند، بلکه عمل هم می‌کنند. موسسه پژوهشی گارتنر پیش‌بینی کرده تا سال ۲۰۲۸ حدود ۱۵٪ تصمیم‌های روزانه‌ی کاری در سازمان‌ها را عوامل هوشمند به‌صورت خودکار اتخاذ خواهند کرد. این رقم قابل توجه، نشان‌دهنده‌ی سرعت پذیرش این فناوری در سال‌های پیش‌رو است. اگر منوس گام اول را در سال ۲۰۲۵ برداشته، به احتمال زیاد در ادامه شاهد عرضه عوامل خودمختار بیشتری از سوی شرکت‌های بزرگ خواهیم بود. در واقع رقابت در عرصه هوش مصنوعی خودمختار آغاز شده است؛ چنان‌که گزارش‌ها حاکیست OpenAI نیز در حال کار بر روی سرویس‌های عامل هوشمند اختصاصی خود است و حتی یک نسخه‌ی سطح‌بالا برای مشتریان سازمانی با هزینه‌ای معادل ۲۰ هزار دلار در ماه پیشنهاد داده که هدفش ارائه دستیار تحقیقاتی دکتراگونه به شرکت‌های بزرگ در حوزه‌هایی مثل مالی و پزشکی است. چنین سرمایه‌گذاری‌هایی از سوی غول‌های فناوری نشان می‌دهد آنها انتظار دارند AI Agentها به منبع درآمد و مزیت رقابتی مهمی تبدیل شوند. برآورد شده است طی چند سال آینده شاید تا ۲۰٪ یا ۲۵٪ از درآمد شرکت‌هایی مانند OpenAI از محل همین عوامل هوشمند باشد.

 

در نهایت، حضور عواملی مانند منوس پرسش‌های مهمی را نیز در زمینه سازگاری با جامعه و اخلاق هوش مصنوعی مطرح می‌کند. اگر قرار است بخشی از تصمیم‌گیری‌ها و اقدامات به ماشین سپرده شود، باید اطمینان حاصل گردد که این ماشین‌ها قابل اعتماد، شفاف و منصفانه عمل می‌کنند. نظارت انسانی، هرچند محدودتر، باز هم نقشی اساسی در جلوگیری از خطاهای سیستم یا سوگیری‌های احتمالی خواهد داشت. همچنین مسائل حقوقی و تنظیم‌گری (قوانین مربوط به مسئولیت عملکرد AI، حریم خصوصی داده‌ها و …) باید همگام با این پیشرفت حل‌وفصل شوند. اما با همه این چالش‌ها، روند کلی غیرقابل انکار است: هوش مصنوعی در حال ورود به فازی تازه است که در آن از یک ابزار صرف به یک عامل مستقل ارتقاء پیدا می‌کند. منوس به عنوان پیشگام این عرصه نشان داد آنچه تا دیروز تخیل بود، امروز قابل تحقق است. می‌توان انتظار داشت در سال‌های نزدیک، حضور چنین دستیاران هوشمند خودکاری در کنار ما به امری عادی بدل شود؛ دستیارانی که چرخ‌های صنعت را روان‌تر می‌کنند، در انجام کارها به ما یاری می‌رسانند و در شکل‌دهی آینده‌ی فناوری سهم بسزایی خواهند داشت.

نوشته های مشابه

دکمه بازگشت به بالا