هوش مصنوعی

رونمایی جدید OpenAI : هوش مصنوعی o1 می‌تواند مانند انسان استدلال کند

شرکت OpenAI مدل استدلالی جدیدی را از هوش مصنوعی خود با نام o1 عرضه کرده که برای پاسخ به پرسش‌هایپیچیده‌تر با سرعتی بیشتر از انسان آموزش دیده‌اند.

این مدل همراه با نسخه کوچک‌تر و ارزان‌تر o1-mini در دسترس کاربران قرار گرفته است.

برای OpenAI مدل o1 گامی به سوی هدف بزرگتر این شرکت یعنی دستیابی به هوش مصنوعی شبیه به انسان است.

از نظر عملی این مدل عملکرد بهتری در نوشتن کد و حل مسایل چند مرحله‌ای نسبت به مدل‌های قبلی دارد اما نسبت به GPT-4o گران‌تر و کندتر است.

نخستین نسخه این مدل با عنوان Preview یا پیش‌نمایش عرضه شد تا احتمالا تاکیدی بر این باشد که این مدل هنوز در مراحل ابتدایی است.

کاربران سرویس پلاس چت‌جی‌پی‌تی به نسخه o1-Preview و o1-mini از امروز دسترسی دارند در حالی که کاربران سرویس‌های اینترپرایز و EDU اوایل هفته آینده به این مدل‌ها دسترسی خواهند داشت.

شرکت OpenAI اعلام کرده که قصد دارد دسترسی به o1-mini را برای همه کاربران رایگان چت‌جی‌پی‌تی عرضه کند اما هنوز تاریخ دقیقی برای این موضوع اعلام نشده است.

دسترسی توسعه‌دهندگان از طریق API به این مدل بسیار گران است: به طور مثال دسترسی به o1 از این طریق برابر با ۱۵ دلار به ازای هر یک میلیون توکن ورودی ۶۰ دلار برای هر ۱ میلیون توکن خروجی است. در مقایسه با GPT-4o که ۵ دلار برای ۱ میلیون توکن ورودی و ۱۵ دلار برای هر ۱ میلیون توکن خروجی است.

جری تورک سرپرست تحقیقاتی شرکت OpenAI: آموزش دادن مدل o1به طور اساسی با مدل‌های قبلی متفاوت است. این مدل با استفاده از یک الگوریتم بهینه‌سازی شده کاملا جدید و یک مجموعه داده جدید که به طور خاص برای آن طراحی شده، آموزش داده شده است.

این مدل از «زنجیره تفکر» برای پردازش پرسش‌ها استفاده می‌کند مشابه با روشی که انسان‌ها مسایل را مرحله به مرحله تحلیل می‌کنند.

بر اساس این روش آموزشی جدید شرکت OpenAI معتقد است که این مدل بسیار دقیق است د و کمتر دچار توهم می‌شود هرچند به گفته مدیران این شرکت مسئله توهمات در این مدل کاملا حل نشده است.

تفاوت مدل o1 با مدل‌های قبلی

تفاوت اصلی این مدل با GPT-4o در حل مسایل پیچیده مانند کدنویسی و ریاضیات است در حالی که میتواند توضیحاتی را نیز در مورد استدلال خود ارایه دهد.

باب مک‌گرو مدیر تحقیقات OpenAI می‌گوید: این مدل قطعا در حل تست ریاضی APبهتر از من عمل می‌کند من خودم در دوران دانشگاه رشته فرعی ریاضیات را خوانده‌ام.

این شرکت این مدل را با آزمون مقدماتی المپیاد ریاضی هم آزمایش کرده و در حالی که GPT-4oتنها ۱۳ درصد مسایل را به درستی حل کرده در مدل o1 میزان حل مسایل به ۸۳ درصد رسیده است.

این مدل همچنین در مسابقات برنامه نویسی آنلاین مانند رقابت‌های کدفورس به سطح ۸۹ درصد شرکت کنندگان رسید.

OpenAI معتقد است که در به روزرسانی‌های بعدی این مدل عملکردی مشابه با دانشجویان دکترا در انجام وظایف چالشی در زمینه فیزیک، شیمی و زیست‌شناسی خواهد داشت.

با این حال o1در بسیاری از حوزه‌ها به اندازه GPT-4o توانمند نیست. این مدل در زمینه دانش واقعی در جهان عملکرد خوبی ندارد و توانایی مرور وب یا پردازش فایل و تصویر را هم ندارد.

با این وجود OpenAI معتقد است که o1 نماینده یک کلاس جدید از قابلیت‌هاست و نامگذاری آن هم مفهوم شماره از ۱ را دارد که به تدریج پیشرفته‌تر خواهد شد.

مدلی شبیه‌تر به انسان

باب مک‌گرو معتقد است که این مدل در مواردی به طرز شگفت‌آوری شبیه به انسان عمل می‌کنتد. این مدل برای پردازش پرسش‌ها زمان محدودی دارد و ممکن است بگوید « اوه وقتم داره تمام میشه اجازه بدید سریع‌تر به پاسخ برسم» یا در مراحل اولیه تفکر زنجیره‌ای‌اش که در حال ایده‌پردازی است ممکن است بگوید: میتوانم این کار را انجام دهم یا آن کار را؟ حالا باید چه کار کنم؟

مدل‌های زبان بزرگ (LLMها) به شکلی که امروزه وجود دارند، لزوماً هوشمند نیستند. آن‌ها اساساً توالی‌های کلمات را پیش‌بینی می‌کنند تا بر اساس الگوهای یادگرفته شده از داده‌های بسیار زیاد، پاسخی ارائه دهند. به عنوان مثال، ChatGPT گاهی به اشتباه ادعا می‌کند که کلمه «strawberry» تنها دو حرف “R” دارد، چون کلمه را به‌درستی تجزیه نمی‌کند. در حالی که مدل جدید o1 در این مورد پاسخ درستی داد.

OpenAI در حالی که به دنبال جمع‌آوری سرمایه بیشتر با ارزشی معادل ۱۵۰ میلیارد دلار است، به دستاوردهای پژوهشی جدید نیاز دارد تا این حرکت رو به رشد خود را ادامه دهد. این شرکت در حال افزودن قابلیت‌های استدلالی به مدل‌های زبان بزرگ است، زیرا آینده‌ای را می‌بیند که در آن سیستم‌های خودمختار یا عامل‌ها قادر به تصمیم‌گیری و انجام اقدامات به‌جای کاربران خواهند بود.

برای پژوهشگران هوش مصنوعی، گشودن رمز و راز استدلال، گامی حیاتی در جهت دستیابی به هوش سطح انسانی محسوب می‌شود. این باور وجود دارد که اگر یک مدل بتواند فراتر از تشخیص الگوها عمل کند، ممکن است در حوزه‌هایی مانند پزشکی و مهندسی نوآوری‌های بزرگی ایجاد شود. اما در حال حاضر، قابلیت‌های استدلالی مدل o1 نسبتاً کند، غیرعامل‌گونه و برای توسعه‌دهندگان گران است.

 

مک‌گرو می‌گوید: «ما ماه‌ها روی مسئله استدلال کار کرده‌ایم، زیرا معتقدیم که این در واقع همان دستاورد بحرانی است. این اساساً یک نوع جدید از مدل‌ها است که قادر خواهد بود مسائل بسیار دشوار را حل کند و این گامی در جهت پیشرفت به سوی سطوح هوش شبیه به انسان است.»

زنجیره تفکر چیست؟

زنجیره تفکر (Chain of Thought) یک تکنیک در مدل‌های هوش مصنوعی است که به مدل‌ها اجازه می‌دهد تا مسائل پیچیده را به مراحل کوچک‌تر و قابل مدیریت تقسیم کنند و هر مرحله را به صورت متوالی حل کنند. این روش به مدل‌ها کمک می‌کند تا به جای تولید پاسخ‌های سریع و ساده، مانند انسان‌ها به طور مرحله به مرحله درباره مسائل فکر کنند و راه‌حل‌های عمیق‌تر و دقیق‌تری ارائه دهند.

در این روش، مدل ابتدا ورودی یا پرسش را دریافت می‌کند، سپس به‌جای این که به سرعت یک پاسخ نهایی ارائه دهد، فرایند حل مسئله را گام به گام شرح می‌دهد. این گام‌ها می‌توانند شامل تحلیل مشکل، ایجاد فرضیات، بررسی راه‌حل‌های ممکن، و در نهایت نتیجه‌گیری باشند. به‌عنوان مثال، اگر مسئله‌ای ریاضی ارائه شود، مدل ابتدا مسئله را تقسیم‌بندی می‌کند، فرمول‌ها و روابط مربوطه را بررسی می‌کند و سپس مرحله به مرحله به پاسخ می‌رسد.

این تکنیک کمک می‌کند تا مدل‌های هوش مصنوعی، مانند مدل‌های OpenAI، در حل مسائل پیچیده‌تر، مانند کدنویسی، ریاضیات یا استدلال‌های چند مرحله‌ای، عملکرد بهتری داشته باشند.

نوشته های مشابه

دکمه بازگشت به بالا