هوش مصنوعی

اضافه شدن قابلیت تشخیص تصویر و صدا به چت جی‌پی‌تی

یکی از نقص‌های بزرگ سرویس چت جی‌پی‌تی این بوده که تا کنون نمی‌توانست در اینترنت جستجو یا سرچ انجام داده تا جواب سوال کاربر را بدهد. شرکت سازنده این سرویس- OpenAI- اوایل سال جاری میلادی این قابلیت را به سرویس چت جی‌پی‌تی اضافه کرد اما بعد مدت کوتاهی ادعا شد به دلیل «پیامدهای ناخواسته» این قابلیت حذف شده است.

این شرکت حالا دوباره دسترسی به اینترنت را برای چت جی‌پی‌تی ارائه کرده و همچنین با اعمال تدابیر حفاظتی، قابلیت‌های تشخیص تصویر و تشخیص صدا نیز به این سیستم مجهز به هوش مصنوعی اضافه شده است.

کاربران حالا می‌توانند در سرویس GPT-4، با انتخاب گزینه «با مرورگر بینگ جستجو کن» (Browse with Bing) از امکانات جستجوی این سیستم استفاده کنند. این چت‌بات تا پیش از این می‌توانست صرفا بر اساس اطلاعات و داده‌هایی که شرکت سازنده به آن آموزش داده، به سوال کاربران پاسخ دهد، داده‌هایی که همه پیش از سپتامبر ۲۰۲۱ به این چت بات انتقال داده شده بودند. به همین دلیل، چت جی‌پی‌تی عملا از اتفاقات مهم اخیر بی‌اطلاع مانده بود و همین باهث می‌شد کارایی آن برای ارائه جواب سوالات کاربران کاهش یابد.

OpenAI ابتدا در ماه اردیبهشت امسال، به کاربران این امکان را داد تا بتوانند به این چت‌بات دستور دهند در موتور جستجوی بینگ، جستجو کند اما این قابلیت نیز خیلی زود در اوایل ماه مرداد حذف شد.

اما حالا قابلیت جدیدی به این سرویس اضافه شده که می‌تواند صفحه قوانین وبسایت را خوانده تا بداند چه اطلاعاتی می‌تواند به کاربران ارائه دهد. مایکروسافت و گوگل هم امکانات مشابهی برای چت‌بات‌های  Bing Chat و Bard خود ارائه کرده‌اند.

به علاوه، قابلیت‌های تشخیص تصویر و تشخیص صدا نیز برای کاربران این سرویس معرفی شده که تا دو هفته آینده به طور کامل عرضه خواهد شد. قابلیت جدید تشخیص تصویر چت جی‌پی‌تی می‌تواند تصاویر را از روی هر پلتفرمی تفسیر کند اما سرویس تشخیص صدا صرفا مختص سیستم عامل‌های آی‌اواس و اندروید است.

برای استفاده از سیستم تشخیص تصویر، کاربر می‌تواند یک تصویر از گالری خود انتخاب کرده یا یک عکس جدید بیندازد. کاربر برای این کار روی پلتفرم موبایل، باید ابتدا آیکون علامت + را انتخاب کند. کاربر همچنین می‌تواند چند تصویر به چت‌بات نشان دهد و با گذاشتن علامت، به چت بات بفهماند که می‌خواهد روی کدام قسمت تصویر تمرکز شود. شرکت OpenAI مدعی است که این قابلیت به چت جی‌پی‌تی این امکان را می‌دهد  تا مثلا با دیدن محتویات داخل یخچال کاربر، دستور پخت یک مدل غذا را جستجو کرده و به وی ارائه دهد. این قابلیت برای کارهای دیگری مانند پیدا کردن جواب سوالات ریاضی یا درست کردن یک وسیله کاربرد دارد.

قابلیت تشخیص صدا نیز در قسمت  Settings > New Features قابل دسترسی است. در این قسمت کاربر می‌تواند یک مکالمه صوتی را بارگزاری کند. بعد آیکون هدفون را انتخاب کرده که در گوشه سمت راست در بالای صفحه در هوم اسکرین قراردارد و بعد ۵ مدل صدا انتخاب کند. سیستم تشخیص صدا از تکنولوژی OpenAI’s Whisper  استفاده می‌کند، سرویسی که اسپاتیفای از ان استفاده می‌کند و می‌تواند پادکست‌ها را به زبان‌های مختلف ترجمه کند.

این شرکت برای ارتقای قابلیت‌های چت جی‌پی‌تی، با احتیاط زیادی پیش رفته و عمل می‌کند. به همین دلیل تکنولوژی تشخیص صدا به صورت محدود عرضه می‌شود تا از آن برای کلاهبرداری یا دیگر مقاصد غیر قانونی استفاده نشود.

به علاوه، OpenAI  یک تیم امنیتی استخدام کرده تا مطمئن شود این چت بات در مورد تصاویری که دریافت می‌کند، مطلب نا مناسبی نگوید. این شرکت نمی‌تواند تضمین کند که هیچ خطایی رخ ندهد اما قول داده که بازخورد کاربران را به صورت مستمر دریافت کرده و از آنها برای ارتقا سیستم خود استفاده کند.

منبع: techspot

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا