توسعه مدل جدید گوگل برای فهم زبان دلفین‌ها

حانیه شریف27 فروردین , 1404

در بهار ۲۰۲۵، گوگل از یک مدل هوش مصنوعی جدید به نام DolphinGemma رونمایی کرد که هدف آن، تحلیل و درک الگوهای ارتباطی دلفین‌هاست. این مدل، نخستین بار در تابستان آینده در پروژه‌ای میدانی به کار گرفته خواهد شد.

دلفین‌ها سال‌هاست به عنوان یکی از باهوش‌ترین موجودات زمین شناخته می‌شوند. آن‌ها قادرند با یکدیگر همکاری کنند، مهارت‌های جدید بیاموزند و حتی می‌توانند خودشان را در آینه تشخیص دهند، که نشانه‌ای از خودآگاهی است. با این حال، رمزگشایی از صدای کلیک‌ها و سوت‌های پیچیده آن‌ها، همواره یکی از چالش‌های مهم زیست‌شناسان بوده است. گوگل اکنون با تکیه بر مدل‌های زبان باز خود و همکاری با پروژهWild Dolphin Project (WDP) ، گامی جدید در این مسیر برداشته است.

مقالات مرتبط:

WDP از سال ۱۹۸۵ روی جامعه‌ای از دلفین‌های خال‌دار آتلانتیک مطالعه کرده و با استفاده از رویکردهای غیرتهاجمی، صدها ساعت داده صوتی و تصویری از رفتار و ارتباط این جانوران جمع‌آوری کرده است. هدف اصلی این پروژه، بررسی نحوه تأثیر اصوات دلفین‌ها بر تعاملات اجتماعی آن‌هاست. برای مثال، برخی سوت‌ها که به نظر می‌رسد به عنوان “نام” دلفین‌ها استفاده می‌شود، به یافتن یکدیگر کمک می‌کند. همچنین، صداهای خاصی در هنگام نزاع بین آن‌ها ثبت شده که الگوهای تکراری دارند.

به گفته دنیز هرزینگ از WDP، هنوز نمی‌دانیم حیوانات “واژه” دارند یا خیر، اما تحلیل ساختار و الگوهای گفتاری آن‌ها می‌تواند ما را یک قدم به پاسخ نزدیک‌تر کند.

مدل DolphinGemma چگونه کار می‌کند؟

این مدل بر پایه‌ فناوری‌های متن‌باز Gemma توسعه یافته که خود نسخه‌ای سبک‌تر از مدل‌های تجاری Gemini گوگل است. در DolphinGemma از فناوری صوتی SoundStream برای رمزگذاری و تجزیه صدای دلفین‌ها استفاده شده و داده‌ها به صورت «ورودی صدا / خروجی صدا» پردازش می‌شوند. عملکرد این مدل مشابه LLMهای متنی‌ست: مدل، یک صدا از دلفین را دریافت می‌کند و بر اساس پیش‌بینی، صدای بعدی را تولید می‌کند؛ به این ترتیب، خروجی می‌تواند به زبانی باشد که برای خود دلفین‌ها معنادار است.

طیف‌نگاری‌ای که یک سوت شبیه به صدای دلفین (سمت چپ) و مجموعه‌ای از کلیک‌ها و وزوزها (سمت راست) را نشان می‌دهد که در مرحله آزمایش توسط مدل DolphinGemma تولید شده‌اند.

گوگل امیدوار است این مدل بتواند الگوهای پیچیده‌ای را استخراج کند که به ایجاد نوعی واژگان مشترک میان انسان و دلفین منجر شود—تحلیلی که انجام آن به شکل دستی بسیار زمان‌بر خواهد بود.

استفاده از مدل روی گوشی‌های پیکسل

از آنجا که پژوهشگران WDP در محیط‌های طبیعی و زیر آب فعالیت می‌کنند، استفاده از سیستم‌های کوچک و قابل‌حمل ضروری است. برای همین، مدل DolphinGemma به‌گونه‌ای طراحی شده که روی گوشی‌های هوشمند Pixel نیز قابل اجرا باشد. این مدل تنها ۴۰۰ میلیون پارامتر دارد—که در مقایسه با مدل‌های بزرگ‌تر، این عدد نسبتاً کوچک است اما کارایی بالایی دارد.

تیم تحقیقاتی از سیستمی به نام CHAT (مخففCetacean Hearing Augmentation Telemetry )استفاده می‌کند که نسخه اولیه آن با استفاده از گوشی Pixel 6 طراحی و ساخته شده بود. این دستگاه می‌تواند صدای مصنوعی دلفین تولید کند و پاسخ‌های صوتی دلفین‌ها را تقلید کند. در تابستان ۲۰۲۵، نسخه جدیدی از این سیستم با استفاده از Pixel 9 استفاده خواهد شد که قابلیت اجرای همزمان مدل‌های یادگیری عمیق و امکان اجرای الگوریتم‌های تطبیق الگو را فراهم می‌کند.

نسخه جدید سیستم CHAT با پشتیبانی از Pixel 9

با وجود این، قرار نیست خروجی DolphinGemma مستقیماً از طریق CHAT برای دلفین‌ها پخش شود. بلکه، این دو مسیر تحقیقاتی به صورت موازی دنبال می‌شوند. گوگل اعلام کرده این پروژه همچنان در مراحل اولیه است و کسی انتظار ندارد انسان‌ها به این زودی‌ها به زبان دلفین‌ها مسلط شوند، اما امکان تعاملات ساده و اولیه در آینده‌ای نزدیک دور از ذهن نیست.

دسترسی آزاد برای پژوهشگران

همانند سایر مدل‌های Gemma، مدل DolphinGemma نیز به صورت متن‌باز منتشر خواهد شد و گوگل اعلام کرده که در تابستان پیش رو، این مدل در اختیار پژوهشگران سراسر جهان قرار خواهد گرفت. اگرچه نسخه اولیه فقط با صدای دلفین‌های خال‌دار آتلانتیک آموزش دیده، گوگل معتقد است امکان آموزش مدل برای گونه‌های دیگر نهنگ‌سانان نیز وجود دارد.

حانیه شریف27 فروردین , 1404

توسعه مدل جدید گوگل برای فهم زبان دلفین‌ها

مقالات مرتبط:

مدل DolphinGemma چگونه کار می‌کند؟

استفاده از مدل روی گوشی‌های پیکسل

دسترسی آزاد برای پژوهشگران

نماینده مجلس: دولت‌ها دقیقاً می‌دانند مافیای فیلترشکن‌ها چه کسانی‌اند

نماینده مجلس: همه نمایندگان سیم کارت سفید دارند

مجلس با تحقیق و تفحص درباره عملکرد فیلترشکن‌ها موافقت کرد

رکوردشکنی دوباره؛ اُکالا بار دیگر مرزهای فروش آنلاین سوپرمارکتی را جابه‌جا کرد

لو رفتن خط سفید مسئولان با قابلیت جدید «ایکس»

چطور از جریمه دیرکرد قبض آب و برق جلوگیری کنیم؟

چگونه امنیت شبکه وای فای خود را ارتقا دهیم؟

چگونه گوشی اندرویدی را به تلویزیون متصل کنیم؟

همه چیز درباره انتقال فایل از طریق «ایردراپ» در آیفون، مک و آیپد

ترفندهایی برای استفاده بهتر از iMessage

مقالات مرتبط:

مدل DolphinGemma چگونه کار می‌کند؟

استفاده از مدل روی گوشی‌های پیکسل

دسترسی آزاد برای پژوهشگران

نوشته های مشابه

نماینده مجلس: دولت‌ها دقیقاً می‌دانند مافیای فیلترشکن‌ها چه کسانی‌اند

پاسخ OpenAI به شکایت درباره خودکشی نوجوان: او از ChatGPT «به شکل نادرست و غیرمجاز» استفاده کرده بود

سرمایه‌گذاری ۵۰ میلیارد دلاری آمازون برای ساخت ابررایانه هوش مصنوعی ویژه دولت آمریکا

آغاز ارائه تاکسی‌های کاملاً خودران اوبر در امارات