توسعه مدل جدید گوگل برای فهم زبان دلفینها
در بهار ۲۰۲۵، گوگل از یک مدل هوش مصنوعی جدید به نام DolphinGemma رونمایی کرد که هدف آن، تحلیل و درک الگوهای ارتباطی دلفینهاست. این مدل، نخستین بار در تابستان آینده در پروژهای میدانی به کار گرفته خواهد شد.
دلفینها سالهاست به عنوان یکی از باهوشترین موجودات زمین شناخته میشوند. آنها قادرند با یکدیگر همکاری کنند، مهارتهای جدید بیاموزند و حتی میتوانند خودشان را در آینه تشخیص دهند، که نشانهای از خودآگاهی است. با این حال، رمزگشایی از صدای کلیکها و سوتهای پیچیده آنها، همواره یکی از چالشهای مهم زیستشناسان بوده است. گوگل اکنون با تکیه بر مدلهای زبان باز خود و همکاری با پروژهWild Dolphin Project (WDP) ، گامی جدید در این مسیر برداشته است.
WDP از سال ۱۹۸۵ روی جامعهای از دلفینهای خالدار آتلانتیک مطالعه کرده و با استفاده از رویکردهای غیرتهاجمی، صدها ساعت داده صوتی و تصویری از رفتار و ارتباط این جانوران جمعآوری کرده است. هدف اصلی این پروژه، بررسی نحوه تأثیر اصوات دلفینها بر تعاملات اجتماعی آنهاست. برای مثال، برخی سوتها که به نظر میرسد به عنوان “نام” دلفینها استفاده میشود، به یافتن یکدیگر کمک میکند. همچنین، صداهای خاصی در هنگام نزاع بین آنها ثبت شده که الگوهای تکراری دارند.
به گفته دنیز هرزینگ از WDP، هنوز نمیدانیم حیوانات “واژه” دارند یا خیر، اما تحلیل ساختار و الگوهای گفتاری آنها میتواند ما را یک قدم به پاسخ نزدیکتر کند.
مدل DolphinGemma چگونه کار میکند؟
این مدل بر پایه فناوریهای متنباز Gemma توسعه یافته که خود نسخهای سبکتر از مدلهای تجاری Gemini گوگل است. در DolphinGemma از فناوری صوتی SoundStream برای رمزگذاری و تجزیه صدای دلفینها استفاده شده و دادهها به صورت «ورودی صدا / خروجی صدا» پردازش میشوند. عملکرد این مدل مشابه LLMهای متنیست: مدل، یک صدا از دلفین را دریافت میکند و بر اساس پیشبینی، صدای بعدی را تولید میکند؛ به این ترتیب، خروجی میتواند به زبانی باشد که برای خود دلفینها معنادار است.
گوگل امیدوار است این مدل بتواند الگوهای پیچیدهای را استخراج کند که به ایجاد نوعی واژگان مشترک میان انسان و دلفین منجر شود—تحلیلی که انجام آن به شکل دستی بسیار زمانبر خواهد بود.
استفاده از مدل روی گوشیهای پیکسل
از آنجا که پژوهشگران WDP در محیطهای طبیعی و زیر آب فعالیت میکنند، استفاده از سیستمهای کوچک و قابلحمل ضروری است. برای همین، مدل DolphinGemma بهگونهای طراحی شده که روی گوشیهای هوشمند Pixel نیز قابل اجرا باشد. این مدل تنها ۴۰۰ میلیون پارامتر دارد—که در مقایسه با مدلهای بزرگتر، این عدد نسبتاً کوچک است اما کارایی بالایی دارد.
تیم تحقیقاتی از سیستمی به نام CHAT (مخففCetacean Hearing Augmentation Telemetry )استفاده میکند که نسخه اولیه آن با استفاده از گوشی Pixel 6 طراحی و ساخته شده بود. این دستگاه میتواند صدای مصنوعی دلفین تولید کند و پاسخهای صوتی دلفینها را تقلید کند. در تابستان ۲۰۲۵، نسخه جدیدی از این سیستم با استفاده از Pixel 9 استفاده خواهد شد که قابلیت اجرای همزمان مدلهای یادگیری عمیق و امکان اجرای الگوریتمهای تطبیق الگو را فراهم میکند.
با وجود این، قرار نیست خروجی DolphinGemma مستقیماً از طریق CHAT برای دلفینها پخش شود. بلکه، این دو مسیر تحقیقاتی به صورت موازی دنبال میشوند. گوگل اعلام کرده این پروژه همچنان در مراحل اولیه است و کسی انتظار ندارد انسانها به این زودیها به زبان دلفینها مسلط شوند، اما امکان تعاملات ساده و اولیه در آیندهای نزدیک دور از ذهن نیست.
دسترسی آزاد برای پژوهشگران
همانند سایر مدلهای Gemma، مدل DolphinGemma نیز به صورت متنباز منتشر خواهد شد و گوگل اعلام کرده که در تابستان پیش رو، این مدل در اختیار پژوهشگران سراسر جهان قرار خواهد گرفت. اگرچه نسخه اولیه فقط با صدای دلفینهای خالدار آتلانتیک آموزش دیده، گوگل معتقد است امکان آموزش مدل برای گونههای دیگر نهنگسانان نیز وجود دارد.