تکنولوژیعلمیگوگلهوش مصنوعی

توسعه مدل جدید گوگل برای فهم زبان دلفین‌ها

در بهار ۲۰۲۵، گوگل از یک مدل هوش مصنوعی جدید به نام DolphinGemma رونمایی کرد که هدف آن، تحلیل و درک الگوهای ارتباطی دلفین‌هاست. این مدل، نخستین بار در تابستان آینده در پروژه‌ای میدانی به کار گرفته خواهد شد.

دلفین‌ها سال‌هاست به عنوان یکی از باهوش‌ترین موجودات زمین شناخته می‌شوند. آن‌ها قادرند با یکدیگر همکاری کنند، مهارت‌های جدید بیاموزند و حتی می‌توانند خودشان را در آینه تشخیص دهند، که نشانه‌ای از خودآگاهی است. با این حال، رمزگشایی از صدای کلیک‌ها و سوت‌های پیچیده آن‌ها، همواره یکی از چالش‌های مهم زیست‌شناسان بوده است. گوگل اکنون با تکیه بر مدل‌های زبان باز خود و همکاری با پروژهWild Dolphin Project (WDP)  ، گامی جدید در این مسیر برداشته است.

WDP از سال ۱۹۸۵ روی جامعه‌ای از دلفین‌های خال‌دار آتلانتیک مطالعه کرده و با استفاده از رویکردهای غیرتهاجمی، صدها ساعت داده صوتی و تصویری از رفتار و ارتباط این جانوران جمع‌آوری کرده است. هدف اصلی این پروژه، بررسی نحوه تأثیر اصوات دلفین‌ها بر تعاملات اجتماعی آن‌هاست. برای مثال، برخی سوت‌ها که به نظر می‌رسد به عنوان “نام” دلفین‌ها استفاده می‌شود، به یافتن یکدیگر کمک می‌کند. همچنین، صداهای خاصی در هنگام نزاع بین آن‌ها ثبت شده که الگوهای تکراری دارند.

به گفته دنیز هرزینگ از WDP، هنوز نمی‌دانیم حیوانات “واژه” دارند یا خیر، اما تحلیل ساختار و الگوهای گفتاری آن‌ها می‌تواند ما را یک قدم به پاسخ نزدیک‌تر کند.

مدل DolphinGemma چگونه کار می‌کند؟

این مدل بر پایه‌ فناوری‌های متن‌باز Gemma  توسعه یافته که خود نسخه‌ای سبک‌تر از مدل‌های تجاری Gemini  گوگل است. در DolphinGemma  از فناوری صوتی SoundStream برای رمزگذاری و تجزیه صدای دلفین‌ها استفاده شده و داده‌ها به صورت «ورودی صدا / خروجی صدا» پردازش می‌شوند. عملکرد این مدل مشابه LLMهای متنی‌ست: مدل، یک صدا از دلفین را دریافت می‌کند و بر اساس پیش‌بینی، صدای بعدی را تولید می‌کند؛ به این ترتیب، خروجی می‌تواند به زبانی باشد که برای خود دلفین‌ها معنادار است.

طیف‌نگاری‌ای که یک سوت شبیه به صدای دلفین (سمت چپ) و مجموعه‌ای از کلیک‌ها و وزوزها (سمت راست) را نشان می‌دهد که در مرحله آزمایش توسط مدل DolphinGemma تولید شده‌اند.

گوگل امیدوار است این مدل بتواند الگوهای پیچیده‌ای را استخراج کند که به ایجاد نوعی واژگان مشترک میان انسان و دلفین منجر شود—تحلیلی که انجام آن به شکل دستی بسیار زمان‌بر خواهد بود.

استفاده از مدل روی گوشی‌های پیکسل

از آنجا که پژوهشگران WDP در محیط‌های طبیعی و زیر آب فعالیت می‌کنند، استفاده از سیستم‌های کوچک و قابل‌حمل ضروری است. برای همین، مدل DolphinGemma به‌گونه‌ای طراحی شده که روی گوشی‌های هوشمند Pixel نیز قابل اجرا باشد. این مدل تنها ۴۰۰ میلیون پارامتر دارد—که در مقایسه با مدل‌های بزرگ‌تر، این عدد نسبتاً کوچک است اما کارایی بالایی دارد.

تیم تحقیقاتی از سیستمی به نام CHAT  (مخففCetacean Hearing Augmentation Telemetry  )استفاده می‌کند که نسخه اولیه آن با استفاده از گوشی Pixel 6 طراحی و ساخته شده بود. این دستگاه می‌تواند صدای مصنوعی دلفین تولید کند و پاسخ‌های صوتی دلفین‌ها را تقلید کند. در تابستان ۲۰۲۵، نسخه جدیدی از این سیستم با استفاده از Pixel 9 استفاده خواهد شد که قابلیت اجرای همزمان مدل‌های یادگیری عمیق و امکان اجرای الگوریتم‌های تطبیق الگو را فراهم می‌کند.

نسخه جدید سیستم CHAT با پشتیبانی از Pixel 9

با وجود این، قرار نیست خروجی DolphinGemma مستقیماً از طریق CHAT برای دلفین‌ها پخش شود. بلکه، این دو مسیر تحقیقاتی به صورت موازی دنبال می‌شوند. گوگل اعلام کرده این پروژه همچنان در مراحل اولیه است و کسی انتظار ندارد انسان‌ها به این زودی‌ها به زبان دلفین‌ها مسلط شوند، اما امکان تعاملات ساده و اولیه در آینده‌ای نزدیک دور از ذهن نیست.

دسترسی آزاد برای پژوهشگران

همانند سایر مدل‌های Gemma، مدل DolphinGemma نیز به صورت متن‌باز منتشر خواهد شد و گوگل اعلام کرده که در تابستان پیش رو، این مدل در اختیار پژوهشگران سراسر جهان قرار خواهد گرفت. اگرچه نسخه اولیه فقط با صدای دلفین‌های خال‌دار آتلانتیک آموزش دیده، گوگل معتقد است امکان آموزش مدل برای گونه‌های دیگر نهنگ‌سانان نیز وجود دارد.

نوشته های مشابه

دکمه بازگشت به بالا