تکنولوژی

مدل هوش مصنوعی جدید می‌تواند ریسک ابتلا به بیماری‌ها را در طول زندگی افراد پیش‌بینی کند

بخش بزرگی از هنر پزشکی در تشخیص بیماری‌های فعلی بیمار است، که از طریق پرسش‌های دقیق و معاینات فیزیکی انجام می‌شود. اما دشوارتر – و در عین حال بسیار ارزشمند – شناسایی بیماری‌هایی است که ممکن است در آینده برای بیمار رخ دهند. این همان کاری است که تیم تحقیقاتی پشت یک مدل جدید هوش مصنوعی ادعا می‌کند قادر به انجام آن است. نتایج این پژوهش در تاریخ ۱۷ سپتامبر در نشریه Nature منتشر شد.

اگرچه مدل، به نام Delphi-2M، هنوز برای استفاده در بیمارستان‌ها آماده نیست، اما سازندگان آن امیدوارند روزی بتوان از آن برای پیش‌بینی احتمال ابتلای بیماران به بیش از ۱۰۰۰ بیماری مختلف از جمله آلزایمر، سرطان و حمله قلبی استفاده کرد؛ بیماری‌هایی که سالانه میلیون‌ها نفر را تحت تأثیر قرار می‌دهند. علاوه بر شناسایی بیماران پرخطر، این مدل می‌تواند به مقامات بهداشتی در تخصیص بودجه به حوزه‌های بیماری‌هایی که نیاز به منابع بیشتر دارند، کمک کند.

این مدل توسط تیم‌های European Molecular Biology Laboratory (EMBL) در کمبریج و German Cancer Research Centre در هایدلبرگ توسعه یافته است. طراحی Delphi-2M از مدل‌های زبانی بزرگ (LLM) مانند GPT-5 الهام گرفته است؛ این مدل‌ها قادر به تولید متن روان هستند و با بررسی الگوهای موجود در حجم عظیمی از داده‌های متنی، احتمال کلمه بعدی در جمله را پیش‌بینی می‌کنند. سازندگان Delphi-2M استدلال کردند که یک مدل هوش مصنوعی تغذیه‌شده با حجم زیادی از داده‌های سلامت انسانی می‌تواند قدرت پیش‌بینی مشابهی داشته باشد.

در بسیاری از جنبه‌ها، طراحی LLMهای موجود برای این کار مناسب بود. با این حال، یک تغییر اساسی لازم بود: مدل باید قادر باشد فاصله زمانی بین رخدادهای زندگی بیمار را در نظر بگیرد. در متن، کلمات به صورت پشت سر هم می‌آیند؛ اما در سوابق پزشکی، تشخیص‌ها ممکن است سال‌ها از یکدیگر فاصله داشته باشند. برای مثال، فشار خون بالا پس از یک تست مثبت بارداری، بسته به فاصله زمانی بین این دو رخداد، معانی متفاوتی دارد؛ اگر فاصله کوتاه باشد، می‌تواند بر بارداری تأثیر بگذارد، اما اگر سال‌ها از هم فاصله داشته باشند، تفسیر متفاوت است.

این تنظیم با جایگزینی بخشی از مدل که موقعیت کلمات را رمزگذاری می‌کند با بخشی که سن فرد را رمزگذاری می‌کند، انجام شد. این تغییر بدون چالش نبوده است: در نسخه‌های اولیه، گاهی تشخیص‌های جدید حتی پس از مرگ فرد پیش‌بینی می‌شد.

Delphi-2M سپس روی داده‌های ۴۰۰ هزار نفر از UK Biobank آموزش داده شد؛ این پایگاه داده یکی از کامل‌ترین مجموعه‌های داده زیستی انسانی در جهان است. مدل ترتیب زمانی و توالی کدهای ICD-10 – کدهای رسمی بین‌المللی برای ثبت تشخیص‌ها – را دریافت کرد و شامل ۱۲۵۶ بیماری مختلف بود که در داده‌های Biobank ظاهر شده بود. مدل سپس با داده‌های ۱۰۰ هزار نفر باقی‌مانده در Biobank اعتبارسنجی شد و پس از آن روی سوابق پزشکی دانمارک که از نظر طول مدت و دقت بسیار مشهور است، آزمایش شد. در این آزمایش، داده‌های ۱.۹ میلیون دانمارکی از سال ۱۹۷۸ مورد استفاده قرار گرفت تا نمونه‌ای متنوع و نماینده‌تر نسبت به UK Biobank فراهم شود.

برای سنجش عملکرد مدل، پژوهشگران از شاخص AUC (Area Under the Curve) استفاده کردند. مقدار ۱ نشان‌دهنده پیش‌بینی کامل و ۰.۵ به معنای عملکردی برابر با تصادف است. برای پیش‌بینی تشخیص‌ها ظرف پنج سال بعد از یک تشخیص قبلی، Delphi-2M به‌طور متوسط ۰.۷۶ در داده‌های بریتانیایی و ۰.۶۷ در داده‌های دانمارکی عملکرد داشت. رویدادهایی که اغلب پس از یک رخداد مشخص رخ می‌دهند – مانند مرگ پس از سپسیس – با دقت بیشتری پیش‌بینی شدند، در حالی که عواملی با منشأ تصادفی یا خارجی، مانند ابتلا به یک ویروس، دشوارتر بودند. همان‌طور که انتظار می‌رفت، دقت مدل با افزایش زمان کاهش می‌یابد: برای پیش‌بینی ده سال آینده، میانگین دقت به ۰.۷ رسید.

کاربردهای واقعی هنوز فاصله زیادی دارند. Delphi-2M ابتدا باید دوره آزمایشی دقیق‌تری را پشت سر بگذارد تا پزشکان بتوانند بررسی کنند که آیا استفاده از آن به نتایج بهتر برای بیماران منجر می‌شود یا خیر. این فرآیند ممکن است سال‌ها طول بکشد. تیم Delphi-2M همچنین در حال به‌روزرسانی مدل است تا قادر باشد داده‌های پیچیده‌تری نسبت به فهرست‌های زمانی تشخیص‌ها را پردازش کند. از آنجایی که UK Biobank شامل تصاویر پزشکی و توالی‌های ژنومی نیز هست، افزودن این داده‌ها می‌تواند دقت مدل را افزایش دهد.

اگرچه Delphi-2M بسیار چشمگیر به نظر می‌رسد، تنها مدل پیش‌بینی سلامت نیست. برای مثال، مدلی به نام Foresight که در ۲۰۲۴ در King’s College London توسعه یافت، از سوابق پزشکی بیماران برای پیش‌بینی رویدادهای سلامت آینده استفاده می‌کند. (نسخه بزرگ‌تر این پروژه در ژوئن متوقف شد زیرا NHS انگلستان مجوزهای لازم را به‌طور کامل برای دسترسی تیم Foresight به داده‌ها صادر نکرده بود.) همچنین مدل Ethos در دانشگاه هاروارد اهداف مشابهی دارد.

اگرچه بیماران هنوز باید منتظر مزایای مستقیم باشند، حتی نسخه اولیه Delphi-2M نیز منبع ارزشمندی برای زیست‌شناسان فراهم می‌کند. پیش‌بینی‌های این مدل نشان می‌دهد که کدام بیماری‌ها با هم خوشه‌بندی می‌شوند و ممکن است روابط ناشناخته بین بیماری‌ها را آشکار کند. مدل‌های آینده و بزرگ‌تر می‌توانند این مسیر را عمیق‌تر کنند. ایوان بیرنی، ژنتیک‌دان EMBL، می‌گوید: «مثل کودکی هستم که وارد یک فروشگاه آبنبات شده است.

نوشته های مشابه

دکمه بازگشت به بالا