مدل هوش مصنوعی جدید میتواند ریسک ابتلا به بیماریها را در طول زندگی افراد پیشبینی کند
بخش بزرگی از هنر پزشکی در تشخیص بیماریهای فعلی بیمار است، که از طریق پرسشهای دقیق و معاینات فیزیکی انجام میشود. اما دشوارتر – و در عین حال بسیار ارزشمند – شناسایی بیماریهایی است که ممکن است در آینده برای بیمار رخ دهند. این همان کاری است که تیم تحقیقاتی پشت یک مدل جدید هوش مصنوعی ادعا میکند قادر به انجام آن است. نتایج این پژوهش در تاریخ ۱۷ سپتامبر در نشریه Nature منتشر شد.
اگرچه مدل، به نام Delphi-2M، هنوز برای استفاده در بیمارستانها آماده نیست، اما سازندگان آن امیدوارند روزی بتوان از آن برای پیشبینی احتمال ابتلای بیماران به بیش از ۱۰۰۰ بیماری مختلف از جمله آلزایمر، سرطان و حمله قلبی استفاده کرد؛ بیماریهایی که سالانه میلیونها نفر را تحت تأثیر قرار میدهند. علاوه بر شناسایی بیماران پرخطر، این مدل میتواند به مقامات بهداشتی در تخصیص بودجه به حوزههای بیماریهایی که نیاز به منابع بیشتر دارند، کمک کند.
این مدل توسط تیمهای European Molecular Biology Laboratory (EMBL) در کمبریج و German Cancer Research Centre در هایدلبرگ توسعه یافته است. طراحی Delphi-2M از مدلهای زبانی بزرگ (LLM) مانند GPT-5 الهام گرفته است؛ این مدلها قادر به تولید متن روان هستند و با بررسی الگوهای موجود در حجم عظیمی از دادههای متنی، احتمال کلمه بعدی در جمله را پیشبینی میکنند. سازندگان Delphi-2M استدلال کردند که یک مدل هوش مصنوعی تغذیهشده با حجم زیادی از دادههای سلامت انسانی میتواند قدرت پیشبینی مشابهی داشته باشد.
در بسیاری از جنبهها، طراحی LLMهای موجود برای این کار مناسب بود. با این حال، یک تغییر اساسی لازم بود: مدل باید قادر باشد فاصله زمانی بین رخدادهای زندگی بیمار را در نظر بگیرد. در متن، کلمات به صورت پشت سر هم میآیند؛ اما در سوابق پزشکی، تشخیصها ممکن است سالها از یکدیگر فاصله داشته باشند. برای مثال، فشار خون بالا پس از یک تست مثبت بارداری، بسته به فاصله زمانی بین این دو رخداد، معانی متفاوتی دارد؛ اگر فاصله کوتاه باشد، میتواند بر بارداری تأثیر بگذارد، اما اگر سالها از هم فاصله داشته باشند، تفسیر متفاوت است.
این تنظیم با جایگزینی بخشی از مدل که موقعیت کلمات را رمزگذاری میکند با بخشی که سن فرد را رمزگذاری میکند، انجام شد. این تغییر بدون چالش نبوده است: در نسخههای اولیه، گاهی تشخیصهای جدید حتی پس از مرگ فرد پیشبینی میشد.
Delphi-2M سپس روی دادههای ۴۰۰ هزار نفر از UK Biobank آموزش داده شد؛ این پایگاه داده یکی از کاملترین مجموعههای داده زیستی انسانی در جهان است. مدل ترتیب زمانی و توالی کدهای ICD-10 – کدهای رسمی بینالمللی برای ثبت تشخیصها – را دریافت کرد و شامل ۱۲۵۶ بیماری مختلف بود که در دادههای Biobank ظاهر شده بود. مدل سپس با دادههای ۱۰۰ هزار نفر باقیمانده در Biobank اعتبارسنجی شد و پس از آن روی سوابق پزشکی دانمارک که از نظر طول مدت و دقت بسیار مشهور است، آزمایش شد. در این آزمایش، دادههای ۱.۹ میلیون دانمارکی از سال ۱۹۷۸ مورد استفاده قرار گرفت تا نمونهای متنوع و نمایندهتر نسبت به UK Biobank فراهم شود.
برای سنجش عملکرد مدل، پژوهشگران از شاخص AUC (Area Under the Curve) استفاده کردند. مقدار ۱ نشاندهنده پیشبینی کامل و ۰.۵ به معنای عملکردی برابر با تصادف است. برای پیشبینی تشخیصها ظرف پنج سال بعد از یک تشخیص قبلی، Delphi-2M بهطور متوسط ۰.۷۶ در دادههای بریتانیایی و ۰.۶۷ در دادههای دانمارکی عملکرد داشت. رویدادهایی که اغلب پس از یک رخداد مشخص رخ میدهند – مانند مرگ پس از سپسیس – با دقت بیشتری پیشبینی شدند، در حالی که عواملی با منشأ تصادفی یا خارجی، مانند ابتلا به یک ویروس، دشوارتر بودند. همانطور که انتظار میرفت، دقت مدل با افزایش زمان کاهش مییابد: برای پیشبینی ده سال آینده، میانگین دقت به ۰.۷ رسید.
کاربردهای واقعی هنوز فاصله زیادی دارند. Delphi-2M ابتدا باید دوره آزمایشی دقیقتری را پشت سر بگذارد تا پزشکان بتوانند بررسی کنند که آیا استفاده از آن به نتایج بهتر برای بیماران منجر میشود یا خیر. این فرآیند ممکن است سالها طول بکشد. تیم Delphi-2M همچنین در حال بهروزرسانی مدل است تا قادر باشد دادههای پیچیدهتری نسبت به فهرستهای زمانی تشخیصها را پردازش کند. از آنجایی که UK Biobank شامل تصاویر پزشکی و توالیهای ژنومی نیز هست، افزودن این دادهها میتواند دقت مدل را افزایش دهد.
اگرچه Delphi-2M بسیار چشمگیر به نظر میرسد، تنها مدل پیشبینی سلامت نیست. برای مثال، مدلی به نام Foresight که در ۲۰۲۴ در King’s College London توسعه یافت، از سوابق پزشکی بیماران برای پیشبینی رویدادهای سلامت آینده استفاده میکند. (نسخه بزرگتر این پروژه در ژوئن متوقف شد زیرا NHS انگلستان مجوزهای لازم را بهطور کامل برای دسترسی تیم Foresight به دادهها صادر نکرده بود.) همچنین مدل Ethos در دانشگاه هاروارد اهداف مشابهی دارد.
اگرچه بیماران هنوز باید منتظر مزایای مستقیم باشند، حتی نسخه اولیه Delphi-2M نیز منبع ارزشمندی برای زیستشناسان فراهم میکند. پیشبینیهای این مدل نشان میدهد که کدام بیماریها با هم خوشهبندی میشوند و ممکن است روابط ناشناخته بین بیماریها را آشکار کند. مدلهای آینده و بزرگتر میتوانند این مسیر را عمیقتر کنند. ایوان بیرنی، ژنتیکدان EMBL، میگوید: «مثل کودکی هستم که وارد یک فروشگاه آبنبات شده است.