एआई भाषा मॉडल जटिल मामलों के निदान में मेडिकल मॉडल से बेहतर प्रदर्शन करते हैं, वैज्ञानिकों का कहना है

इजरायल के शोधकर्ताओं ने जटिल चिकित्सा मामलों के निदान के लिए AI की क्षमता का परीक्षण करने हेतु नया डेटाबेस विकसित किया

पेसाच बेन्सन • 13 मई, 2025

येरुशलम, 13 मई, 2025 (टीपीएस-आईएल) — बेन-गुरियन यूनिवर्सिटी ऑफ़ द नेगेव के शोधकर्ताओं की एक टीम ने AI भाषा मॉडल की जटिल चिकित्सा मामलों का निदान करने की क्षमता का परीक्षण करने के लिए एक नया डेटाबेस विकसित किया है। फिलाडेल्फिया में एसोसिएशन फॉर द एडवांसमेंट ऑफ़ आर्टिफिशियल इंटेलिजेंस में प्रस्तुत उनके निष्कर्षों से पता चलता है कि GPT-4o जैसे सामान्य-उद्देश्य वाले मॉडल, विशेष रूप से चिकित्सा के लिए डिज़ाइन किए गए मॉडल की तुलना में अधिक प्रभावी हो सकते हैं।

परंपरागत रूप से, AI भाषा मॉडल का परीक्षण सरल चिकित्सा मामलों पर किया गया है, जैसे परीक्षा प्रश्न या सामान्य बीमारियाँ। हालांकि, इन मॉडलों का मूल्यांकन जटिल, वास्तविक दुनिया के उन मामलों पर नहीं किया गया है जिनका सामना डॉक्टर अक्सर करते हैं। इस कमी को पूरा करने के लिए, शोधकर्ताओं ने 3,562 चिकित्सा केस रिपोर्ट का एक डेटाबेस बनाया, जो बीएमसी जर्नल ऑफ़ मेडिकल केस रिपोर्ट्स से लिया गया है। इसमें असामान्य चिकित्सा मामलों और उनके निदान का विस्तृत विवरण शामिल है। मामलों को मल्टीपल-चॉइस और ओपन-एंडेड दोनों तरह के प्रश्नों का उपयोग करके प्रस्तुत किया गया, जो वास्तविक जीवन के नैदानिक परिदृश्यों की नकल करते हैं।

परिणाम आश्चर्यजनक थे। GPT-4o, एक सामान्य-उद्देश्य वाला भाषा मॉडल, ने इन जटिल मामलों का निदान करने में मेडिट्रॉन-70B और मेडएलएम-लार्ज जैसे चिकित्सा मॉडल को पीछे छोड़ दिया। GPT-4o ने मल्टीपल-चॉइस प्रश्नों पर 87.9% सटीकता और ओपन-एंडेड प्रश्नों पर 76.4% सटीकता हासिल की, जो विशेषीकृत मॉडलों से बेहतर प्रदर्शन था।

शोधकर्ताओं में से एक, ओफिर बेन-शोहम ने कहा, “हमें यह देखकर आश्चर्य हुआ कि GPT-4o जैसे सामान्य मॉडल, चिकित्सा के लिए अनुकूलित मॉडलों से बेहतर प्रदर्शन करते हैं। हमने दिखाया है कि बड़े भाषा मॉडल का उपयोग जटिल चिकित्सा मामलों का निदान करने के लिए किया जा सकता है।”

यह शोध महत्वपूर्ण है क्योंकि यह दर्शाता है कि GPT-4o जैसे AI मॉडल चुनौतीपूर्ण चिकित्सा स्थितियों का अधिक कुशलता से निदान करने में मदद कर सकते हैं। टीम द्वारा बनाए गए CUPCase डेटाबेस भविष्य में नए AI मॉडल के परीक्षण के लिए एक मूल्यवान उपकरण बन सकता है। डेटाबेस उपयोग के लिए खुला है और नए मॉडल विकसित होने पर अतिरिक्त मामलों के साथ इसका विस्तार किया जा सकता है।

शोध छात्र उरिएल पेरेत्ज़ ने कहा, “लक्ष्य एक ऐसी प्रणाली बनाना था जो यह मूल्यांकन कर सके कि भाषा मॉडल केवल सामान्य मामलों का ही नहीं, बल्कि वास्तविक दुनिया के जटिल मामलों का निदान कितनी अच्छी तरह कर सकते हैं।”

अनुसंधान टीम के एक अन्य सदस्य, डॉ. नादाव रैपोपोर्ट ने समझाया कि जटिल मामलों का निदान एक लंबी और अनिश्चित प्रक्रिया हो सकती है, जिससे रोगियों के लिए देरी और उच्च लागत हो सकती है। CUPCase डेटाबेस, विस्तृत वास्तविक दुनिया के मामले प्रदान करके, इस प्रक्रिया को तेज करने और रोगी देखभाल में सुधार करने में मदद कर सकता है।

इस शोध के स्वास्थ्य सेवा में कई व्यावहारिक अनुप्रयोग हैं, मुख्य रूप से चिकित्सा निदान की गति और सटीकता में सुधार करके। GPT-4o जैसे AI मॉडल डॉक्टरों को जटिल चिकित्सा मामलों का तेजी से निदान करने में सहायता कर सकते हैं, जिससे नैदानिक देरी कम हो सकती है और रोगी के परिणाम बेहतर हो सकते हैं। CUPCase डेटाबेस, जिसमें वास्तविक दुनिया के मामलों का संग्रह है, एक मूल्यवान नैदानिक निर्णय समर्थन उपकरण के रूप में काम कर सकता है, जिससे डॉक्टरों को अधिक सटीक निर्णय लेने में मदद मिलेगी, खासकर कठिन या दुर्लभ मामलों के लिए।

इसके अतिरिक्त, AI मॉडल चिकित्सा पेशेवरों के प्रशिक्षण में सहायता कर सकता है, जटिल नैदानिक प्रक्रियाओं को सीखने के लिए एक इंटरैक्टिव संसाधन प्रदान कर सकता है।

AI-संचालित उपकरण उन कम सेवा वाले क्षेत्रों में विशेषज्ञ-स्तरीय नैदानिक सहायता तक पहुंच का विस्तार भी कर सकते हैं, जहां विशेषज्ञ सीमित हो सकते हैं। गंभीर देखभाल सेटिंग्स में, AI मॉडल वास्तविक समय में नैदानिक सहायता प्रदान कर सकते हैं।