इजरायल के शोधकर्ताओं ने जटिल चिकित्सा मामलों के निदान के लिए AI की क्षमता का परीक्षण करने हेतु नया डेटाबेस विकसित किया
पेसाच बेन्सन • 13 मई, 2025
येरुशलम, 13 मई, 2025 (टीपीएस-आईएल) — बेन-गुरियन यूनिवर्सिटी ऑफ़ द नेगेव के शोधकर्ताओं की एक टीम ने AI भाषा मॉडल की जटिल चिकित्सा मामलों का निदान करने की क्षमता का परीक्षण करने के लिए एक नया डेटाबेस विकसित किया है। फिलाडेल्फिया में एसोसिएशन फॉर द एडवांसमेंट ऑफ़ आर्टिफिशियल इंटेलिजेंस में प्रस्तुत उनके निष्कर्षों से पता चलता है कि GPT-4o जैसे सामान्य-उद्देश्य वाले मॉडल, विशेष रूप से चिकित्सा के लिए डिज़ाइन किए गए मॉडल की तुलना में अधिक प्रभावी हो सकते हैं।
परंपरागत रूप से, AI भाषा मॉडल का परीक्षण सरल चिकित्सा मामलों पर किया गया है, जैसे परीक्षा प्रश्न या सामान्य बीमारियाँ। हालांकि, इन मॉडलों का मूल्यांकन जटिल, वास्तविक दुनिया के उन मामलों पर नहीं किया गया है जिनका सामना डॉक्टर अक्सर करते हैं। इस कमी को पूरा करने के लिए, शोधकर्ताओं ने 3,562 चिकित्सा केस रिपोर्ट का एक डेटाबेस बनाया, जो बीएमसी जर्नल ऑफ़ मेडिकल केस रिपोर्ट्स से लिया गया है। इसमें असामान्य चिकित्सा मामलों और उनके निदान का विस्तृत विवरण शामिल है। मामलों को मल्टीपल-चॉइस और ओपन-एंडेड दोनों तरह के प्रश्नों का उपयोग करके प्रस्तुत किया गया, जो वास्तविक जीवन के नैदानिक परिदृश्यों की नकल करते हैं।
परिणाम आश्चर्यजनक थे। GPT-4o, एक सामान्य-उद्देश्य वाला भाषा मॉडल, ने इन जटिल मामलों का निदान करने में मेडिट्रॉन-70B और मेडएलएम-लार्ज जैसे चिकित्सा मॉडल को पीछे छोड़ दिया। GPT-4o ने मल्टीपल-चॉइस प्रश्नों पर 87.9% सटीकता और ओपन-एंडेड प्रश्नों पर 76.4% सटीकता हासिल की, जो विशेषीकृत मॉडलों से बेहतर प्रदर्शन था।
शोधकर्ताओं में से एक, ओफिर बेन-शोहम ने कहा, “हमें यह देखकर आश्चर्य हुआ कि GPT-4o जैसे सामान्य मॉडल, चिकित्सा के लिए अनुकूलित मॉडलों से बेहतर प्रदर्शन करते हैं। हमने दिखाया है कि बड़े भाषा मॉडल का उपयोग जटिल चिकित्सा मामलों का निदान करने के लिए किया जा सकता है।”
यह शोध महत्वपूर्ण है क्योंकि यह दर्शाता है कि GPT-4o जैसे AI मॉडल चुनौतीपूर्ण चिकित्सा स्थितियों का अधिक कुशलता से निदान करने में मदद कर सकते हैं। टीम द्वारा बनाए गए CUPCase डेटाबेस भविष्य में नए AI मॉडल के परीक्षण के लिए एक मूल्यवान उपकरण बन सकता है। डेटाबेस उपयोग के लिए खुला है और नए मॉडल विकसित होने पर अतिरिक्त मामलों के साथ इसका विस्तार किया जा सकता है।
शोध छात्र उरिएल पेरेत्ज़ ने कहा, “लक्ष्य एक ऐसी प्रणाली बनाना था जो यह मूल्यांकन कर सके कि भाषा मॉडल केवल सामान्य मामलों का ही नहीं, बल्कि वास्तविक दुनिया के जटिल मामलों का निदान कितनी अच्छी तरह कर सकते हैं।”
अनुसंधान टीम के एक अन्य सदस्य, डॉ. नादाव रैपोपोर्ट ने समझाया कि जटिल मामलों का निदान एक लंबी और अनिश्चित प्रक्रिया हो सकती है, जिससे रोगियों के लिए देरी और उच्च लागत हो सकती है। CUPCase डेटाबेस, विस्तृत वास्तविक दुनिया के मामले प्रदान करके, इस प्रक्रिया को तेज करने और रोगी देखभाल में सुधार करने में मदद कर सकता है।
इस शोध के स्वास्थ्य सेवा में कई व्यावहारिक अनुप्रयोग हैं, मुख्य रूप से चिकित्सा निदान की गति और सटीकता में सुधार करके। GPT-4o जैसे AI मॉडल डॉक्टरों को जटिल चिकित्सा मामलों का तेजी से निदान करने में सहायता कर सकते हैं, जिससे नैदानिक देरी कम हो सकती है और रोगी के परिणाम बेहतर हो सकते हैं। CUPCase डेटाबेस, जिसमें वास्तविक दुनिया के मामलों का संग्रह है, एक मूल्यवान नैदानिक निर्णय समर्थन उपकरण के रूप में काम कर सकता है, जिससे डॉक्टरों को अधिक सटीक निर्णय लेने में मदद मिलेगी, खासकर कठिन या दुर्लभ मामलों के लिए।
इसके अतिरिक्त, AI मॉडल चिकित्सा पेशेवरों के प्रशिक्षण में सहायता कर सकता है, जटिल नैदानिक प्रक्रियाओं को सीखने के लिए एक इंटरैक्टिव संसाधन प्रदान कर सकता है।
AI-संचालित उपकरण उन कम सेवा वाले क्षेत्रों में विशेषज्ञ-स्तरीय नैदानिक सहायता तक पहुंच का विस्तार भी कर सकते हैं, जहां विशेषज्ञ सीमित हो सकते हैं। गंभीर देखभाल सेटिंग्स में, AI मॉडल वास्तविक समय में नैदानिक सहायता प्रदान कर सकते हैं।