इज़रायली स्टार्टअप ने AI मॉडलों को एक-दूसरे को स्वायत्त रूप से रैंक करने में सक्षम बनाया
इज़रायली AI स्टार्टअप Caura.ai ने PeerRank का अनावरण किया, एक नया ढांचा जहां AI मॉडल स्वायत्त रूप से एक-दूसरे को रैंक करते हैं, जो स्व-मूल्यांकन से बेहतर प्रदर्शन करता है और पहचानता है।
यरुशलम, 5 फरवरी, 2026 (टीपीएस-आईएल) — इज़रायली एआई स्टार्टअप काउरा.एआई (Caura.ai) ने पीयररैंक (PeerRank) का अनावरण किया है, जो एक नया स्वायत्त ढांचा है जिसमें एआई मॉडल मानवीय निरीक्षण के बिना एक-दूसरे का मूल्यांकन करते हैं। यह प्रणाली कार्य उत्पन्न करती है, लाइव वेब एक्सेस का उपयोग करके उनका उत्तर देती है, और पक्षपात-जागरूक रैंकिंग तैयार करती है।
पीयररैंक का परीक्षण 12 वाणिज्यिक एआई मॉडल पर किया गया, जिसमें जीपीटी-5.2 (GPT-5.2) और क्लॉड ओपस 4.5 (Claude Opus 4.5) शामिल थे, जिससे 253,000 से अधिक पीयर-टू-पीयर निर्णय उत्पन्न हुए। शोध से पता चलता है कि सहकर्मी मूल्यांकन आत्म-मूल्यांकन से बेहतर प्रदर्शन करता है, सटीकता को मज़बूती से पहचानता है और साथ ही एआई निर्णय में व्यवस्थित पक्षपातों को उजागर करता है। एक ब्लाइंड मूल्यांकन में क्लॉड ओपस 4.5 (Claude Opus 4.5) ने रैंकिंग में मामूली बढ़त हासिल की।
काउरा.एआई (Caura.ai) ने बेन-गुरियन विश्वविद्यालय, नेगेव के साथ मिलकर इस ढांचे को सह-विकसित किया है, जिसका उद्देश्य एआई प्रदर्शन की पारदर्शिता और वास्तविक दुनिया के मूल्यांकन में सुधार करना है।