यरुशलम, 5 फरवरी, 2026 (टीपीएस-आईएल) — इज़रायली एआई स्टार्टअप काउरा.एआई (Caura.ai) ने पीयररैंक (PeerRank) का अनावरण किया है, जो एक नया स्वायत्त ढांचा है जिसमें एआई मॉडल मानवीय निरीक्षण के बिना एक-दूसरे का मूल्यांकन करते हैं। यह प्रणाली कार्य उत्पन्न करती है, लाइव वेब एक्सेस का उपयोग करके उनका उत्तर देती है, और पक्षपात-जागरूक रैंकिंग तैयार करती है।
पीयररैंक का परीक्षण 12 वाणिज्यिक एआई मॉडल पर किया गया, जिसमें जीपीटी-5.2 (GPT-5.2) और क्लॉड ओपस 4.5 (Claude Opus 4.5) शामिल थे, जिससे 253,000 से अधिक पीयर-टू-पीयर निर्णय उत्पन्न हुए। शोध से पता चलता है कि सहकर्मी मूल्यांकन आत्म-मूल्यांकन से बेहतर प्रदर्शन करता है, सटीकता को मज़बूती से पहचानता है और साथ ही एआई निर्णय में व्यवस्थित पक्षपातों को उजागर करता है। एक ब्लाइंड मूल्यांकन में क्लॉड ओपस 4.5 (Claude Opus 4.5) ने रैंकिंग में मामूली बढ़त हासिल की।
काउरा.एआई (Caura.ai) ने बेन-गुरियन विश्वविद्यालय, नेगेव के साथ मिलकर इस ढांचे को सह-विकसित किया है, जिसका उद्देश्य एआई प्रदर्शन की पारदर्शिता और वास्तविक दुनिया के मूल्यांकन में सुधार करना है।