ChatGPT गिरा आठवें स्थान पर: Prolific Humaine Study में ये टूल है अव्वल

दुनिया में जनरेटिव एआई की शुरुआत जिस चैटबॉट से हुई—यानी OpenAI का ChatGPT—वह आज भी करोड़ों यूज़र्स के लिए पहला विकल्प बना हुआ है। 2022 के अंत में लॉन्च होने के बाद से इस चैटबॉट ने AI उद्योग को पूरी तरह बदल दिया। हालाँकि, अब इस क्षेत्र में प्रतियोगिता पहले से कहीं अधिक तेज हो चुकी है। Google, xAI, DeepSeek, Mistral और Alibaba जैसे दिग्गज अपनी-अपनी हाई-परफॉर्मेंस मॉडल लेकर मैदान में उतर चुके हैं।

इसी बदलते माहौल के बीच ब्रिटेन की कंपनी Prolific ने एक नई स्टडी जारी की है, जिसने AI उद्योग में नई बहस छेड़ दी है। इस रिपोर्ट में ChatGPT को आठवें स्थान पर रखा गया है—और उससे ऊपर वे मॉडल शामिल हैं, जिन्हें पहले “दूसरी पंक्ति” का माना जाता था। यह रैंकिंग AI समुदाय के लिए किसी झटके से कम नहीं।

Prolific Humaine Study क्या कहती है?

Prolific ने अपना एक नया बेंचमार्क विकसित किया है, जिसका नाम उसने “Humaine” रखा है। कंपनी का दावा है कि यह बेंचमार्क इंसानों की वास्तविक बातचीत के मानकों के आधार पर मॉडल की गुणवत्ता को मापता है। Prolific का कहना है कि पारंपरिक AI टेस्ट आमतौर पर शोधकर्ताओं की प्राथमिकताओं पर आधारित होते हैं—जैसे कि कठिन डेटा सेट पर सटीकता या जटिल तर्क क्षमता—जबकि आम लोगों की जरूरतें बिल्कुल अलग होती हैं।

कंपनी के शब्दों में:

“आज के AI मूल्यांकन शोधकर्ताओं की ओर झुके हुए हैं, लेकिन साधारण उपयोगकर्ताओं के अनुभव को नहीं मापते। इसी अंतर को खत्म करने के लिए Humaine बेंचमार्क बनाया गया है।”

Prolific ने यह भी कहा कि कई “मानव-पसंद” आधारित लीडरबोर्ड भी पक्षपात का शिकार हो सकते हैं, क्योंकि उनमें अक्सर टेक-सेवी यूज़र की संख्या ज्यादा होती है। ऐसे प्लेटफ़ॉर्म पर परिणाम वास्तविक जनता की पसंद को पूरी तरह प्रतिबिंबित नहीं करते।

नए Humaine मॉडल में कंपनी ने ऑटोमेटेड क्वालिटी चेक सिस्टम जोड़ा है, ताकि प्रतिभागियों के जवाब विश्वसनीय और संतुलित हों।

ChatGPT के ऊपर पहुंचे ये मॉडल

स्टडी में जारी शीर्ष 10 AI मॉडल की सूची ने कई विशेषज्ञों को चौंका दिया। सूची इस प्रकार है:

Gemini 2.5 Pro (Google)
DeepSeek v3 (DeepSeek)
Magistral Medium (Mistral)
Grok 4 (xAI)
Grok 3 (xAI)
Gemini 2.5 Flash (Google)
DeepSeek R1 (DeepSeek)
ChatGPT-4.1 (OpenAI)
Gemma (Google)
Gemini 2.0 Flash (Google)

स्टडी सितंबर में प्रकाशित हुई थी, उस समय Google का Gemini 3 Pro और xAI के Grok 4.1 व Grok 4.1 Thinking मॉडल लॉन्च नहीं हुए थे। इसलिए वर्तमान रैंकिंग में भविष्य में बदलाव संभव है।

ChatGPT का आठवें स्थान पर पहुंचना क्यों चौंकाने वाला है?

AI उद्योग में पिछले दो सालों से OpenAI को लगातार शीर्ष पर माना जा रहा है। चाहे भाषा की समझ हो, तथ्यात्मक ज्ञान, कोडिंग, क्रिएटिव राइटिंग या reasoning—ChatGPT को आज भी एक मजबूत, भरोसेमंद और लचीला मॉडल माना जाता है। इसीलिए पहली बार ऐसा हुआ है जब किसी बड़े अंतरराष्ट्रीय बेंचमार्क ने इसे शीर्ष 5 से बाहर कर दिया।

और भी दिलचस्प बात यह है कि ChatGPT से ऊपर वे मॉडल रखे गए हैं जिन्हें अभी तक “उभरते” ब्रांड माना जाता था—जैसे DeepSeek और Mistral। इन कंपनियों के मॉडल हाल ही में लोकप्रिय हुए हैं, लेकिन Humaine स्टडी के अनुसार मानव-समान बातचीत में उन्होंने ChatGPT को पछाड़ दिया।

स्टडी में ChatGPT का प्रदर्शन कैसा रहा?

Prolific ने यह तो स्पष्ट नहीं किया कि ChatGPT आठवें स्थान पर कैसे पहुंचा, लेकिन उन्होंने यह ज़रूर बताया कि:

Google का Gemini 2.5 Pro लगभग हर श्रेणी में लगातार शीर्ष स्थान पर रहा
मॉडल की fluency, coherence और conversation-level quality इसे अन्य AI बॉट्स से अलग करती है

कुछ विशेषज्ञ यह भी मानते हैं कि Humaine बेंचमार्क ने शायद ऐसे मानकों पर ध्यान दिया हो जो रियल-टाइम बातचीत, भावनात्मक प्रतिक्रिया और उपयोगकर्ता की अपेक्षाओं पर आधारित थे—और इन पहलुओं में नए मॉडल अधिक “मनुष्य जैसे” बन गए हैं।

Gemini 2.5 Pro लगातार क्यों जीत रहा है?

Gemini 2.5 Pro लॉन्च के बाद से कई ग्लोबल बेंचमार्क में शीर्ष पर आता रहा है। Google ने इसमें बड़े पैमाने पर reasoning, multilingual understanding और contextual awareness को बेहतर बनाने पर फोकस किया है।

Google के अनुसार, यह मॉडल जटिल समस्याओं को बेहतर समझता है और कम गलतियाँ करता है। Humaine के आंकड़ों से भी यही संकेत मिला है कि यह मॉडल मानव-समान बातचीत में दूसरों से आगे है।

Grok और DeepSeek की तेज़ प्रगति

xAI (Elon Musk की कंपनी) द्वारा बनाए गए Grok 3 और Grok 4 ने लिस्ट में 4th और 5th स्थान पाए, जो इस साल AI उद्योग में उनकी बढ़ती ताकत को दर्शाता है। Grok मॉडल तेज़, क्रिएटिव और रियल-टाइम इंटरनेट एक्सेस फीचर्स के लिए जाने जाते हैं।

वहीं, DeepSeek चीन की नई AI कंपनियों में सबसे तेज़ी से उभरता नाम है। इसके मॉडल DeepSeek v3 और R1 ने क्रमशः 2nd और 7th स्थान हासिल किया। ये मॉडल विशेष रूप से reasoning और technical tasks में उत्कृष्ट माने जा रहे हैं।

AI दुनिया में यह रैंकिंग क्यों मायने रखती है?

AI उद्योग अब उस दौर में पहुंच चुका है जहाँ नए मॉडल बहुत तेज़ी से पुराने मॉडलों को पीछे छोड़ रहे हैं। Humaine स्टडी इस बात का संकेत है कि:

अब प्रतियोगिता केवल “तकनीकी क्षमता” पर नहीं, बल्कि यूज़र अनुभव, बातचीत की नैचुरल क्वालिटी और मानव-समान प्रतिक्रिया पर भी निर्भर होगी।
छोटे या नए खिलाड़ियों जैसे DeepSeek और Mistral भी अब बड़े दिग्गजों को चुनौती दे सकते हैं।
ChatGPT के सामने अब पहले से ज्यादा कड़ी चुनौती है, और OpenAI को अपनी अगली पीढ़ी के मॉडल में सुधार करने होंगे।

इस स्टडी ने AI उपयोगकर्ताओं और उद्योग के लिए एक बड़ा संदेश छोड़ा है—AI का भविष्य तेजी से बदल रहा है, और प्रतियोगिता अब पहले से कहीं ज्यादा रोचक हो गई है।