DeepSeek V4: बड़ा आर्किटेक्चर, कम लागत

3/5/2026, 2:00:00 PM

मार्च 2026 में AI मॉडल्स की रेस और भी तेज़ हो गई है। दुनिया की बड़ी टेक कंपनियां और रिसर्च लैब्स नए-नए मॉडल्स लॉन्च कर रही हैं, जिनमें बेहतर रीजनिंग, बड़ी कॉन्टेक्स्ट विंडो और ज्यादा दक्षता पर फोकस किया जा रहा है। इसी दौड़ में DeepSeek V4, GPT-5.3 और Gemini 3.1 जैसे मॉडल्स चर्चा में हैं।

रिपोर्ट्स के मुताबिक चीन का DeepSeek V4 लगभग 1 ट्रिलियन पैरामीटर आर्किटेक्चर के साथ आ रहा है। हालांकि इसकी खास बात यह है कि किसी भी समय सिर्फ 32 बिलियन पैरामीटर एक्टिव रहते हैं। इसका फायदा यह है कि मॉडल की कम्प्यूट लागत और ऊर्जा खपत कम रहती है, जबकि परफॉर्मेंस मजबूत बनी रहती है। DeepSeek V4 में: Native Multimodal Support 10 लाख से ज्यादा टोकन की कॉन्टेक्स्ट विंडो बेहतर लंबी बातचीत और डॉक्यूमेंट एनालिसिस जैसी क्षमताएं होने का दावा किया जा रहा है। Gemini 3.1 Pro: रीजनिंग में मजबूत दूसरी तरफ Google का Gemini 3.1 Pro कई बेंचमार्क में आगे बताया जा रहा है। खबरों के अनुसार ARC-AGI-2 जैसे कठिन reasoning टेस्ट में इस मॉडल ने लगभग 77.1% स्कोर हासिल किया है, जो एआई की समस्या-समाधान क्षमता को दिखाता है। इसी बीच Anthropic ने भी Claude Opus 4.6 और Claude Sonnet 4.6 लॉन्च किए हैं। इन मॉडल्स में “Adaptive Thinking” का कॉन्सेप्ट दिया गया है। इसका मतलब है कि मॉडल जरूरत के हिसाब से ज्यादा या कम सोच-समय लेक