एलएलएम क्या है?
📖 7 मिनट पढ़ा
Quick Answer
चैटजीपीटी जैसे एआई सहायक जादू की तरह महसूस कर सकते हैं, लेकिन उनके नीचे बड़े भाषा मॉडल (एलएलएम) हैं जो आश्चर्यजनक रूप से सरल काम बहुत अच्छी तरह से कर रहे हैं: अगले शब्द की भविष्यवाणी करना। यह समझना कि वे वास्तव में कैसे काम करते हैं, प्रचार को उजागर करता है - और उनकी शक्ति और उनकी सीमाओं दोनों को प्रकट करता है।
💡 इसे ऐसे समझें...
एलएलएम दुनिया के सबसे उन्नत स्वतः पूर्ण की तरह है। आपका फ़ोन किसी पाठ में अगले शब्द का अनुमान लगाता है; एलएलएम भी यही करता है, लेकिन अधिकांश मानव लेखन पर प्रशिक्षित होता है - इसलिए इसके "अनुमान" निबंध, कोड और कविताएँ लिख सकते हैं। सशक्त भविष्यवाणी, समझ नहीं.
एलएलएम क्या है
एक बड़ा भाषा मॉडल एक एआई है जिसे भारी मात्रा में पाठ पर प्रशिक्षित किया जाता है ताकि यह अनुमान लगाया जा सके कि आगे क्या होगा। कुछ शब्दों को देखते हुए, यह सबसे संभावित अगले शब्द की गणना करता है, फिर अगले, वाक्यों का निर्माण करता है। चैटजीपीटी, क्लाउड, जेमिनी और लामा जैसे ओपन मॉडल सभी एलएलएम हैं।
इसे कैसे प्रशिक्षित किया जाता है
मॉडल बड़ी मात्रा में पाठ पढ़ता है और अगले शब्द की भविष्यवाणी करने में बेहतर होने के लिए अरबों आंतरिक संख्याओं ("पैरामीटर") को समायोजित करता है। यह प्रशिक्षण बेहद महंगा है और एआई की अधिकांश लागत और ऊर्जा यहीं खर्च होती है। परिणाम एक ऐसा मॉडल है जिसने भाषा, तथ्य और तर्क के पैटर्न को अवशोषित कर लिया है।
टोकन: यह कैसे पढ़ता है
एलएलएम शब्दों को सटीक रूप से नहीं देखते हैं - वे पाठ को "टोकन" (शब्द के टुकड़े) में तोड़ते हैं और उनके साथ काम करते हैं। यही कारण है कि एआई उपयोग की कीमत अक्सर प्रति टोकन होती है, और मॉडल में "संदर्भ विंडो" सीमा क्यों होती है - पाठ की अधिकतम मात्रा जिस पर वे एक बार में विचार कर सकते हैं।
यह वास्तव में "सोच" क्यों नहीं है
एलएलएम में कोई समझ, विश्वास या जागरूकता नहीं होती - यह पैटर्न के आधार पर प्रशंसनीय पाठ की भविष्यवाणी कर रहा है। यही कारण है कि यह गलत होते हुए भी आश्वस्त लग सकता है ("मतिभ्रम"), और जब तक इसे न दिया जाए तब तक चैट के बीच इसकी कोई सच्ची स्मृति नहीं होती है। शानदार पैटर्न-मिलान, दिमाग नहीं।
🔑 कुंजी ले जाएं
एक बड़ा भाषा मॉडल (एलएलएम) एक एआई है जिसे अगले शब्द की भविष्यवाणी करने के लिए बड़ी मात्रा में टेक्स्ट पर प्रशिक्षित किया जाता है, जो टोकन दर टोकन वाक्य बनाता है। यह असाधारण रूप से सक्षम पैटर्न-मिलान है - समझ में नहीं आता - यही कारण है कि यह आत्मविश्वास से गलत (मतिभ्रम) हो सकता है। चैटजीपीटी, क्लाउड और लामा जैसे ओपन मॉडल सभी एलएलएम हैं।
यह आपके लिए क्यों मायने रखता है?
जैसे-जैसे एआई पूरे एशिया में काम को नया आकार देता है, यह समझना कि एलएलएम वास्तव में क्या हैं - शक्तिशाली लेकिन गलत भविष्यवाणी इंजन - आपको उनका बुद्धिमानी से उपयोग करने, उनकी त्रुटियों को पहचानने और यह तय करने में मदद करता है कि किसी निगम को डेटा भेजने के बजाय अपना निजी मॉडल कब चलाना है।
अक्सर पूछे जाने वाले प्रश्नों
क्या एलएलएम वास्तव में बुद्धिमान है?▼
मानवीय अर्थों में नहीं. एक एलएलएम अपने द्वारा सीखे गए पैटर्न के आधार पर प्रशंसनीय पाठ की भविष्यवाणी करता है - इसमें कोई समझ, विश्वास या जागरूकता नहीं होती है। यह उल्लेखनीय रूप से उपयोगी हो सकता है और निश्चित रूप से गलत भी हो सकता है, क्योंकि यह पैटर्न से मेल खाता है, सोच से नहीं।
एआई कभी-कभी बातें क्यों बना देता है?▼
क्योंकि यह विश्वसनीय लगने वाले पाठ की भविष्यवाणी करता है, सत्यापित सत्य की नहीं। जब इसमें सही पैटर्न का अभाव होता है, तो यह एक आश्वस्त लेकिन गलत उत्तर उत्पन्न करता है - जिसे "मतिभ्रम" कहा जाता है। हमेशा महत्वपूर्ण AI आउटपुट को सत्यापित करें।
टोकन क्या है?▼
पाठ का एक टुकड़ा (अक्सर एक शब्द या एक शब्द का हिस्सा) जिसे एलएलएम संसाधित करता है। मॉडल टोकन पढ़ते हैं और उत्पन्न करते हैं, उपयोग की कीमत अक्सर प्रति टोकन होती है, और "संदर्भ विंडो" अधिकतम टोकन है जिस पर एक मॉडल एक बार में विचार कर सकता है।