LLM چیست؟
📖 7 دقیقه خواندن
Quick Answer
دستیارهای هوش مصنوعی مانند ChatGPT می توانند احساس جادو کنند، اما در زیر آنها مدل های زبان بزرگ (LLM) هستند که یک کار ساده و شگفت آور را به خوبی انجام می دهند: پیش بینی کلمه بعدی. درک اینکه چگونه آنها واقعاً کار می کنند، هیاهو را از بین می برد - و قدرت و محدودیت های آنها را آشکار می کند.
💡 به آن فکر کنید که…
یک LLM مانند پیشرفته ترین تکمیل خودکار جهان است. تلفن شما کلمه بعدی را در یک متن حدس می زند. یک LLM هم همین کار را میکند، اما در بسیاری از نوشتههای انسانی آموزش دیده است – بنابراین «حدسهای» آن میتواند مقاله، کد و شعر بنویسد. پیش بینی قدرتمند، نه درک.
LLM چیست
A Large Language Model یک هوش مصنوعی است که بر روی حجم عظیمی از متن آموزش داده شده است تا اتفاقات بعدی را پیش بینی کند. با توجه به برخی کلمات، محتمل ترین کلمه بعدی و سپس جملات بعدی را محاسبه می کند. ChatGPT، Claude، Gemini و مدل های باز مانند Llama همگی LLM هستند.
چگونه آموزش داده می شود
این مدل مقادیر زیادی متن را می خواند و میلیاردها عدد داخلی ("پارامترها") را تنظیم می کند تا در پیش بینی کلمه بعدی بهتر عمل کند. این آموزش بسیار گران است و بیشتر هزینه و انرژی هوش مصنوعی در آن صرف می شود. نتیجه مدلی است که الگوهای زبان، حقایق و استدلال را جذب کرده است.
نشانه ها: چگونه می خواند
LLM ها دقیقاً کلمات را نمی بینند - آنها متن را به "توکن ها" (تکه های کلمه) تقسیم می کنند و با آنها کار می کنند. به همین دلیل است که استفاده از هوش مصنوعی اغلب به ازای هر توکن قیمت گذاری می شود، و چرا مدل ها دارای محدودیت "پنجره زمینه" هستند - حداکثر مقدار متنی که می توانند در آن واحد در نظر بگیرند.
چرا واقعا "فکر" نیست
یک LLM هیچ درک، باور یا آگاهی ندارد - متن قابل قبولی را بر اساس الگوها پیش بینی می کند. به همین دلیل است که می تواند در عین اشتباه بودن ("توهم") مطمئن به نظر برسد، و به همین دلیل است که هیچ حافظه واقعی بین چت ها ندارد مگر اینکه به آن ها داده شود. تطبیق الگوی درخشان، نه یک ذهن.
🔑 غذای کلیدی
یک مدل زبان بزرگ (LLM) یک هوش مصنوعی است که بر روی مقادیر عظیمی از متن آموزش داده شده است تا کلمه بعدی را پیشبینی کند و جملات را به صورت توکن بسازد. این به طرز فوقالعادهای قادر به تطبیق الگو است - نه درک - به همین دلیل است که میتواند با اطمینان اشتباه باشد (توهم). ChatGPT، Claude و مدل های باز مانند Llama همگی LLM هستند.
چرا این برای شما مهم است
همانطور که تغییر شکلهای هوش مصنوعی در سراسر آسیا کار میکنند، درک اینکه واقعاً LLM چیست - موتورهای پیشبینی قدرتمند اما خطاپذیر - به شما کمک میکند از آنها هوشمندانه استفاده کنید، خطاهای آنها را شناسایی کنید و تصمیم بگیرید که چه زمانی مدل خصوصی خود را به جای ارسال دادهها به یک شرکت اجرا کنید.
سوالات متداول
آیا LLM واقعا هوشمند است؟▼
نه به معنای انسانی. یک LLM متن قابل قبولی را از روی الگوهایی که آموخته پیش بینی می کند - هیچ درک، باور یا آگاهی ندارد. این می تواند به طور قابل ملاحظه ای مفید و همچنین به طور مطمئن اشتباه باشد، زیرا با الگوها مطابقت دارد، نه تفکر.
چرا AI گاهی اوقات چیزهایی را می سازد؟▼
زیرا متنی با صدای قابل قبول را پیش بینی می کند، نه حقیقت تایید شده را. هنگامی که الگوی درستی نداشته باشد، پاسخی مطمئن اما نادرست ایجاد می کند - به نام "توهم". همیشه خروجی مهم هوش مصنوعی را تأیید کنید.
توکن چیست؟▼
یک قطعه متن (اغلب یک کلمه یا بخشی از یک کلمه) که LLM ها آن را پردازش می کنند. مدلها توکنها را میخوانند و تولید میکنند، استفاده اغلب به ازای هر توکن قیمتگذاری میشود، و "پنجره زمینه" حداکثر نشانههایی است که یک مدل میتواند در آن واحد در نظر بگیرد.