Apakah LLM?
๐ 7 min baca
Quick Answer
Pembantu AI seperti ChatGPT boleh berasa seperti sihir, tetapi di bawahnya terdapat model bahasa besar (LLM) yang melakukan satu perkara yang mengejutkan dengan sangat mudah: meramalkan perkataan seterusnya. Memahami cara mereka benar-benar berfungsi menghilangkan gembar-gembur - dan mendedahkan kedua-dua kuasa dan had mereka.
๐ก Anggaplah ia sebagaiโฆ
LLM adalah seperti autolengkap tercanggih di dunia. Telefon anda meneka perkataan seterusnya dalam teks; LLM melakukan perkara yang sama, tetapi dilatih dalam kebanyakan penulisan manusia โ jadi "tekaan"nya boleh menulis esei, kod dan puisi. Ramalan yang kuat, tidak memahami.
Apa itu LLM
Model Bahasa Besar ialah AI yang dilatih pada sejumlah besar teks untuk meramalkan perkara seterusnya. Memandangkan beberapa perkataan, ia mengira perkataan seterusnya yang paling mungkin, kemudian seterusnya, membina ayat. ChatGPT, Claude, Gemini dan model terbuka seperti Llama semuanya LLM.
Bagaimana ia dilatih
Model ini membaca kuantiti teks yang banyak dan melaraskan berbilion nombor dalaman ("parameter") untuk menjadi lebih baik dalam meramal perkataan seterusnya. Latihan ini sangat mahal dan di mana kebanyakan kos dan tenaga AI pergi. Hasilnya ialah model yang telah menyerap corak bahasa, fakta dan penaakulan.
Token: bagaimana ia dibaca
LLM tidak melihat perkataan dengan tepat โ mereka memecahkan teks kepada "token" (potongan perkataan) dan berfungsi dengannya. Inilah sebabnya mengapa penggunaan AI selalunya berharga bagi setiap token, dan mengapa model mempunyai had "tetingkap konteks" โ jumlah maksimum teks yang boleh mereka pertimbangkan sekali gus.
Mengapa ia tidak benar-benar "berfikir"
LLM tidak mempunyai pemahaman, kepercayaan atau kesedaran โ ia meramalkan teks yang munasabah berdasarkan corak. Inilah sebabnya mengapa ia boleh berbunyi yakin semasa salah ("halusinasi"), dan mengapa ia tidak mempunyai ingatan sebenar antara sembang melainkan diberikan satu. Padanan corak yang cemerlang, bukan minda.
๐ Bawa pulang kunci
Model bahasa besar (LLM) ialah AI yang dilatih pada sejumlah besar teks untuk meramalkan perkataan seterusnya, membina ayat token dengan token. Ia adalah padanan corak yang sangat berkemampuan โ tidak memahami โ itulah sebabnya ia boleh menjadi salah dengan yakin (halusinasi). ChatGPT, Claude dan model terbuka seperti Llama semuanya LLM.
Mengapa ini penting untuk anda
Apabila AI membentuk semula berfungsi di seluruh Asia, memahami apa sebenarnya LLM โ enjin ramalan yang berkuasa tetapi boleh salah โ membantu anda menggunakannya dengan bijak, mengesan kesilapan mereka dan memutuskan masa untuk menjalankan model peribadi anda sendiri dan bukannya menghantar data kepada syarikat.
Soalan lazim
Adakah LLM sebenarnya bijak?โผ
Bukan dalam erti kata manusia. LLM meramalkan teks yang munasabah daripada corak yang dipelajari โ ia tidak mempunyai pemahaman, kepercayaan atau kesedaran. Ia boleh menjadi sangat berguna dan juga dengan yakin salah, kerana ia adalah corak yang sepadan, bukan berfikir.
Mengapa AI kadangkala mengada-adakan perkara?โผ
Kerana ia meramalkan teks yang terdengar munasabah, bukan kebenaran yang disahkan. Apabila ia tidak mempunyai corak yang betul, ia menghasilkan jawapan yang yakin tetapi palsu โ dipanggil "halusinasi." Sentiasa sahkan output AI yang penting.
Apakah token?โผ
Sekeping teks (selalunya perkataan atau sebahagian daripada perkataan) yang diproses oleh LLM. Model membaca dan menjana token, penggunaan selalunya berharga bagi setiap token dan "tetingkap konteks" ialah token maksimum yang boleh dipertimbangkan oleh model sekali gus.