LLM ແມ່ນຫຍັງ?
📖 7 ນາທີອ່ານ
Quick Answer
ຜູ້ຊ່ວຍ AI ເຊັ່ນ ChatGPT ສາມາດມີຄວາມຮູ້ສຶກຄືກັບ magic, ແຕ່ພາຍໃຕ້ພວກເຂົາແມ່ນຕົວແບບພາສາຂະຫນາດໃຫຍ່ (LLMs) ເຮັດສິ່ງທີ່ງ່າຍດາຍທີ່ຫນ້າປະຫລາດໃຈທີ່ສຸດ: ການຄາດເດົາຄໍາຕໍ່ໄປ. ການເຂົ້າໃຈວິທີທີ່ພວກມັນເຮັດວຽກຢ່າງແທ້ຈິງເຮັດໃຫ້ຄວາມຫຼົງໄຫຼ - ແລະເປີດເຜີຍໃຫ້ເຫັນທັງພະລັງງານແລະຂອບເຂດຂອງພວກເຂົາ.
💡 ຄິດວ່າມັນເປັນ…
LLM ເປັນຄືກັບການຕື່ມຂໍ້ມູນອັດຕະໂນມັດທີ່ກ້າວໜ້າທີ່ສຸດໃນໂລກ. ໂທລະສັບຂອງທ່ານເດົາຄໍາຕໍ່ໄປໃນຂໍ້ຄວາມ; LLM ກໍ່ເຮັດຄືກັນ, ແຕ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບການຂຽນຂອງມະນຸດຫຼາຍ - ດັ່ງນັ້ນ "ການຄາດເດົາ" ຂອງມັນຈຶ່ງສາມາດຂຽນບົດເລື່ອງ, ລະຫັດແລະບົດກະວີ. ການຄາດຄະເນທີ່ມີປະສິດທິພາບ, ບໍ່ເຂົ້າໃຈ.
LLM ແມ່ນຫຍັງ
ຮູບແບບພາສາຂະຫນາດໃຫຍ່ແມ່ນ AI ທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ຄວາມຈໍານວນຫຼວງຫຼາຍເພື່ອຄາດຄະເນສິ່ງທີ່ຈະມາເຖິງ. ເມື່ອມີບາງຄໍາ, ມັນຄິດໄລ່ຄໍາຕໍ່ໄປທີ່ເປັນໄປໄດ້ທີ່ສຸດ, ຫຼັງຈາກນັ້ນ, ຕໍ່ໄປ, ການສ້າງປະໂຫຍກ. ChatGPT, Claude, Gemini ແລະແບບເປີດເຊັ່ນ Llama ແມ່ນ LLMs ທັງຫມົດ.
ມັນໄດ້ຖືກຝຶກອົບຮົມແນວໃດ
ຮູບແບບດັ່ງກ່າວອ່ານຂໍ້ຄວາມຈໍານວນຫຼວງຫຼາຍແລະປັບຕົວເລກພາຍໃນຫຼາຍຕື້ ("ພາລາມິເຕີ") ເພື່ອໃຫ້ສາມາດຄາດເດົາຄໍາຕໍ່ໄປໄດ້ດີຂຶ້ນ. ການຝຶກອົບຮົມນີ້ແມ່ນລາຄາແພງຫຼາຍແລະເປັນບ່ອນທີ່ຄ່າໃຊ້ຈ່າຍແລະພະລັງງານສ່ວນໃຫຍ່ຂອງ AI ໄປ. ຜົນໄດ້ຮັບແມ່ນຕົວແບບທີ່ໄດ້ດູດເອົາຮູບແບບຂອງພາສາ, ຂໍ້ເທັດຈິງແລະເຫດຜົນ.
ໂທເຄັນ: ມັນອ່ານແນວໃດ
LLMs ບໍ່ເຫັນຄໍາທີ່ແນ່ນອນ - ພວກເຂົາແຍກຂໍ້ຄວາມເຂົ້າໄປໃນ "tokens" (ຕ່ອນຄໍາ) ແລະເຮັດວຽກກັບຄໍາເຫຼົ່ານັ້ນ. ນີ້ແມ່ນເຫດຜົນທີ່ວ່າການນໍາໃຊ້ AI ມັກຈະມີລາຄາຕໍ່ໂທເຄັນ, ແລະເປັນຫຍັງຕົວແບບຕ່າງໆຈຶ່ງມີຂອບເຂດຈໍາກັດ "ປ່ອງຢ້ຽມສະພາບການ" - ຈໍານວນຂໍ້ຄວາມສູງສຸດທີ່ພວກເຂົາສາມາດພິຈາລະນາໃນເວລາດຽວ.
ເປັນຫຍັງມັນບໍ່ "ຄິດ" ແທ້ໆ
LLM ບໍ່ມີຄວາມເຂົ້າໃຈ, ຄວາມເຊື່ອຫຼືຄວາມຮັບຮູ້ - ມັນແມ່ນການຄາດເດົາຂໍ້ຄວາມທີ່ເປັນໄປໄດ້ໂດຍອີງໃສ່ຮູບແບບ. ນີ້ແມ່ນເຫດຜົນທີ່ວ່າມັນສາມາດເຮັດໃຫ້ມີຄວາມຫມັ້ນໃຈໃນຂະນະທີ່ເຮັດຜິດ ("ເຮັດໃຫ້ງຶດງໍ້"), ແລະເປັນຫຍັງມັນບໍ່ມີຄວາມຊົງຈໍາທີ່ແທ້ຈິງລະຫວ່າງການສົນທະນາເວັ້ນເສຍແຕ່ໄດ້ໃຫ້ຫນຶ່ງ. ການຈັບຄູ່ຮູບແບບທີ່ສວຍງາມ, ບໍ່ແມ່ນໃຈ.
🔑 ເອົາກະແຈ
ຮູບແບບພາສາຂະຫນາດໃຫຍ່ (LLM) ແມ່ນ AI ທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ຄວາມຈໍານວນຫລາຍເພື່ອຄາດເດົາຄໍາຕໍ່ໄປ, ການສ້າງປະໂຫຍກໂດຍ token. ມັນເປັນການຈັບຄູ່ຮູບແບບທີ່ມີຄວາມສາມາດພິເສດ — ບໍ່ເຂົ້າໃຈ — ທີ່ເປັນເຫດຜົນທີ່ມັນສາມາດມີຄວາມຫມັ້ນໃຈຜິດພາດ (hallucinate). ChatGPT, Claude ແລະແບບເປີດເຊັ່ນ Llama ແມ່ນ LLMs ທັງຫມົດ.
ເປັນຫຍັງສິ່ງນີ້ຈຶ່ງສຳຄັນສຳລັບເຈົ້າ
ໃນຂະນະທີ່ການປັບປ່ຽນ AI ເຮັດວຽກໃນທົ່ວອາຊີ, ການເຂົ້າໃຈວ່າ LLMs ແມ່ນຫຍັງ - ເຄື່ອງຈັກການຄາດເດົາທີ່ມີປະສິດທິພາບແຕ່ຫຼຸດລົງ - ຊ່ວຍໃຫ້ທ່ານໃຊ້ພວກມັນຢ່າງສະຫລາດ, ຄົ້ນຫາຄວາມຜິດພາດຂອງພວກເຂົາ, ແລະຕັດສິນໃຈວ່າເວລາໃດທີ່ຈະດໍາເນີນການແບບສ່ວນຕົວຂອງທ່ານເອງແທນທີ່ຈະສົ່ງຂໍ້ມູນໄປຫາບໍລິສັດ.
ຄຳຖາມທີ່ມັກຖາມເລື້ອຍໆ
ຕົວຈິງແລ້ວ LLM ແມ່ນສະຫຼາດບໍ?▼
ບໍ່ແມ່ນໃນຄວາມຮູ້ສຶກຂອງມະນຸດ. LLM ຄາດຄະເນຂໍ້ຄວາມທີ່ເປັນໄປໄດ້ຈາກຮູບແບບທີ່ມັນຮຽນຮູ້ - ມັນບໍ່ມີຄວາມເຂົ້າໃຈ, ຄວາມເຊື່ອຫຼືຄວາມຮັບຮູ້. ມັນສາມາດເປັນປະໂຫຍດຢ່າງຫຼວງຫຼາຍແລະຍັງມີຄວາມຫມັ້ນໃຈຜິດພາດ, ເພາະວ່າມັນເປັນຮູບແບບທີ່ສອດຄ້ອງກັນ, ບໍ່ຄິດ.
ເປັນຫຍັງບາງຄັ້ງ AI ຈຶ່ງສ້າງສິ່ງຕ່າງໆຂຶ້ນ?▼
ເນື່ອງຈາກວ່າມັນຄາດຄະເນຂໍ້ຄວາມທີ່ອາດເປັນໄປໄດ້, ບໍ່ແມ່ນຄວາມຈິງທີ່ຖືກຢືນຢັນ. ເມື່ອມັນຂາດຮູບແບບທີ່ຖືກຕ້ອງ, ມັນຈະສ້າງຄໍາຕອບທີ່ຫມັ້ນໃຈແຕ່ບໍ່ຖືກຕ້ອງ - ເອີ້ນວ່າ "ຄວາມຫຼົງໄຫຼ." ກວດສອບຜົນຜະລິດ AI ທີ່ສໍາຄັນສະເໝີ.
ໂທເຄັນແມ່ນຫຍັງ?▼
ຊິ້ນສ່ວນຂອງຂໍ້ຄວາມ (ມັກຈະເປັນຄໍາສັບຫຼືສ່ວນຫນຶ່ງຂອງຄໍາ) ທີ່ LLMs ດໍາເນີນການ. ແບບຈໍາລອງອ່ານແລະສ້າງ tokens, ການນໍາໃຊ້ມັກຈະມີລາຄາຕໍ່ token, ແລະ "context window" ແມ່ນ tokens ສູງສຸດທີ່ຕົວແບບສາມາດພິຈາລະນາໃນເວລາດຽວກັນ.