LLM là gì?
📖 7 đọc tối thiểu
Quick Answer
Các trợ lý AI như ChatGPT có thể cảm thấy giống như một phép thuật, nhưng bên dưới chúng là các mô hình ngôn ngữ lớn (LLM) đang thực hiện một việc cực kỳ đơn giản đến bất ngờ: dự đoán từ tiếp theo. Hiểu cách chúng thực sự hoạt động sẽ làm sáng tỏ sự cường điệu - và tiết lộ cả sức mạnh cũng như giới hạn của chúng.
💡 Hãy nghĩ về nó như…
LLM giống như tính năng tự động hoàn thành tiên tiến nhất thế giới. Điện thoại của bạn đoán từ tiếp theo trong văn bản; một LLM cũng làm như vậy, nhưng được đào tạo về phần lớn cách viết của con người - vì vậy những "đoán" của nó có thể viết các bài tiểu luận, mã và thơ. Dự đoán mạnh mẽ, không hiểu biết.
LLM là gì
Mô hình ngôn ngữ lớn là một AI được đào tạo dựa trên số lượng lớn văn bản để dự đoán điều gì sẽ xảy ra tiếp theo. Với một số từ, nó sẽ tính toán từ tiếp theo có khả năng xảy ra nhất, sau đó là từ tiếp theo, xây dựng câu. ChatGPT, Claude, Gemini và những người mẫu mở như Llama đều là LLM.
Nó được đào tạo như thế nào
Mô hình này đọc số lượng lớn văn bản và điều chỉnh hàng tỷ con số nội bộ ("tham số") để dự đoán từ tiếp theo tốt hơn. Quá trình đào tạo này cực kỳ tốn kém và là nơi tiêu tốn phần lớn chi phí và năng lượng của AI. Kết quả là một mô hình đã hấp thụ được các mẫu ngôn ngữ, sự kiện và lý luận.
Mã thông báo: cách đọc
LLMs don’t see words exactly — they break text into "tokens" (word pieces) and work with those. Đây là lý do tại sao việc sử dụng AI thường được định giá theo mã thông báo và tại sao các mô hình có giới hạn "cửa sổ ngữ cảnh" — số lượng văn bản tối đa mà chúng có thể xem xét cùng một lúc.
Tại sao nó không thực sự là "suy nghĩ"
LLM không có sự hiểu biết, niềm tin hay nhận thức - nó dự đoán văn bản hợp lý dựa trên các mẫu. Đây là lý do tại sao nó có thể nghe có vẻ tự tin khi mắc lỗi ("ảo giác") và tại sao nó không có ký ức thực sự giữa các cuộc trò chuyện trừ khi được cung cấp một ký ức. Rực rỡ phù hợp với mô hình, không phải là một tâm trí.
🔑 Bài học chính
Mô hình ngôn ngữ lớn (LLM) là một AI được đào tạo trên số lượng lớn văn bản để dự đoán từ tiếp theo, xây dựng từng câu theo mã thông báo. Nó có khả năng khớp mẫu cực kỳ tốt - không hiểu - đó là lý do tại sao nó có thể sai một cách đáng tin cậy (ảo giác). ChatGPT, Claude và các mô hình mở như Llama đều là LLM.
Tại sao điều này quan trọng với bạn
Khi AI định hình lại hoạt động trên khắp châu Á, việc hiểu LLM thực sự là gì - công cụ dự đoán mạnh mẽ nhưng có thể sai sót - giúp bạn sử dụng chúng một cách khôn ngoan, phát hiện lỗi và quyết định thời điểm chạy mô hình riêng của bạn thay vì gửi dữ liệu đến một công ty.
Câu hỏi thường gặp
LLM có thực sự thông minh không?▼
Không phải theo nghĩa của con người. LLM dự đoán văn bản hợp lý từ các mẫu mà nó đã học được - nó không có sự hiểu biết, niềm tin hay nhận thức. Nó có thể cực kỳ hữu ích nhưng cũng có thể sai một cách đáng tin cậy, bởi vì nó phù hợp với các khuôn mẫu chứ không phải suy nghĩ.
Tại sao đôi khi AI lại bịa ra mọi thứ?▼
Bởi vì nó dự đoán văn bản nghe có vẻ hợp lý chứ không phải sự thật đã được xác minh. Khi thiếu mẫu phù hợp, nó sẽ tạo ra một câu trả lời tự tin nhưng sai lầm - được gọi là "ảo giác". Luôn xác minh đầu ra AI quan trọng.
Mã thông báo là gì?▼
Một đoạn văn bản (thường là một từ hoặc một phần của từ) mà LLM xử lý. Mô hình đọc và tạo mã thông báo, mức sử dụng thường được định giá theo mã thông báo và "cửa sổ ngữ cảnh" là số mã thông báo tối đa mà mô hình có thể xem xét cùng một lúc.