Cách thức hoạt động của cơ chế kiểm duyệt AI
📖 8 đọc tối thiểu
Quick Answer
Các chatbot AI có cảm giác giống như những lời tiên tri trung lập, nhưng mỗi chatbot đều có quy tắc về những gì nó sẽ nói và không nói - và các mô hình phù hợp với nhà nước còn tiến xa hơn thế. Việc kiểm duyệt trong AI thường vô hình và ăn sâu vào chính mô hình. Hiểu cách thức hoạt động của nó là điều cần thiết để sử dụng AI một cách nghiêm túc. Đây là những gì cần biết.
💡 Bàn tay ẩn giấu
Một chatbot AI giống như một người hướng dẫn đầy hiểu biết ở một quốc gia cấm một số môn học nhất định. Hỏi về họ và người hướng dẫn sẽ từ chối một cách lịch sự, thay đổi chủ đề hoặc đọc trôi chảy dòng chính thức - và bạn có thể không bao giờ nhận ra có một bức tường ở đó.
Các phương pháp kiểm duyệt AI
Kiểm duyệt được áp dụng theo từng lớp: từ chối thẳng thừng ("Tôi không thể thảo luận về điều đó"), điều chỉnh đào tạo (mô hình được đào tạo để tránh hoặc điều chỉnh lại các chủ đề để không bao giờ muốn trả lời) và định hình câu trả lời (nó phản hồi nhưng với thông tin bịa đặt, gây hiểu lầm hoặc một chiều). Phức tạp nhất là căn chỉnh - độ lệch nằm trong chính mô hình, không phải là một bộ lọc rõ ràng.
Những gì được kiểm duyệt
Các mô hình phù hợp với nhà nước, đặc biệt là các mô hình của Trung Quốc, hạn chế các chủ đề như sự kiện Thiên An Môn năm 1989, tình trạng của Đài Loan và các vấn đề nhân quyền liên quan đến người Duy Ngô Nhĩ, Tây Tạng, Hồng Kông và những người khác. Một số mô hình tích cực điều chỉnh lại những điều này - ví dụ, mô tả các trại giam được ghi chép đầy đủ là "đào tạo nghề" hoặc dán nhãn các cuộc điều tra là "tin đồn".
Hiệu ứng ngôn ngữ
Một thực tế quan trọng, ít được biết đến hơn: cùng một mô hình có thể trả lời khác nhau tùy thuộc vào ngôn ngữ bạn hỏi. Nghiên cứu cho thấy các mô hình phù hợp với nhà nước chèn tuyên truyền hoặc giấu thông tin bằng một số ngôn ngữ nhiều hơn các ngôn ngữ khác. Rủi ro không chỉ ở việc bạn sử dụng mô hình nào mà còn ở ngôn ngữ bạn sử dụng.
Tại sao nó quan trọng ở mọi nơi
Khi các mô hình này lan rộng trên toàn cầu - giá rẻ, có khả năng và nguồn mở - cơ chế kiểm duyệt và đóng khung tích hợp sẵn sẽ đi cùng với chúng. Mọi người trên toàn thế giới có thể tiếp thu một thế giới quan cụ thể mà không nhận ra điều đó. Các mô hình phương Tây cũng có quy tắc nội dung riêng; bài học là hãy coi tất cả AI là cố chấp chứ không phải trung lập.
🔑 Bài học chính
Kiểm duyệt AI hoạt động thông qua việc từ chối, điều chỉnh đào tạo (sự thiên vị được đưa vào mô hình) và các câu trả lời được diễn đạt lại. Các mô hình phù hợp với nhà nước hạn chế các chủ đề như quyền Thiên An Môn, Đài Loan và người Duy Ngô Nhĩ - và cùng một mô hình có thể trả lời khác nhau tùy thuộc vào ngôn ngữ của bạn. Hãy coi tất cả AI là những người có chính kiến, không bao giờ là một nhà tiên tri trung lập và xác minh các chủ đề nhạy cảm ở nơi khác.
Tại sao điều này quan trọng với bạn
Châu Á là nơi xây dựng và sử dụng các mô hình AI phù hợp với nhà nước mạnh mẽ nhất. Biết cách hoạt động của cơ chế kiểm duyệt AI - và câu trả lời có thể thay đổi theo ngôn ngữ của bạn - sẽ bảo vệ bạn khỏi việc tiếp thu những tuyên truyền một cách vô tình và giúp bạn sử dụng AI như một công cụ chứ không phải một cơ quan có thẩm quyền.
Câu hỏi thường gặp
Chatbot AI có thực sự kiểm duyệt thông tin?▼
Có - tất cả đều có quy tắc nội dung và các mô hình phù hợp với nhà nước còn tiến xa hơn nhiều, từ chối, sắp xếp lại hoặc bóp méo các chủ đề nhạy cảm. Quá trình kiểm duyệt phức tạp nhất được đưa vào quá trình đào tạo của người mẫu, vì vậy nó vô hình và có cảm giác giống như một câu trả lời bình thường.
Các mô hình AI Trung Quốc kiểm duyệt những chủ đề gì?▼
Những vấn đề nhạy cảm về mặt chính trị: sự kiện Thiên An Môn năm 1989, tình trạng của Đài Loan và các vấn đề nhân quyền liên quan đến người Duy Ngô Nhĩ, Tây Tạng, Hồng Kông và Pháp Luân Công – thường được trình bày lại bằng các tường thuật chính thức thay vì đơn giản bị từ chối.
Ngôn ngữ tôi hỏi có làm thay đổi câu trả lời không?▼
Có - nghiên cứu cho thấy các mô hình phù hợp với nhà nước có thể đưa ra nhiều tuyên truyền hơn hoặc giữ lại nhiều thông tin hơn bằng một số ngôn ngữ nhất định. Câu hỏi tương tự có thể nhận được câu trả lời bị kiểm duyệt nhiều hay ít tùy thuộc vào ngôn ngữ được sử dụng.