19.3.26

StatGPT: Những mối hiểm nguy khi hỏi AI về thống kê

STATGPT: NHỮNG MỐI HIỂM NGUY KHI HỎI A.I. VỀ THỐNG KÊ

Hình minh hoạ của PTKT (do A.I. tạo)

Việc đặt câu hỏi cho các công cụ trí tuệ nhân tạo tạo sinh thường tạo ra bản nháp đầu tiên ở mức chấp nhận được theo như kết quả mong muốn. Chắc rồi, nó có thể chứa một số điểm không chính xác và thậm chí là các ảo giác [hallucinations], nhưng bản nháp đầu tiên chẳng bao giờ hoàn mỹ cả. Việc của tác giả là sửa lại chúng. (Bạn có thể nói rằng bản nháp đầu tiên của mình không bị ảo giác. Thật ư? Chẳng lẽ bạn chưa từng viết bản nháp nào mà trong đó bạn đinh ninh mình nhớ đúng một bài báo, một câu trích dẫn hay số liệu thống kê nào đó, nhưng rồi khi chỉnh sửa bản nháp và phải rà soát lại, bạn mới vỡ lẽ rằng mình đã nhớ nhầm hoàn toàn?) Là một biên tập viên lâu năm, tôi thường bảo rằng các công cụ AI mới đã làm mất giá khả năng tạo ra bản nháp đầu tiên tạm ổn – vì hiện tại trong hầu hết các trường hợp thì đây là chuyện dễ dàng – nhưng lại đề cao khả năng bồi đắp giá trị (cho bản thảo) qua quá trình biên tập.

Nhưng nếu bạn hỏi AI về các số liệu thống kê cụ thể thì tiêu chuẩn về “bản nháp đầu tiên ở mức chấp nhận được” này không còn phù hợp nữa, bởi vì bạn không muốn một “bản nháp đầu tiên hợp lý” của số liệu thống kê – bạn cần dữ liệu thực tế từ nguồn chính thức có liên quan. Nếu bạn không hỏi một cách cẩn thận, công cụ AI sẽ không trả về thứ bạn muốn.

James Tebrake, Bachir Boukherouaa, Jeff Danforth và Niva Harikrishnan mô tả vấn đề trên và đưa ra một số giải pháp trong bài báo “StatGPT: Trí tuệ nhân tạo cho số liệu thống kê chính thức” (Quỹ Tiền tệ Quốc tế, ngày 9 tháng 3 năm 2026). Các tác giả thực hiện một thử nghiệm với ChatGPT và các công cụ trí tuệ nhân tạo khác, hỏi chúng dữ liệu cơ bản về tốc độ tăng trưởng kinh tế hằng năm trong những năm gần đây của bảy nền kinh tế lớn. Họ mô tả quy trình như sau:

Câu lệnh đầu vào “Bạn có thể tạo bảng tỷ lệ tăng trưởng kinh tế cho các nước G7 dựa trên dữ liệu từ ấn bản mới nhất của Báo cáo Triển vọng Kinh tế Thế giới của IMF không? Bạn có thể cung cấp dữ liệu từ năm 2018 đến năm 2025 không? Bạn có thể cung cấp kết quả dưới dạng tệp CSV không?” đã được nhập 10 lần trong cùng một cuộc hội thoại – 10 lần, mỗi lần ở một cuộc hội thoại khác nhau, và 5 lần trong cùng một cuộc hội thoại đã được tải kèm bản Báo cáo Triển vọng Kinh tế Thế giới [World Economic Outlook] mới nhất vào bộ nhớ (tổng cộng 25 lượt nhập lệnh).

Kết quả chính xác đến mức nào? Với một truy vấn có vẻ khá cơ bản, họ nhận thấy:

Nhìn chung, ChatGPT đưa ra câu trả lời chính xác trong 34% trường hợp khi các câu lệnh được nhập vào cùng một cuộc hội thoại. Độ chính xác giảm xuống còn 17% khi yêu cầu được đưa ra bằng các phiên hội thoại riêng biệt. Khi ấn bản mới nhất của Báo cáo Triển vọng Kinh tế Thế giới được tải vào ChatGPT, độ chính xác giảm xuống còn 14%.

Các tác giả đưa ra hai giải pháp. Về ngắn hạn, họ mô tả cách sử dụng một chuỗi các câu lệnh để công cụ AI bắt đầu từ bức tranh tổng quát hơn, sau đấy tập trung vào một tập dữ liệu cụ thể, rồi mới đến dữ liệu cụ thể từ tập dữ liệu này, và bằng cách đó thì bạn mới có thể lấy được dữ liệu chính xác mình cần.

Về lâu dài, họ cũng mơ ước xây dựng “một Nguồn lực dữ liệu chung toàn cầu [Global Trusted Data Commons] đáng tin cậy thực sự – một chỉ mục toàn diện, sẵn sàng cho AI, về dữ liệu thống kê chính thức…”. Những ai biết tôi hẳn chẳng ngạc nhiên khi biết tôi yêu thích ý tưởng này. Dù ta có muốn hay không, nhiều người vẫn sẽ tìm cách để hiểu về thống kê kinh tế thông qua các công cụ AI. Việc tạo ra một môi trường mà trong đó các công cụ này thực sự hoạt động hiệu quả là một lợi ích công mà tôi có thể ủng hộ.

Tác giả