STATGPT: NHỮNG MỐI HIỂM NGUY KHI HỎI A.I. VỀ THỐNG KÊ
| Hình minh hoạ của PTKT (do A.I. tạo) |
Việc đặt câu hỏi cho các công cụ trí tuệ nhân tạo tạo sinh
thường tạo ra bản nháp đầu tiên ở mức chấp nhận được theo như kết quả mong muốn.
Chắc rồi, nó có thể chứa một số điểm không chính xác và thậm chí là các ảo giác
[hallucinations], nhưng bản nháp đầu tiên chẳng bao giờ hoàn mỹ cả. Việc của
tác giả là sửa lại chúng. (Bạn có thể nói rằng bản nháp đầu tiên của mình không
bị ảo giác. Thật ư? Chẳng lẽ bạn chưa từng viết bản nháp nào mà trong đó bạn
đinh ninh mình nhớ đúng một bài báo, một câu trích dẫn hay số liệu thống kê nào
đó, nhưng rồi khi chỉnh sửa bản nháp và phải rà soát lại, bạn mới vỡ lẽ rằng
mình đã nhớ nhầm hoàn toàn?) Là một biên tập viên lâu năm, tôi thường bảo rằng
các công cụ AI mới đã làm mất giá khả năng tạo ra bản nháp đầu tiên tạm ổn – vì
hiện tại trong hầu hết các trường hợp thì đây là chuyện dễ dàng – nhưng lại đề
cao khả năng bồi đắp giá trị (cho bản thảo) qua quá trình biên tập.
Nhưng nếu bạn hỏi AI về các số liệu thống kê cụ thể thì tiêu chuẩn về “bản nháp đầu tiên ở mức chấp nhận được” này không còn phù hợp nữa, bởi vì bạn không muốn một “bản nháp đầu tiên hợp lý” của số liệu thống kê – bạn cần dữ liệu thực tế từ nguồn chính thức có liên quan. Nếu bạn không hỏi một cách cẩn thận, công cụ AI sẽ không trả về thứ bạn muốn.
James Tebrake, Bachir Boukherouaa, Jeff Danforth và Niva Harikrishnan mô tả vấn đề trên và đưa ra một số giải pháp trong bài báo “StatGPT: Trí tuệ nhân tạo cho số liệu thống kê chính thức” (Quỹ
Tiền tệ Quốc tế, ngày 9 tháng 3 năm 2026). Các tác giả thực hiện một thử nghiệm
với ChatGPT và các công cụ trí tuệ nhân tạo khác, hỏi chúng dữ liệu cơ bản về tốc
độ tăng trưởng kinh tế hằng năm
trong những năm gần đây của bảy nền kinh tế lớn. Họ mô tả quy trình như sau:
Câu lệnh đầu
vào “Bạn có thể tạo bảng tỷ lệ tăng trưởng kinh tế cho các nước G7 dựa trên dữ
liệu từ ấn bản mới nhất của Báo cáo Triển vọng Kinh tế Thế giới của IMF không?
Bạn có thể cung cấp dữ liệu từ năm 2018 đến năm 2025 không? Bạn có thể cung cấp
kết quả dưới dạng tệp CSV không?” đã được nhập 10 lần trong cùng một cuộc hội
thoại – 10 lần, mỗi lần ở một cuộc hội thoại khác nhau, và 5 lần trong cùng một
cuộc hội thoại đã được tải kèm bản Báo cáo Triển vọng Kinh tế Thế giới [World
Economic Outlook] mới nhất vào bộ nhớ (tổng cộng 25 lượt nhập lệnh).
Kết quả chính xác đến mức nào? Với
một truy vấn có vẻ khá cơ bản, họ nhận thấy:
Nhìn chung, ChatGPT
đưa ra câu trả lời chính xác trong 34% trường hợp khi các câu lệnh được nhập
vào cùng một cuộc hội thoại. Độ chính xác giảm xuống còn 17% khi yêu cầu được
đưa ra bằng các phiên hội thoại riêng biệt. Khi ấn bản mới nhất của Báo cáo Triển
vọng Kinh tế Thế giới được tải vào ChatGPT, độ chính xác giảm xuống còn 14%.
Các tác giả đưa ra hai giải pháp.
Về ngắn hạn, họ mô tả cách sử dụng một chuỗi các câu lệnh để công cụ AI bắt đầu
từ bức tranh tổng quát hơn, sau đấy tập trung vào một tập dữ liệu cụ thể, rồi mới
đến dữ liệu cụ thể từ tập dữ liệu này, và bằng cách đó thì bạn mới có thể lấy
được dữ liệu chính xác mình cần.
Về lâu dài, họ cũng mơ ước xây dựng “một Nguồn lực dữ liệu chung toàn
cầu [Global Trusted Data Commons] đáng
tin cậy thực sự – một chỉ mục toàn diện, sẵn sàng cho AI, về dữ liệu thống kê
chính thức…”. Những ai biết tôi hẳn chẳng ngạc nhiên khi biết tôi yêu thích ý
tưởng này. Dù ta có muốn hay không, nhiều người vẫn sẽ tìm cách để hiểu về thống kê kinh tế thông qua
các công cụ AI. Việc tạo ra một môi trường mà trong đó các công cụ này thực sự
hoạt động hiệu quả là một lợi ích công mà tôi có thể ủng hộ.
Tác giả
| Timothy Taylor |
Huỳnh Thị Thanh Trúc dịch
Nguồn: StatGPT: The Dangers of Asking AI about Statistics,
Conversable Economist, March 13, 2026.