14.3.21

Biên độ sai số là gì? Công cụ thống kê này có thể giúp bạn hiểu biết về các thử nghiệm vắc xin và cuộc thăm dò chính trị

BIÊN ĐỘ SAI SỐ LÀ GÌ? CÔNG CỤ THỐNG KÊ NÀY CÓ THỂ GIÚP BẠN HIỂU BIẾT VỀ CÁC THỬ NGHIỆM VẮC XIN VÀ CUỘC THĂM DÒ CHÍNH TRỊ

Ngày 7 tháng 1 năm 2021, 12 giờ 10 phút sáng

Vào năm ngoái, số liệu thống kê đã trở nên quan trọng một cách khác thường trong các bản tin. Bộ thử nghiệm COVID-19 mà bạn hoặc những người khác đang sử dụng thì chính xác như thế nào? Làm thế nào các nhà nghiên cứu biết được tác dụng của những phương pháp điều trị mới cho các bệnh nhân COVID-19? Làm thế nào các mạng lưới truyền hình có thể dự đoán những kết quả bầu cử từ lâu trước khi tất cả các lá phiếu được kiểm đếm?

Mỗi một câu hỏi trong số này đều liên quan đến một ít sự không chắc chắn, nhưng vẫn có thể đưa ra những dự đoán chính xác miễn là hiểu được sự không chắc chắn đó. Một công cụ mà các nhà thống kê sử dụng để định lượng sự không chắc chắn được gọi là biên độ sai số.

Trên thực tế, không thể thử nghiệm hay lấy mẫu từng người có liên quan, vì thế các nhà thống kê dựa trên những mẫu nhỏ hơn được lấy từ một tổng thể. Guzaliia Filimonova/iStock thông qua Getty Images Plus

Dữ liệu có giới hạn

Tôi là một nhà thống kê, và một phần công việc của tôi là đưa ra các suy luận và các dự đoán. Với thời gian và tiền bạc không giới hạn, tôi có thể đơn giản thử nghiệm hoặc khảo sát toàn bộ nhóm người mà tôi quan tâm để đánh giá câu hỏi trong đầu và tìm câu trả lời chính xác. Ví dụ, để tìm ra tỷ lệ nhiễm COVID-19 ở Mỹ, tôi có thể đơn giản thử nghiệm toàn bộ dân số Mỹ. Tuy nhiên, trên thực tế, bạn có thể chẳng bao giờ tiếp cận được 100% dân số.

Thay vào đó, các nhà thống kê lấy mẫu một phần nhỏ dân số và xây dựng một mô hình để đưa ra một dự đoán. Sử dụng lý thuyết thống kê, kết quả từ mẫu đó được ngoại suy để đại diện cho toàn bộ tổng thể.

Một cách lý tưởng, một mẫu tốt phải đại diện cho toàn bộ tổng thể, về tất cả các mặt giới tính, sự đa dạng về chủng tộc, sự đa dạng về kinh tế xã hội, những hình mẫu về lối sống và các thước đo nhân khẩu học khác. Mẫu càng lớn thì càng giống với tổng thể thực, và với một mẫu càng lớn bao nhiêu, các nhà thống kê càng tự tin hơn bấy nhiêu vào các dự đoán của họ. Nhưng sẽ luôn luôn có một ít sự không chắc chắn.

Cỡ mẫu càng lớn thì dự đoán càng chính xác và biên độ sai số càng nhỏ. Fadethree thông qua Wikimedia Commons

Định lượng sự không chắc chắn

Lấy việc phát triển thuốc, làm ví dụ. Luôn luôn đúng khi dự đoán rằng một loại thuốc mới sẽ có hiệu quả đâu đó trong khoảng từ 0% đến 100% đối với tất cả mọi người trên Trái Đất. Nhưng đó chẳng phải là một dự đoán thật sự hữu ích. Công việc của một nhà thống kê là thu hẹp phạm vi đó thành một thứ gì đó hữu ích hơn. Các nhà thống kê thường gọi phạm vi này là một khoảng tin cậy, và nó là phạm vi của các dự đoán mà trong đó các nhà thống kê cực kỳ tin tưởng rằng con số đúng sẽ được tìm thấy.

Nếu một loại thuốc được thử nghiệm trên 10 người và 7 người trong số họ thấy có hiệu quả, thì độ hiệu quả ước tính của thuốc là 70%. Nhưng bởi vì mục tiêu là để dự đoán độ hiệu quả trên toàn bộ dân số, các nhà thống kê cần tính đến sự không chắc chắn của cuộc thử nghiệm chỉ với 10 người.

Các khoảng tin cậy được tính bằng việc sử dụng một công thức toán học bao gồm cỡ mẫu, phạm vi của các phản ứng và các quy luật về xác suất. Trong ví dụ này, khoảng tin cậy sẽ là từ 42% đến 98% - một phạm vi 56 điểm phần trăm. Sau cuộc thử nghiệm chỉ với 10 người, bạn có thể nói với sự tự tin cao độ rằng loại thuốc này có hiệu quả đối với từ 42% đến 98% người trong toàn bộ dân số.

Nếu bạn chia khoảng tin cậy làm đôi, bạn sẽ thu được biên độ sai số - trong trường hợp này, là 28%. Biên độ sai số càng lớn, dự đoán càng kém chính xác. Biên độ sai số càng nhỏ, dự đoán càng chính xác. Một biên độ sai số gần 30% vẫn là một phạm vi khá rộng.

Tuy nhiên, hãy hình dung rằng các nhà nghiên cứu đã thử nghiệm loại thuốc mới này trên 1.000 người thay vì 10 người và nó có hiệu quả ở 700 người trong số họ. Độ hiệu quả ước tính của thuốc vẫn rơi vào khoảng 70%, tuy vậy dự đoán này chính xác hơn nhiều. Khoảng tin cậy cho mẫu lớn hơn sẽ là giữa 67% và 73% với một biên độ sai số là 3%. Bạn có thể nói loại thuốc này dự kiến sẽ có hiệu quả 70%, cộng hoặc trừ 3%, cho toàn bộ dân số.

Ofer Harel

Các nhà thống kê vô cùng mong muốn có thể dự đoán với độ chính xác 100% sự thành công hay thất bại của một loại thuốc mới hoặc những kết quả chính xác của một cuộc bầu cử. Tuy nhiên, điều này là không thể. Luôn luôn có một ít sự không chắc chắn, và biên độ sai số là thứ định lượng sự không chắc chắn đó; nó phải được cân nhắc khi nhìn vào các kết quả. Cụ thể, biên độ sai số xác định phạm vi của các dự đoán mà trong đó các nhà thống kê cực kỳ tự tin rằng con số đúng sẽ được tìm ra. Một biên độ sai số có thể chấp nhận được là một vấn đề về sự đánh giá dựa trên mức độ chính xác được yêu cầu trong các kết luận được rút ra.

Tác giả

Ofer Harel

Giáo sư thống kê, Đại học Connecticut

Ofer Harel nhận được tài trợ từ Quỹ Khoa học Quốc gia, Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ và Viện Y tế Quốc gia. Ông cũng là thành viên của Ủy ban Tư vấn Kỹ thuật Thống kê Lao động.

Nguyễn Thị Thanh Trúc dịch

Nguồn:What is a margin of error? This statistical tool can help you understand vaccine trials and political polling”, The Conversation, January 7, 2021

Print Friendly and PDF