16.3.16

Vấn đề của những chính sách dựa trên thực chứng



Vấn đề của những chính sách dựa trên thực chứng

Ricardo Hausmann
CAMBRIDGE -  Rất nhiều cơ quan, từ các cơ quan chính phủ cho đến các định chế thiện nguyện và các tổ chức viện trợ, hiện nay đòi hỏi những chương trình cũng như chính sách phải dựa trên nền tảng chứng cứ. Nghĩa là nó đòi hỏi những chính sách này được lập ra dựa trên nền bằng chứng “tốt nhất có thể có được” trong khoảng thời gian hợp lý và giới hạn về mặt ngân sách. Nhưng cách mà phương pháp này được thực hiện có thể dẫn đến rất nhiều tai hại, làm sụt giảm khả năng của chúng ta để học hỏi và cải thiện những gì chúng ta làm.
Cái gọi là “tiêu chuẩn vàng” của những thành phần tạo nên chứng cứ tốt là các thí nghiệm ngẫu nhiên có kiểm soát, hay RCT (randomized control trial), một ý tưởng được áp dụng đầu tiên ở lĩnh vực y tế cách đây hai thế kỷ, rồi chuyển sang nông nghiệp và trở nên thịnh hành trong kinh tế trong hai thập kỷ qua. Sự phổ biến của nó được dựa trên thực tế là nó chú tâm đề cập đến những vấn đề cốt lõi trong suy luận thống kê.
Ricardo Hausmann (1956-)
Ví dụ, người giàu thì mặc trang phục thời thượng. Liệu chuyển những món đồ thời thượng này cho người nghèo có làm họ giàu lên? Đây là một trường hợp điển hình nơi sự tương quan (giữa trang phục và sự giàu có) không ám chỉ mối quan hệ nhân quả.
Những sinh viên tốt nghiệp Havard thường dành được những vị trí công việc rất tốt. Liệu Havard rất giỏi trong giảng dạy hay chỉ khéo chọn lựa những người thông minh mà dù thế nào cũng thành công trong cuộc sống của họ? Đây là vấn đề của độ chệch lựa chọn.
RCTs đề cập những vấn đề này bằng cách ngẫu nhiên ấn định những thành phần tham gia trong thí nghiệm để nhận được hoặc là một “phác đồ điều trị” hoặc là một “thuốc vờ (giả dược)” (bằng cách ấy tạo ra một nhóm “đối chứng”). Bằng cách quan sát sự khác biệt giữa hai nhóm sau can thiệp, hiệu quả của phác đồ điều trị có thể được ghi nhận. RCTs đã được thực hiện trên dược phẩm, tín dụng vi mô, chương trình đào tạo, công cụ giáo dục và vô số những sự can thiệp khác.
Giả sử bạn đang cân nhắc giới thiệu sử dụng máy tính bảng như là một cách để cải thiện cách học tại trường. Một RCT sẽ yêu cầu bạn chọn khoảng 300 trường để tham gia, 150 trong số đó sẽ ngẫu nhiên được ấn định vào nhóm đối chứng không được trang bị máy tính bảng. Trước khi phân phối máy tính bảng, bạn sẽ tiến hành một cuộc điều tra gọi là điều tra qui chiếu để so sánh nhằm ước lượng kiến thức những đứa trẻ đang học được ở trường. Sau đó bạn mang máy tính bảng đến 150 trường thuộc nhóm “phác đồ điều trị” và chờ đợi. Sau một khoảng thời gian, bạn sẽ hoàn tất một điều tra khác để tìm ra hiện nay liệu có tồn tại sự khác biệt về kiến thức học trong lớp giữa những trường trang bị máy tính bảng và những trường không được trang bị.
Giả sử không có nhiều sự khác biệt đáng kể nào, như trường hợp với 4 RCTs đã phát hiện ra rằng phân phối sách cũng không có hiệu quả gì. Sẽ là sai khi cho rằng bạn nghiệm ra máy tính bảng (hoặc sách) không cải thiện kiến thức. Những gì bạn vừa thể hiện chỉ là những máy tính bảng nhất định với những phần mềm nhất định, được sử dụng trong chiến lược sư phạm nhất định và giảng dạy những khái niệm nhất định đã không tạo ra một sự khác biệt nào.
Nhưng câu hỏi thực sự chúng ta muốn trả lời là máy tính bảng nên được sử dụng như thế nào để tối đa hóa việc học tập. Ở đây không gian để thiết kế cách sử dụng là thực sự khổng lồ, và RCTs không cho phép kiểm tra nhiều hơn hai hoặc ba phương pháp tại một thời điểm và thử chúng với tốc độ rất chậm. Liệu chúng ta làm được tốt hơn không?
Cân nhắc lối thực nghiệm theo suy nghĩ sau: chúng ta đính kèm vài kỹ thuật trong máy tính bảng để cho giáo viên biết theo thời gian thực rằng học sinh của anh ấy hay cô ấy đang tiếp thu bài giảng tốt ra sao. Chúng ta để các giáo viên tự do thực nghiệm với những phần mềm khác nhau, các chiến lược khác nhau và cách thức khác nhau khi sử dụng những công cụ mới. Mạch phản hồi nhanh chóng sẽ làm giáo viên điều chỉnh những chiến lược của họ để tối đa hóa việc giảng dạy.
Theo thời gian, chúng ta sẽ quan sát vài giáo viên những người vừa vô tình phát hiện những chiến lược hiệu quả cao. Sau đó chúng ta sẽ chia sẻ những gì họ vừa làm với các giáo viên khác.
Chú ý phương pháp này khác biệt căn bản như thế nào. Thay vì kiểm tra sự hợp lệ của một thiết kế bằng cách để 150 trường trong số 300 trường thực hiện chương trình đồng nhất, phương pháp này “bò lê” trong không gian thiết kế bằng cách để mỗi giáo viên tự tìm kiếm các kết quả. Thay điều tra trước và sau cuộc thử nghiệm, nó luôn luôn cung cấp phản hồi về việc giảng dạy. Thay vì có một nhà kinh trắc học làm các thí nghiệm theo kiểu tập trung và cho mọi người biết về những kết quả thực nghiệm, nó để những giáo viên đang làm các thí nghiệm theo lối phi tập trung và báo về trung tâm những gì họ nhận thấy.
Rõ ràng, những giáo viên sẽ nhầm lẫn mối tương quan với quan hệ nhân quả khi điều chỉnh chiến lược của họ, nhưng những lỗi này sẽ được phát hiện đủ sớm vì những giả thuyết sai không dẫn tới những kết quả tốt hơn. Cũng vậy, độ chệch lựa chọn có lẻ xảy ra (vài nơi có lẻ làm tốt hơn những nơi khác vì họ làm khác nhau ở những phương diện khác); nhưng nếu những bối cảnh khác nhau yêu cầu những chiến lược khác nhau, thì hệ thống sẽ tìm ra nó (tính chệch) sớm hơn hay muộn hơn. Chiến lược này giống nhiều hơn sự triển khai về mặt xã hội của thuật toán Học Máy hơn là một thí nghiệm lâm sàng.
Angus Deaton (1945-)
Lant Pritchett (1959-)
Dani Rodrik (1957-)














Với kinh tế học, RCTs đã thịnh hành trong tất cả các nhánh, đặc biệt là lĩnh vực phát triển quốc tế, mặc dù bị phê phán bởi khôi nguyên Nobel Angus Deaton, Lant PritchettDani Rodrik, những người đã công kích vào những yêu sách bị thổi phồng của các những người ủng hộ RCTs. Một nhược điểm nghiêm trọng là hiệu lực đối với ngoại vi. Bài học đưa đến rất tồi: nếu RCTS phát hiện ra rằng bổ sung vi chất dinh dưỡng cho trẻ em ở Guatemala cải thiện việc học hành của họ, liệu bạn có nên bổ sung vi chất dinh dưỡng cho trẻ em Na Uy?
Stuart Kauffman (1939-)
Vấn đề chính của tôi với RCTs là những thí nghiệm này làm chúng ta nghĩ đến những sự can thiệp, các chính sách và các tổ chức theo cách sai. Trái ngược với hai hay ba thiết kế được kiểm tra chậm chạp bởi RCTs (kiểu như đưa trang bị máy tính bảng hay bảng flipchart vào trường học), đa số những sự can thiệp xã hội có hàng triệu phương án thiết kế và kết quả thì phụ thuộc vào sự kết hợp phức tạp giữa chúng với nhau. Điều này dẫn đến cái mà chuyên gia về khoa học phức hợp Stuart Kauffman gọi là “cảnh quan cố khít gồ ghề”.
Matt Andrews
Michael Woolcock
Tìm ra được sự kết hợp phù hợp các tham số là cực kỳ quan trọng. Điều này đòi hỏi các tổ chức phải thi hành các chiến lược mang tính tiến hóa dựa trên sự kiểm thử và tiếp thu nhanh chóng các đặc tính thông qua các mạch phản hồi nhanh chóng, như đề xuất của  Matt Andrews, Lant Pritchett và Michael Woolcock thuộc Trung tâm Phát triển quốc tế Havard.
RCTs có l thích hợp cho các thí nghiệm thuốc lâm sàng. Nhưng với một dãy rộng rõ rệt của các lĩnh vực chính sách, phong trào RCT có một tác động tương đương với việc giao các kiểm toán viên phụ trách phòng R&D. Đó là cách làm sai khi muốn thiết kế những thí nghiệm cho ra kết quả. Chỉ bằng cách xây dựng các tổ chức biết cách học từ quá trình tác nghiệp, ví dụ như phương pháp sản xuất tinh gọn đã áp dụng trong công nghiệp, thì chúng ta mới có thể tăng tốc sự tiến bộ.

TÓM TẮT TIỂU SỬ:

Ricardo Hausmann, một cựu Bộ trưởng Bộ Kế hoạch của Venezuela và nguyên là Kinh tế trưởng của Ngân hàng Phát triển Liên Mỹ, là Giáo sư thực tiễn ngành Phát triển kinh tế tại Đại học Havard, nơi ông ấy cũng là Giám đốc Trung tâm Phát triển quốc tế. Ông là Chủ tọa Chương trình nghị sự Toàn cầu của Hội đồng cấp cao tại Diễn đàn Kinh tế Thế giới về Tăng trưởng Toàn diện.
Nguyễn Vũ Hoàng dịch
Nguồn: “The Problem with Evidence-based Policies”, Project Syndicate, Feb 25, 2016.
Bài liên quan trên PTKT:
Print Friendly and PDF