29.6.23

Làm thế nào để sử dụng Google cho việc dự báo hoạt động kinh tế của các nước?

LÀM THẾ NÀO ĐỂ SỬ DỤNG GOOGLE CHO VIỆC DỰ BÁO HOẠT ĐỘNG KINH TẾ CỦA CÁC NƯỚC?

Anna Simoni, giám đốc nghiên cứu tại CNRS và là giáo sư Kinh trắc học và Thống kê tại ENSAE (IP Paris)

Tóm tắt

     Trong nhiều năm qua, những dữ liệu Google từ các công cụ tìm kiếm trên trang mạng Google đã được sử dụng để giám sát hoặc dự báo hoạt động kinh tế của các quốc gia.

     Các dữ liệu này, luôn có sẵn để sử dụng hàng tuần, đáp ứng nhu cầu về tốc độ thông tin, do các chỉ báo truyền thống, chẳng hạn như GDP, mất nhiều thời gian hơn để biết được thông tin.

     Các công cụ tìm kiếm Google là một chỉ báo thú vị về sức khỏe kinh tế, do chúng cho thấy khả năng, giống như ý muốn, tiêu dùng của người dùng Google.

·         Các chỉ báo từ Google tỏ ra đặc biệt thích đáng trong thời kỳ khủng hoảng, do chúng phản ứng nhanh với những thay đổi của nền kinh tế.

Vì sao các nhà nghiên cứu và các định chế, chẳng hạn như tổ chức OECD, lại sử dụng các dữ liệu Google để dự báo hoạt động kinh tế của các quốc gia? Nó đáp ứng nhu cầu gì?

Thông thường, để đưa ra một dự báo kinh tế vĩ mô, chúng ta sử dụng những dữ liệu có nguồn gốc, ví dụ, từ các ngân hàng trung ương hoặc các viện nghiên cứu thống kê như INSEE. Các dữ liệu này cung cấp rất nhiều thông tin, nhưng chúng không có sẵn để sử dụng ngay lập tức. Đó là lý do vì sao chúng ta quan tâm đến các nguồn dữ liệu khác, có thể cung cấp thông tin theo thời gian thực.

Ví dụ, nếu một nhà hoạch định chính sách kinh tế cần ra quyết định phục hồi nền kinh tế, thì ông ta phải biết tình trạng nền kinh tế hiện tại của đất nước. Với các dữ liệu chính thức có được, thì công việc trên là điều bất khả. GDP là một chuỗi dữ liệu được đo lường theo quý, được công bố, trung bình, một tháng rưỡi sau khi kết thúc quý có liên quan. Vì thế, việc điều chỉnh các chính sách kinh tế ngay lập tức là điều bất khả. Việc sử dụng các nguồn lựa chọn thay thế, trong đó có Google, thực sự là một ý tưởng tốt để giải quyết vấn đề chậm trễ khi sử dụng các dữ liệu chính thức.

Công cụ nào của Google được sử dụng trong công việc dự báo kinh tế vĩ mô này?

Có hai loại dữ liệu từ Google: Google Trends [Xu hướng] và Google Search [Tìm kiếm]. Tuy nhiên, nguồn dữ liệu của hai cơ sở dữ liệu này đều giống nhau: các từ được người sử dụng gõ trong công cụ tìm kiếm Google. Hầu hết các nhà nghiên cứu đều sử dụng Google Trends: đó là trang web mà mọi người đều có quyền truy cập. Dữ liệu tương ứng với các xu hướng tìm kiếm theo quốc gia và theo danh mục (giải trí, kinh doanh, sức khỏe, khoa học, thể thao). Google chỉ định từ khóa tìm kiếm cho một danh mục.

“Công cụ tìm kiếm Google có thể được coi là một tổng hợp cách thức mà chúng ta cảm nhận nền kinh tế.”

Về phần công cụ Google Search, nó cung cấp chuỗi các tìm kiếm trên Internet, do Google cung cấp thông tin sẵn có và trao cho Ngân hàng Trung ương Châu Âu. Hai cơ sở dữ liệu nói trên được xây dựng theo các cách khác nhau, Google Trends xem xét khối lượng tìm kiếm, trong khi Google Search cung cấp thông tin về sự biến động khối lượng tìm kiếm. Trong nghiên cứu của tôi, chúng tôi đã làm việc với các dữ liệu từ Google Search.

Do đó, vấn đề là dự báo sức khỏe các nền kinh tế, bằng cách phân tích những gì người dùng Google nhập vào công cụ tìm kiếm. Ý tưởng này đến từ đâu và vì sao các dữ liệu này lại thích đáng?

Hal Ronald Varian (1947-)

Những bài báo đầu tiên về vấn đề này đã được Hal Varian, nhà kinh tế trưởng của Google, công bố. Các dữ liệu đó đã xuất hiện trong thời gian khá gần đây: chúng đã có sẵn để sử dụng ngay từ năm 2004, còn tôi thì bắt đầu nghiên cứu dự án của mình bằng cách sử dụng dữ liệu Google vào năm 2016. Trực giác và giả định nằm đằng sau việc sử dụng các dữ liệu này để đưa ra dự báo kinh tế vĩ mô là các công cụ tìm kiếm Google có thể được xem như một tổng hợp về cách thức mà chúng ta cảm nhận nền kinh tế. Nếu nền kinh tế khỏe mạnh, thì chúng ta có xu hướng tìm kiếm các chủ đề về văn hóa, du lịch, v.v.. Ngược lại, nếu có vấn đề thất nghiệp, thì sẽ có nhiều tìm kiếm liên quan đến việc làm nhiều hơn.

Các dữ liệu này có hiệu quả trong việc dự báo hoạt động kinh tế của một quốc gia không? Nó có hữu ích cho việc dự báo các giai đoạn tăng trưởng và suy thoái không?

Những gì tôi đã nhận xét trong nghiên cứu của mình là các công cụ này đặc biệt hữu ích trong các thời kỳ khủng hoảng. Ví dụ, trong cuộc khủng hoảng 2008-2009, dữ liệu Google đã dự báo tốt về hoạt động kinh tế, do các dữ liệu phản ứng nhanh hơn với sự thay đổi, so với các dữ liệu chính thức.

Tuy nhiên, chuỗi dữ liệu từ Google có mối tương quan rất ít với GDP. Ngoại trừ trong thời kỳ khủng hoảng, các thông tin chính thức vẫn là nguồn cung cấp nhiều thông tin hơn. Vả lại, một điều cần thiết khác là phải tiến hành chọn lọc trước các dữ liệu, do có khoảng 300 danh mục đối với mỗi quốc gia. Nếu sử dụng tất cả dữ liệu, thì điều đó sẽ tạo ra nhiễu thông tin trong quá trình ước lượng. Vì thế, trước khi đưa ra dự báo, cần phải chọn lọc những danh mục Google nào có tương quan nhiều nhất để dự báo GDP. Nếu làm được điều này, thì có thể tìm thấy những kết quả thú vị, kể cả trong những thời kỳ ổn định, ngay cả khi không có dữ liệu thông tin chính thức.

Loại danh mục tìm kiếm nào là hữu ích nhất để dự báo hoạt động kinh tế?

Các danh mục tương quan nhiều nhất thường liên quan đến tiêu dùng, chẳng hạn như những gì liên quan đến nghỉ ngơi và giải trí. Điều này dễ giải thích: nếu người dân đang ở trong thời kỳ kinh tế tốt, thì sẽ có xu hướng mua nhiều hơn. Ngoài ra, cũng cần xem xét những danh mục liên quan đến các mạng xã hội. Người dùng mạng có thể ít nhiều tích cực hơn trong việc lựa chọn sử dụng các mạng xã hội, tùy thuộc vào tình trạng kinh tế: tìm thông tin trên các mạng xã hội hoặc trên các trang web như LinkedIn, để tìm lời chào mời làm việc chẳng hạn.

Những lợi thế và hạn chế của các dữ liệu Google so với các dữ liệu chính thức là gì?

Ưu điểm chính so với dữ liệu chính thức là vấn đề thời gian. Thật vậy, việc thoáng nhìn nền kinh tế gần như là tức thì: chúng ta nghe tin tức, chúng ta thấy có chiến tranh hoặc khủng hoảng chính trị, chúng ta phản ứng ngay lập tức, chúng ta điều chỉnh hành vi của mình. Bất chấp tất cả, các ngành công nghiệp mất nhiều thời gian hơn để thích nghi với một cuộc khủng hoảng kinh tế, điều đó không thể xảy ra trong một sớm một chiều. Hầu hết các tác nhân kinh tế đều phản ứng chậm hơn nhiều.

“Ưu điểm chính so với các dữ liệu chính thức là vấn đề thời gian.”

Hạn chế chính là rất khó khai thác các dữ liệu này. Trong nghiên cứu của tôi, chúng tôi đã thử nhiều phương pháp, và một số phương pháp không hoạt động hiệu quả chút nào. Ví dụ: phương pháp chọn lọc trước các danh mục nghiên cứu chỉ hoạt động hiệu quả trong thời kỳ ổn định: trong thời kỳ khủng hoảng, không nên sử dụng phương pháp này.

Làm thế nào để hình dung tương lai của dự báo kinh tế, dưới góc độ nguồn dữ liệu? Bà có nghĩ việc sử dụng Google sẽ tiếp tục phát triển hay không?

Tôi cho rằng sẽ không có một nguồn dữ liệu nào tốt hơn các nguồn khác: chúng ta sẽ phải tiếp tục sử dụng nhiều nguồn dữ liệu và nhiều mô hình. Tùy vào bối cảnh kinh tế, chúng ta sẽ có những dự báo tốt hơn với một số dữ liệu nào đó. Ngoài việc tự động hóa nhiều hơn nữa các phương pháp sẵn có, những gì cần làm bây giờ là so sánh hiệu quả dự báo của các dữ liệu Google với hiệu quả dự báo của các dữ liệu tùy chọn thay thế khác, chẳng hạn như những bài viết có nguồn gốc từ các tờ báo theo dõi tin tức kinh tế và tài chính: đây là những gì tôi đã cố gắng áp dụng trong nghiên cứu của mình.

Cuộc phỏng vấn do Sirine Azouaoui thực hiện

Anna Simoni

Anna Simoni

Bà Anna Simoni là giám đốc nghiên cứu tại CNRS/CREST, giáo sư về Kinh trắc học và Thống kê tại ENSAE, và giảng viên bán thời gian tại Đại học École Polytechnique. Bà đỗ bằng Tiến sĩ tại Đại học Kinh tế Toulouse vào năm 2009 và bằng Habilitation to Direct Research (HDR) [Đủ điều kiện chỉ đạo công tác nghiên cứu] vào năm 2017. Trước khi quay trở lại CNRS, bà Anna Simoni là trợ lý giáo sư về Thống kê tại Đại học Bocconi ở Milan, từ năm 2009 đến năm 2012. Bà là cộng tác viên nghiên cứu tại Đại học Mannheim. Năm 2019, CNRS đã trao tặng bà Huy chương Đồng. Bà là Phó Tổng biên tập của Journal of Econometrics [Tạp chí Kinh trắc học] từ năm 2021, đồng thời là thành viên của Viện Louis Bachelier và Hi!Paris. Trong số nhiều công trình khác, các nghiên cứu của bà tập trung vào chủ đề kinh trắc học và thống kê trên quy mô lớn, cũng như chủ đề dự báo tương lai [forecasting] và dự báo hiện tại [nowcasting].

Huỳnh Thiện Quốc Việt dịch

Nguồn: Comment utiliser Google pour prévoir l’activité économiquedes pays?, Polytechnique Insights, ngày 17/10/2022.

Print Friendly and PDF