11.5.16

"Hồ sơ Panama": Tờ "Le Monde" đã phân tích hơn 11 triệu tập tin như thế nào



"Hồ sơ Panama": Tờ "Le Monde" đã phân tích hơn 11 triệu tập tin như thế nào
Vào ngày chủ nhật 3 tháng tư, tờ Le Monde và 108 phương tiện truyền thông quốc tế đã bắt đầu công bố "Hồ sơ Panama", một loạt các tiết lộ về những thiên đường thuế. Trong gần một năm, chúng tôi đã tiến hành phân tích một khối lượng cơ sở dữ liệu khổng lồ của nội bộ công ty Mossack Fonseca tại Panama, một trong những công ty hàng đầu thế giới trong lãnh vực thành lập các công ty đăng ký hoạt động ở nước ngoài.
"Hồ sơ Panama" theo ba điểm
  • Tờ Le Monde và 108 tòa soạn khác tại 76 quốc gia, với sự điều phối của Hiệp hội các nhà báo điều tra quốc tế (ICIJ), đã tiếp cận được một khối lượng thông tin chưa từng được công bố, vạch trần một thế giới các giao dịch tài chính mờ ám ở nước ngoài và các thiên đường thuế.
  • 11,5 triệu tệp tin được lấy từ kho lưu trữ của công ty Mossack Fonseca tại Panama, một công ty chuyên thành lập các công ty đăng ký hoạt động ở nước ngoài, từ năm 1977 đến năm 2015. Đây là vụ rò rỉ thông tin lớn nhất chưa từng được các phương tiện truyền thông khai thác.
  • "Hồ sơ Panama" tiết lộ, ngoài hàng ngàn người vô danh, tên của nhiều nguyên thủ quốc gia, của những nhà tỷ phú, những tên tuổi lớn trong ngành thể thao, những người nổi tiếng hay những nhân vật trong diện bị quốc tế trừng phạt đã nhờ đến những công ty bình phong ở nước ngoài để che giấu tài sản của họ.
Tờ "Le Monde" đã tiếp cận được những tài liệu gì?
Giống như tất cả các đối tác truyền thông của Hiệp hội các nhà báo điều tra quốc tế (ICIJ), tờ Le Monde đã truy cập khoảng hơn 11,4 triệu tài liệu, tổng cộng hơn 2,6 terabyte dữ liệu. Điều này có nghĩa là cần đến nhiều thập niên để đọc tài liệu ngày và đêm, nếu muốn lần ra từ đầu đến đuôi cả cơ sở dữ liệu — chưa kể đến tính phức tạp của một số hồ sơ.
Phần đầu của các tài liệu cấu thành một bộ hồ sơ đăng ký của 214.488 công ty được tập đoàn Mossack Fonseca thành lập hoặc quản lý ở nước ngoài, từ năm 1977 là năm tập đoàn được thành lập đến cuối năm 2015. Một bộ hồ sơ có thể được tuyên bố công khai, nếu công ty luật nói trên không được che chở trong các thiên đường thuế. Như trong một tài liệu của sổ đăng ký kinh doanh tại Pháp, chúng ta có thể tìm thấy những ngày tháng quan trọng của công ty (ngày thành lập, ngày giải thể), danh tính của các trung gian tài chính (các ngân hàng, luật sư về thuế) và tên của các cổ đông và các nhà quản lý công ty — thường là những người đứng tên thay.
Trong hồ sơ của mỗi công ty còn có một loạt các tài liệu khác dưới nhiều hình thức khác nhau (dạng văn bản PDF, hình ảnh, dạng văn bản Word, dạng văn bản Powerpoint, bảng tính, và thậm chí cả tệp tin bằng âm thanh), đôi khi cung cấp thông tin về hoạt động của công ty và về những người thụ hưởng thực sự của công ty.
Nhưng điểm chủ yếu về sự phong phú của cơ sở dữ liệu là các email và thư tín đã được scan, vạch rõ hoạt động hàng ngày của tập đoàn Mossack Fonseca. Qua đó, chúng ta có thể tìm thấy những cuộc trao đổi thư từ trong nội bộ giữa các nhân viên của tập đoàn, cũng như những cuộc trao đổi thư từ với khách hàng của họ, những thứ thường nói lên nhiều điều hơn là các hồ sơ hành chánh.
Nếu phần lớn các tài liệu được viết bằng tiếng Anh (theo yêu cầu về sự toàn cầu hóa các thiên đường thuế), thì còn có một số tài liệu được viết bằng tiếng Pháp, tiếng Tây Ban Nha, tiếng Trung Quốc và tiếng Nga.
Biết được gì về nguồn gốc của "Hồ sơ Panama"?
Vụ "rò rỉ" thông tin, đưa ra ánh sáng vụ bê bối của "Hồ sơ Panama", đã cho phép tiết lộ bí mật của hàng triệu tài liệu và dữ liệu của công ty Mossack Fonseca tại Panama. Thông tin bí mật xuất phát từ một nguồn đã trao cho tờ Süddeutsche Zeitung, mà không đòi hỏi tiền, những tập tin của công ty chuyên thành lập các công ty đăng ký hoạt động ở nước ngoài. Để bảo vệ người cung cấp thông tin, danh tính của người cảnh báo đã không được tiết lộ cho các đối tác truyền thông của Hiệp hội các nhà báo điều tra quốc tế (ICIJ), những người đã tiến hành cuộc điều tra.
Tuy nhiên, tính xác thực của các tập tin đã được tờ Süddeutsche Zeitung và tờ Le Monde kiểm tra hai lần. Nhiều phần của vụ "rò rỉ" thông tin này, những thông tin mang tính chắp vá và cũ xưa hơn, đã được đem bán cho các cơ quan thuế của Đức, Mỹ và Anh trong những năm gần đây, một thủ tục tương đối bình thường, đặc biệt là tại Đức. Pháp cũng được coi là một trong những nước đã được đề nghị mua lại một phần các thông tin của "Hồ sơ Panama". Ở bên kia sông Ranh (tức là nước Đức ND), các cuộc điều tra trên cơ sở các tài liệu nói trên đã dẫn đến, vào tháng hai năm 2015, một loạt vụ khám xét các ngân hàng của Đức bị nghi ngờ đồng lõa với hoạt động rửa tiền và gian lận thuế. Ngân hàng Commerzbank, ngân hàng lớn thứ hai của Đức, vào tháng 10 năm 2015, đã chấp nhận trả 17 triệu euro tiền phạt do đã giúp một số khách hàng của họ gian lận thuế với sự giúp đỡ của những công ty được Mossack Fonseca thành lập.
Tờ "Le Monde" đã tiến hành nghiên cứu các tài liệu như thế nào?
Công nghệ đã giúp rất nhiều cho việc nghiên cứu khối lượng khổng lồ các dữ liệu này. Tổ chức ICIJ đã cung cấp những công cụ kỹ thuật có hiệu năng rất cao để tiến hành nghiên cứu các tài liệu trong "Hồ sơ Panama" (kể cả các tài liệu đã được scan, nhờ một hệ thống nhận dạng văn bản). Có được một công cụ tìm kiếm, chúng tôi dễ dàng tìm ra được đường đi trong các dữ liệu, bắt đầu từ một cái tên, một công ty hoặc một cụm từ.
Để đối phó với một cơ sở dữ liệu lớn như vậy, có hai cách tiếp cận. Cách tiếp cận thứ nhất là bắt đầu tìm kiếm từ những thuật ngữ có thể dẫn đến một đầu mối đầu tiên. Ví dụ, chúng ta xem có thể phát hiện được điều gì từ thuật ngữ "hộ chiếu Pháp", với hy vọng là việc tìm kiếm có thể dẫn đến một cái tên, một công ty, một hướng tìm kiếm tiềm năng nào đó. Chúng ta cũng có thể tìm hiểu các biệt ngữ của Mossack Fonseca, chẳng hạn như từ "PEP" ("Politically Exposed Person – Người liên quan đến chính trị"), "UBO" ("Ultimate Beneficial Owner – Người thụ hưởng cuối cùng") hoặc "Due Diligence" (Thẩm định chi tiết danh tính của khách hàng).
Cách tiếp cận thứ hai, có phương pháp hơn, đòi hỏi phải tạo ra những danh sách từ thượng nguồn. Thay vì tìm chữ "nghị sĩ Pháp", thì cần phục hồi lại danh sách toàn bộ các nghị sĩ Pháp, trên các trang web của Quốc hội, Thượng viện và Quốc hội Châu Âu, và khởi động một hệ thống tìm kiếm bằng cách sử dụng các công cụ được ICIJ thiết lập.
Chẳng hạn như, ngoài việc tìm kiếm một cách có phương pháp tên của các nghị sĩ Pháp và châu Âu, chúng tôi đã bóc trần danh sách 500 người Pháp giàu nhất của tạp chí Challenges (và danh sách tương đương trên trường quốc tế, danh sách của tạp chí Forbes), những biểu đồ tổ chức của các đảng phái chính trị lớn ở Pháp, danh sách các Bộ trưởng Pháp kể từ những năm 1980, những nhà quản lý chỉ số chứng khoán CAC 40 của Pháp (Cotation Assistée en Continu), những nhân vật được người Pháp yêu thích, những cá nhân có tên trong các vụ bê bối chính trị-pháp lý kể từ năm 2000, những nguyên thủ quốc gia và chính phủ trên khắp thế giới hoặc những cầu thủ của đội tuyển bóng đá quốc gia của Pháp. Không bỏ qua những cái tên của các cổ đông của tờ Le Monde, được đưa vào các cuộc tìm kiếm nói trên.
Khi có một cái tên hoặc một chủ đề được quan tâm xuất hiện trong cơ sở dữ liệu, chúng tôi còn phải giải mã tất cả các thư tín có liên quan đến vỏ bọc công ty đăng ký hoạt động ở nước ngoài được nhắm đến. Khi tên của cùng một người mà nắm giữ đến năm công ty khác nhau trong ngần ấy vùng lãnh thổ để thành lập những công ty bình phong phức tạp về tài chính, thì thời gian nghiên cứu và phân tích để hiểu được đầu đuôi sự việc tăng theo luật số mũ.
Nếu tờ "Le Monde" không nêu ra một cái tên, thì điều đó có nghĩa là cái tên đó không có trong cơ sở dữ liệu, có phải vậy không?
Không hẳn vậy. Trước hết, bởi vì, mặc dù có gần một năm để tìm tòi nghiên cứu, chúng tôi không có đủ thời gian để đào bới tất cả các tài liệu của "Hồ sơ Panama". Phải tốn rất nhiều thời gian để làm được điều đó. Chúng tôi chủ yếu chỉ tập trung vào những thời kỳ gần đây, những thời kỳ mà các dữ liệu này thu hút được sự quan tâm của công chúng so với những dữ liệu mà chúng tôi đã tiếp cận được trong các vụ rò rỉ thông tin trước đây. Chúng ta còn phải thực hiện nhiều nghiên cứu trên danh sách những cái tên, hoặc những thời kỳ xa xưa hơn.
Rồi những công cụ có sẵn, dù có hiệu năng cao đến đâu, cũng không khỏi mắc sai lầm. Nếu một người chỉ được nêu tên trong một tài liệu viết tay được scan, thì có khả năng công cụ tìm kiếm không phát hiện được, văn bản đó trở nên vô hình đối với chúng tôi, ngoại trừ khi có một sự tình cờ nào đó. Tương tự, một số lỗi chính tả hoặc một số biến thể trong cách viết tên cũng có thể làm cho chúng tôi bỏ qua các tài liệu thú vị.
Ngoài ra, nếu tên của một người không xuất hiện, thì điều này không có nghĩa là người đó không sử dụng các dịch vụ của công ty Mossack Fonseca. Họ có thể bảo vệ danh tính của mình bằng cách đăng ký công ty dưới tên của một người thân, hoặc bằng cách sử dụng hiệu quả những người đứng tên thay. Hơn nữa, mặc cho những nghiên cứu của chúng tôi, chúng ta không hề có một ý tưởng nào về người thụ hưởng kinh tế của rất nhiều công ty được Mossack Fonseca quản lý.
Cuối cùng, nên nhớ rằng công ty Mossack Fonseca không phải là công ty đầu cuối duy nhất của các công ty đăng ký hoạt động ở nước ngoài: nhiều nhân vật cực kỳ quan trọng có thể sử dụng các dịch vụ của các đối thủ cạnh tranh với Mossack Fonseca ngày nay vẫn còn hoạt động trong bóng tối.
Điểm cuối cùng: Tờ Le Monde đã quyết định chỉ công bố những cái tên đáng quan tâm: những công chức Nhà nước, những nhân vật quan trọng trong lãnh vực kinh tế, văn hóa, thể thao, hay những người gian lận được chứng minh, những người mà chúng tôi đã tìm cách liên hệ một cách có hệ thống trước khi công bố.
Có phải việc một cái tên xuất hiện trong "Hồ sơ Panama" có nghĩa là nó dính líu đến các công ty đăng ký hoạt động ở nước ngoài không?
Không hẳn vậy. Có hàng trăm tên của các cá nhân hoặc doanh nghiệp được đề cập trong các tệp tin, không phải vì họ dính líu đến các công ty đăng ký hoạt động ở nước ngoài, mà, ví dụ, sau một báo cáo tìm kiếm của Google, được thực hiện một cách có hệ thống bởi một nhà thầu phụ của Mossack Fonseca đối với hàng ngàn khách hàng, và đã hồi đáp một kết quả không có quan hệ trực tiếp gì với họ. Một trong những tác giả của những dòng này cũng đã ngạc nhiên khi thấy tên mình xuất hiện trong cơ sở dữ liệu, do chính các trích dẫn tìm kiếm này, dẫn về một trong các bài viết của mình.
Tờ “Le Monde” có được trợ giúp trong các nghiên cứu của mình không?
Chúng tôi không phải là những người duy nhất trong cuộc điều tra này. Ngoài khối lượng các dữ liệu, thách thức của "Hồ sơ Panama" nằm trong sự toàn cầu hóa của hệ thống hoạt động kinh doanh ở nước ngoài. Do đó có một số đối tượng xuyên quốc gia là mục tiêu điều tra chung của 109 tòa sọan có liên quan trong dự án. Nhiều đồng nghiệp nước ngoài tình cờ có được những tài liệu thú vị đối với các độc giả Pháp cũng đã chia sẻ những phát hiện của họ cho chúng tôi — và ngược lại.
Vì sao không công bố hết toàn bộ các dữ liệu cho công chúng biết?
Như trong các chiến dịch cùng loại trước đây (các vụ rò rỉ “OffshoreLeaks”, “SwissLeaks”…), chúng tôi tiến hành một cuộc chọn lọc — ở đây mang tính tập thể đối với tất cả các tòa sọan có liên quan — để chỉ công bố cho công chúng biết một công trình phát sinh từ các cuộc điều tra của báo chí mà thôi. Vì những lý do rõ ràng về trách nhiệm và tôn trọng đời tư. Bên cạnh những diễn giải phức tạp và đòi hỏi phải đối chiếu với rất nhiều dữ liệu, trong thực tế các tài liệu còn chứa một khối lượng khổng lồ các thông tin cá nhân, như địa chỉ nhà ở hoặc số điện thoại.
Nhà báo tại trang Monde.fr
Nhà báo (Dữ liệu) tại tờ Le Monde
Huỳnh Thiện Quốc Việt dịch
Print Friendly and PDF