27.3.22

Làm thế nào mà việc điều tra dân số Hoa Kỳ lại cho ra đời công ty xử lý dữ liệu đầu tiên cách đây 125 năm – và khởi động ngành công nghiệp máy tính của Mỹ

LÀM THẾ NÀO MÀ VIỆC ĐIỀU TRA DÂN SỐ HOA KỲ LẠI CHO RA ĐỜI CÔNG TY XỬ LÝ DỮ LIỆU ĐẦU TIÊN CÁCH ĐÂY 125 NĂM – VÀ KHỞI ĐỘNG NGÀNH CÔNG NGHIỆP MÁY TÍNH CỦA MỸ

Ngày 1 tháng 12 năm 2021, 1 giờ 36 phút chiều giờ GMT

David Lindsay Roberts

Chiếc máy điện cơ được dùng trong cuộc điều tra dân số Hoa Kỳ năm 1890 này là hệ thống xử lý dữ liệu tự động đầu tiên. Niall Kennedy/Flickr, CC BY-NC

Hiến pháp Hoa Kỳ yêu cầu phải tiến hành tính tổng điều tra dân số vào đầu mỗi thập kỷ.

Cuộc điều tra dân số này vốn mang ý nghĩa chính trị và sẽ vẫn tiếp tục như thế. Điều này thể hiện rõ qua những tranh cãi trong thời gian chuẩn bị cho cuộc điều tra dân số năm 2020.

Tuy nhiên, không nhiều người biết đến tầm quan trọng của cuộc tổng điều tra dân số trong việc phát triển ngành công nghiệp máy tính của Hoa Kỳ, một câu chuyện tôi có kể trong cuốn sách của mình, “Cộng hoà số: Những câu chuyện bất ngờ của các nhà toán học Mỹ xuyên suốt lịch sử” [Republic of Numbers: Unexpected Stories of Mathematical Americans through History]. Trong đó bao gồm việc thành lập công ty xử lý dữ liệu tự động đầu tiên, Công ty Máy lập bảng biểu, cách đây 125 năm vào ngày 3 tháng 12 năm 1896.

Tăng trưởng dân số

Công dụng duy nhất của cuộc điều tra dân số được quy định rõ ràng trong Hiến pháp là nhằm phân bổ số ghế trong Hạ viện. Bang đông dân hơn được nhiều ghế hơn.

Cách hiểu đơn giản nhất của nhiệm vụ điều tra dân số là chỉ cần báo cáo tổng dân số mỗi bang. Nhưng cuộc điều tra dân số chưa bao giờ tự giới hạn chính mình trong đó.

Một nhân tố phức tạp đã xuất hiện ngay từ đầu, bởi sự phân biệt giữa “người tự do” và “ba phần năm trên tổng tất cả những người còn lại” trong Hiến pháp. Đây là thỏa hiệp đáng hổ thẹn của các Tổ phụ Lập quốc Hoa Kỳ [Founding Fathers] giữa những bang có lượng lớn người bị bắt làm nô lệ và những bang có tương đối ít dân cư.

Cuộc điều tra dân số đầu tiên, vào năm 1790, thống kê thêm các đặc điểm không bắt buộc về mặt Hiến pháp là tuổi và giới tính. Trong những thập kỷ tiếp theo, nhiều đặc trưng cá nhân khác cũng được khảo sát: tình trạng nghề nghiệp, tình trạng hôn nhân, tình trạng học vấn, nơi sinh, v.v..

Đất nước càng phát triển, mỗi cuộc điều tra dân số càng đòi hỏi nhiều nỗ lực hơn trước đó, không chỉ để thu thập dữ liệu mà còn để biên soạn chúng thành dạng có thể sử dụng được. Quá trình xử lý cuộc điều tra dân số năm 1880 kéo dài mãi đến năm 1888 mới hoàn thành.

Một công việc văn phòng nhàm chán toàn số là số, dễ sai sót với khối lượng nhiều chưa từng thấy.

Vì dân số rõ ràng đang tiếp tục tăng nhanh chóng, những ai có đủ trí tưởng tượng đều có thể thấy trước rằng việc xử lý cuộc điều tra dân số năm 1890 sẽ thực sự rất khủng khiếp nếu không có một vài thay đổi trong thủ tục.

Một sáng chế mới

John S. Billings (1838-1913)
Herman Hollerith (1860-1929)

John Shaw Billings, bác sĩ được giao nhiệm vụ hỗ trợ Văn phòng điều tra dân số tổng hợp số liệu thống kê y tế, đã quan sát kỹ lưỡng những nỗ lực lập bảng biểu khổng lồ cần có để xử lý dữ liệu thô của năm 1880. Ông bày tỏ mối quan tâm của mình với một kỹ sư cơ khí trẻ hỗ trợ điều tra dân số, Herman Hollerith, một sinh viên mới tốt nghiệp trường Columbia School of Mines.

Vào ngày 23 tháng 9 năm 1884, Văn phòng Bằng sáng chế Hoa Kỳ đã ghi lại một bản đệ trình của Hollerith, 24 tuổi, có tiêu đề “Nghệ thuật tổng hợp số liệu thống kê”.

Máy lập bảng điện Hollerith được sử dụng vào năm 1902. Cục điều tra dân số Hoa Kỳ

Nhờ từng bước cải tiến các ý tưởng của bản đệ trình đầu tiên này, Hollerith giành chiến thắng trong cuộc thi năm 1889 để cải thiện việc xử lý điều tra dân số năm 1890.

Các giải pháp công nghệ do Hollerith nghĩ ra gồm một bộ thiết bị cơ và điện. Đổi mới quan trọng đầu tiên là chuyển dữ liệu từ các tờ kiểm kê điều tra dân số viết tay sang các mẫu lỗ đục trên thẻ. Như Hollerith đã diễn đạt, trong bản sửa đổi năm 1889 của đơn đăng ký bằng sáng chế của mình, “Do đó, một lỗ được đục tương ứng với người, sau đó là một lỗ tùy theo người đó là nam hay nữ, một lỗ khác để ghi nhận họ là người bản xứ hay nước ngoài, một lỗ nữa cho da trắng hoặc da màu, & c.”

Quy trình này yêu cầu phát triển máy móc đặc biệt nhằm đảm bảo các lỗ phải được đục một cách chính xác và hiệu quả.

Hollerith sau đó đã phát minh ra một chiếc máy để “đọc” thẻ, bằng cách thăm dò thẻ với các chốt ghim, theo đó chỉ khi trên thẻ có lỗ thì chốt mới xuyên qua và tạo được kết nối điện, kết quả là làm tăng số trên bộ đếm tương ứng.

Ví dụ, nếu một thẻ cho một nông dân nam da trắng đi qua máy, bộ đếm của những danh mục này sẽ được tăng lên một. Thẻ được làm đủ chắc chắn để đi qua máy đọc thẻ nhiều lần, nhằm đếm các mục khác nhau hoặc kiểm tra kết quả.

Việc đếm diễn ra nhanh đến mức các số liệu theo từng bang cần thiết cho sự phân bổ của quốc hội đã được chứng thực trước cuối tháng 11 năm 1890.

‘Máy phân loại thẻ đục lỗ cơ học’ này được sử dụng cho cuộc điều tra dân số năm 1950. Cục Điều tra Dân số Hoa Kỳ

Sự trỗi dậy của thẻ đục lỗ

Sau thành công của cuộc điều tra dân số, Hollerith bắt đầu kinh doanh công nghệ này. Công ty do ông thành lập, Công ty Máy lập bảng biểu (Tabulating Machine Company), sau khi ông nghỉ hưu, sẽ trở thành Máy kinh doanh quốc tế – IBM. IBM đã dẫn đầu trong việc hoàn thiện công nghệ thẻ để ghi và lập bảng các bộ dữ liệu lớn cho nhiều mục đích khác nhau.

Vào những năm 1930, nhiều doanh nghiệp đã sử dụng thẻ cho các thủ tục lưu trữ hồ sơ, chẳng hạn như bảng lương và hàng tồn kho. Một số nhà khoa học chuyên sâu về dữ liệu, đặc biệt là các nhà thiên văn học, cũng thấy các thẻ này thuận tiện. Lúc đó IBM đã tiêu chuẩn hóa mẫu thẻ 80 cột và phát triển các máy bấm lỗ vốn thay đổi rất ít trong nhiều thập kỷ sau đó.

Xử lý thẻ trở thành một trụ cột trong ngành công nghiệp máy tính hùng mạnh nở rộ sau Thế chiến thứ hai, và IBM đã trở thành tập đoàn lớn thứ ba trên thế giới trong một thời gian ngắn. Xử lý thẻ đóng vai trò như giàn giáo cho các máy tính thuần điện tử nhỏ gọn và chạy nhanh hơn rất nhiều đang chiếm ưu thế lúc đó, với rất ít dấu vết sót lại từ chế độ làm việc cũ.

Thẻ đục lỗ IBM màu xanh lam. Gwern/Wikimedia Commons

Những ai lớn lên mà chỉ biết đến máy tính như một thiết bị di động dễ dàng, giao tiếp bằng cách chạm ngón tay hoặc thậm chí bằng giọng nói, có thể không quen thuộc với những chiếc máy tính có kích cỡ bằng cả căn phòng của những năm 1950 và 60, nơi mà phương thức chính để nhập dữ liệu và các hướng dẫn là bằng cách tạo một bộ thẻ tại máy đục lỗ, sau đó nạp cả bộ vào máy đọc thẻ. Điều này vẫn tồn tại như là thủ tục mặc định cho nhiều máy tính vào những năm 1980.

Grace M. Hopper (1906-1992)

Nhà tiên phong máy tính Grace Murray Hopper nhớ lại về sự nghiệp ban đầu của mình, “Vào những ngày đó, mọi người đều sử dụng thẻ đục lỗ và họ nghĩ rằng họ sẽ sử dụng thẻ đục lỗ mãi mãi.”

Hopper từng là thành viên quan trọng trong nhóm đã tạo ra chiếc máy tính đa năng khả thi về mặt thương mại đầu tiên, Máy tính Tự động Đa năng, hay UNIVAC, một trong những chiếc máy đọc thẻ khổng lồ. Vừa vặn, chiếc UNIVAC đầu tiên được chuyển giao, vào năm 1951, là cho Cục Điều tra Dân số Hoa Kỳ, vẫn đang khao khát cải thiện khả năng xử lý dữ liệu của mình.

Không, người dùng máy tính sẽ không sử dụng thẻ đục lỗ mãi mãi, nhưng họ đã sử dụng chúng qua chương trình đổ bộ lên Mặt trăng của tàu Apollo và thời kỳ đỉnh cao của Chiến tranh Lạnh. Hollerith có thể đã nhận ra hậu duệ trực tiếp của bộ máy điều tra dân số những năm 1890 của mình ở gần 100 năm sau.

Đây là phiên bản cập nhật của một bài báo được xuất bản lần đầu vào ngày 15 tháng 10 năm 2019.

Về tác giả

David Lindsay Roberts

David Lindsay Roberts

Giảng viên Toán học, Đại học Cộng đồng Prince George

Tuyên bố công khai

David Lindsay Roberts không làm việc, không tham vấn, không sở hữu cổ phần hoặc nhận tài trợ từ bất kỳ công ty hay tổ chức nào có thể hưởng lợi từ bài viết này, và tuyên bố không làm gì khác ngoài công việc học thuật.

Huỳnh Thị Thanh Trúc dịch

Nguồn: How the US census led to the first data processing company 125 years ago – and kick-started America’s computing industry, The Conversation, Dec 1, 2021.

----

Bài có liên quan:

Print Friendly and PDF