LÀM SÁNG TỎ TRÍ TUỆ NHÂN TẠO TẠO SINH: ĐÚNG, SAI, KHÔNG CHẮC
Tác giả: Laure Soulier
Giảng sư tại Đại học Sorbonne,
thành viên của nhóm “Machine Learning and Information Access”
Tóm tắt
|
#1 Trí tuệ nhân tạo tạo sinh: một cuộc cách mạng trí tuệ?
Trí tuệ nhân tạo tạo sinh, một trí tuệ nhân tạo riêng biệt - ĐÚNG
Trong vương quốc của trí tuệ nhân tạo tồn tại nhiều loại. Trong các loại này, trí tuệ nhân tạo tạo sinh, như tên của nó chỉ ra, nổi bật hơn nhờ năng lực tạo ra nội dung: văn bản, hình ảnh, video… Một số được biết đến nhiều nhất trong các hệ thống hiện nay là ChatGPT, Bard, Midjourney hay còn là DALL-E.
Nguyên tắc của các hệ thống này dựa trên các xác suất: Hệ thống đoán trước từ tiếp theo hay pixel kế cận, tùy theo điều mà hệ thống cho là có vẻ như thật nhất. Để làm như vậy, trí tuệ nhân tạo tạo sinh dựa vào một mô hình ngôn ngữ lớn (LLM), nghĩa là một mạng nơ-ron nhân tạo sâu vốn đã được huấn luyện với một lượng lớn các dữ liệu. Như vậy, phần mềm máy tính nhận dạng những mối tương quan khả dĩ nhất tùy theo bối cảnh.
Trí tuệ nhân tạo tạo sinh thông minh - SAI
Cách vận hành này giúp cho trí tuệ nhân tạo tạo sinh đạt được những thành quả nổi bật. Những thành quả này thiết lập được các mối liên hệ giữa rất nhiều yếu tố, từ một khối lượng dữ liệu khổng lồ. Một qui trình phức tạp, bao hàm một số lớn các thao tác toán học, được thực hiện rất nhanh chóng.
Tuy nhiên, ta có thể nói đến “trí thông minh” không? Các kết quả được cung cấp là đáng kinh ngạc nhưng phương thức thao tác để đạt đến kết quả không liên quan gì với trí tuệ của con người. Cũng không phải là một “trí tuệ nhân tạo tổng quát” có khả năng học được bất kỳ công việc gì được thực hiện bởi con người. Ngày nay, trí tuệ nhân tạo tạo sinh thiên về kết hợp với rất nhiều trí tuệ nhân tạo hẹp, được tập hợp trong cùng một mô hình.
Trí tuệ nhân tạo tạo sinh có thể làm tất cả - KHÔNG CHẮC
Hiện nay trí tuệ nhân tạo tạo sinh được sử dụng trong nhiều lĩnh vực: một số người dùng để sáng tạo âm nhạc, một số khác lại dùng để tạo các cảnh cho các trò chơi video. Về phần các mô hình ngôn ngữ lúc đầu được sử dụng để nắm bắt ngữ nghĩa của các từ, thì ngày nay các mô hình này có thể tạo ra văn bản, trả lời các câu hỏi, phiên dịch nội dung, hay còn là tạo ra các mã. Tuy nhiên, các công cụ này có những giới hạn của chúng, đáng chú ý là liên quan đến các bộ dữ liệu được sử dụng trong quá trình học của chúng. Thật vậy, những mối tương quan được nhận diện vào giai đoạn này có thể dẫn đến những sai lầm vào thời điểm tạo sinh. Hơn nữa, những thiên kiến có thể gặp trong giai đoạn huấn luyện lộ ra trong các kết quả. Ví dụ, một hệ thống phiên dịch sẽ có xu hướng dịch “the nurse” thành “nữ y tá” (“l’infirmière”), do các quan niệm rập khuôn về nghề nghiệp.
Mặt khác, trí tuệ nhân tạo tạo sinh không tỏ ra có một sự ổn định đáng kể. Hãy thử với ChatGPT: bạn hãy nêu cùng một câu hỏi với những cách diễn đạt khác nhau, và đôi khi bạn sẽ có những câu trả lời khác nhau! Các hệ thống dựa trên những thao tác toán học biến đổi thông tin thành những vec-tơ có chiều kích lớn, điều này khiến cho khả năng giải thích của các hệ thống này trở nên phức tạp. Vả lại, đang có những nghiên cứu về chủ đề này.
# 2 Có nên nghi ngờ trí tuệ nhân tạo tạo sinh?
Một trí tuệ nhân tạo tạo sinh có thể lầm lẫn – ĐÚNG
Cần phải nhớ rằng một trí tuệ nhân tạo tạo sinh không nhắm đến cung cấp sự thật mà nhắm đến tối đa hóa một điều dường như thật, từ những dữ liệu huấn luyện. Đôi lúc nó làm nổi lên những mối tương quan sai lệch giữa các từ. Hơn nữa, nếu các dữ liệu huấn luyện hàm chứa những sai lầm hay thiên kiến, chắc chắn là hệ thống sẽ tái tạo những sai lầm ấy. Dù sao thì hệ thống cũng không tìm cách để biết thông tin được cung cấp là chính xác hay có nguồn tham khảo! Cách vận hành này đưa đến sự xuất hiện thường xuyên và bất ngờ “những ảo giác”, nghĩa là những câu trả lời sai hay những hình ảnh rời rạc.
Ví dụ, theo một nghiên cứu của Đại học Hong Kong[1], ChatGPT (phiên bản GPT-3.5) đưa ra một tỷ lệ thích đáng là 64%. Bạn có thể chấp nhận tin được một người có nguy cơ sai lầm một trên ba lần không?
Các trí tuệ nhân tạo tạo sinh sẽ nổi loạn và cướp quyền – SAI
Ngay khi trí tuệ nhân tạo có vẻ bước qua một giai đoạn mới, những tưởng tượng về sự nổi dậy của máy móc lại trỗi dậy, dưới tác động của các truyện (phim) khoa học giả tưởng. Không nên thiên về thuyết nhân hóa một cách cực đoan: các trí tuệ nhân tạo tạo sinh chỉ dự đoán các xác suất – một cách phức tạp, tất nhiên. Trí tuệ nhân tạo tạo sinh không có cảm xúc và càng không có nhận thức. Như vậy, trí tuệ nhân tạo tạo sinh không thể có một “ý chí” nổi loạn.
Năm 2015, nhà nghiên cứu Mỹ Andrew Ng[2], chuyên gia về trí tuệ nhân tạo, đã tuyên bố rằng sự lo sợ về khả năng của một cuộc nổi loạn của trí tuệ nhân tạo là không khác gì “lo lắng về nạn nhân mãn trên sao Hỏa”, khi mà “chúng ta còn chưa bao giờ đặt chân lên hành tinh này”. Ngay cả khi công nghệ đã có phần tiến triển trong những năm vừa qua, sự so sánh này dường như vẫn luôn có tính thời sự!
Trí tuệ nhân tạo tạo sinh đặt ra những vấn đề về an toàn và bảo mật – KHÔNG CHẮC
Ngày nay, cần nhận thức rằng phần lớn những mô hình trí tuệ nhân tạo tạo sinh đều được lưu trữ trong những máy chủ của Mỹ. Thế nhưng, nhân danh Patriot Act hay Cloud Act, những dữ liệu được gửi đi có thể được chính quyền Mỹ thu dụng lại. Hơn nữa, chắc chắn là những dữ liệu được cung cấp cho các trí tuệ nhân tạo này sẽ được sử dụng lại để cải tiến các mô hình, giúp có thể tìm lại được những dữ liệu này cho những cuộc điều tra trong tương lai. Điều này có thể biểu thị một rủi ro, đặc biệt là đối với các doanh nghiệp, họ nhìn thấy sự an toàn và tính bảo mật các dữ liệu của họ bị đe dọa. Tuy nhiên, có những giải pháp lưu trữ dữ liệu với những không gian dành riêng và đóng kín, hoặc còn là những phương án trí tuệ nhân tạo tạo sinh thay thế và nguồn mở có thể được thiết lập trên những máy chủ cục bộ.
Tuy nhiên, như thường xảy ra, các quy định cuối cùng phải thích nghi với bối cảnh công nghệ mới. Do đó, năm 2023, Ủy Ban châu Âu và Quốc hội châu Âu đã đạt được một thỏa thuận về một bộ luật về trí tuệ nhân tạo (AI Act)[3]. Chắc là một văn bản sẽ được hoàn chỉnh, nhưng dự trù sẽ quản lý tốt hơn việc sử dụng trí tuệ nhân tạo, phù hợp với luật của châu Âu (bao gồm RGPD – Règlement Général sur la Protection des Données – Quy định chung của Liên minh châu Âu về bảo vệ các dữ liệu cá nhân).
#3 Trí tuệ nhân tạo tạo sinh: hỗ trợ hay đe dọa đối với người lao động?
Trí tuệ nhân tạo tạo sinh có thể thay thế con người trong một số công việc - ĐÚNG
Các khả năng của trí tuệ nhân tạo tạo sinh khiến nó trở nên rất ích lợi trong thế giới nghề nghiệp. Trí tuệ nhân tạo tạo sinh có thể viết các văn bản, viết các dòng mã, lập một kế hoạch đào tạo… Nhưng những gì mà trí tuệ nhân tạo tạo sinh tạo ra thường cần con mắt người xem xét để kiểm chứng sự chính xác, cá thể hóa thông điệp, thêm vào một nét dễ cảm hơn… Như vậy đó là một công cụ giúp nâng cao hiệu suất và giải phóng thời gian để làm việc một cách khác.
Tuy nhiên, một số ngành nghề sẽ không còn nữa, vì không đủ giá trị tăng thêm. Nhưng đó luôn là trường hợp xảy ra với tiến bộ kỹ thuật. Ví dụ, nghề những người thắp đèn đường đã biến mất khi có kỹ thuật chiếu sáng bằng điện.
Trí tuệ nhân tạo tạo sinh sẽ làm cho hàng triệu người thất nghiệp – SAI
Tuy vậy, chúng ta nên thận trọng khi xem xét những hậu quả về nghề nghiệp của trí tuệ nhân tạo tạo sinh. Đó chỉ là một công cụ mới – rất ích lợi – phục vụ con người. Và những diễn biến của thị trường lao động tùy thuộc vào nhiều tham số… Các quầy thu tiền tự động có làm biến mất các nam, nữ thu ngân viên đâu? Đào tạo trực tuyến có thay thế trường học và giảng viên đâu?
Hơn nữa, sự phát triển nhanh chóng của trí tuệ nhân tạo tạo sinh sẽ kéo theo các nghề mới, ví dụ như prompt engineering – nghiên cứu và phát triển các câu hỏi, gợi ý hoặc lệnh dành cho hệ thống trí tuệ nhân tạo –, một ngành nhắm đến tối ưu hóa những yêu cầu được thiết lập cho hệ thống trí tuệ nhân tạo, để có thể đạt được những kết quả tốt nhất. Do đó, theo Tổ chức Lao động quốc tế của Liên Hợp Quốc (ILO)[4] “trí tuệ nhân tạo tạo sinh có khả năng gia tăng hơn là hủy bỏ số việc làm bằng cách tự động hóa một số công việc hơn là hoàn toàn thay thế một vai trò.”
Trí tuệ nhân tạo tạo sinh sẽ đi đến đâu? – KHÔNG RÕ
Về dài hạn, trí tuệ nhân tạo tạo sinh sẽ như thế nào? Nó sẽ diễn biến như thế nào? Đoán trước tương lai của trí tuệ nhân tạo tạo sinh là một điều tế nhị: trước đây vài năm, mấy ai có thể đoán đúng được tình hình hiện nay? Tuy nhiên, một vài xu hướng dần xuất hiện, như sự lai tạo các hệ thống. Ví dụ, RAG (retrieval-augmented generation, “génération augmentée de récupération”) bao gồm kết hợp trí tuệ nhân tạo tạo sinh với một công cụ tìm kiếm, để cải tiến tính chính xác của các kết quả và hạn chế những ảo giác.
Cuối cùng, trí tuệ nhân tạo tạo sinh không thể phát triển nếu không đặt lại vấn đề về dấu ấn sinh thái của nó. Thật vậy, những mô hình của trí tuệ nhân tạo tạo sinh đòi hỏi một lượng dữ liệu và một sức mạnh tính toán khổng lồ. Do đó, một con đường mới đã được thăm dò, nhằm tối ưu hóa các nguồn lực cần thiết: trí tuệ nhân tạo tiết kiệm.
Bastien Contreras ghi lại
Người dịch: Thái Thị Ngọc Dư
Nguồn: “Démystifier l’IA générative: le vrai, le faux et l’incertain”, Polytechnique Insights, 7.2.2024.
Chú
thích: [2] https://www.wired.com/brandlab/2015/05/andrew-ng-deep-learning-mandate-humans-not-just-machines/