PHÂN TÍCH KINH TẾ: Một chuyên gia về AI giải thích tại sao khó cung cấp cho máy tính điều mà bạn coi là đương nhiên: Lý trí thông thường

21.9.21

Một chuyên gia về AI giải thích tại sao khó cung cấp cho máy tính điều mà bạn coi là đương nhiên: Lý trí thông thường

Một chuyên gia về AI giải thích tại sao khó cung cấp cho máy tính điều mà bạn coi là đương nhiên: Lý trí thông thường

Lý trí thông thường bao gồm sự hiểu biết trực giác về vật lý cơ bản – điều mà máy tính còn thiếu. Ảnh: d3sign/Moment via Getty Image

Tác giả: Mayank Kejriwal

Hãy tưởng tượng bạn đang tiếp bạn bè đến ăn trưa và định đặt hàng một chiếc bánh pizza pepperoni. Bạn nhớ lại Amy nói rằng Susie đã ngừng ăn thịt. Bạn thử gọi cho Susie, nhưng khi cô ấy không bắt máy, bạn quyết định chơi an toàn và thay vào đó chỉ đặt một chiếc bánh pizza margherita.

Mọi người thường coi khả năng đối phó với những tình huống như thế này là đương nhiên. Trên thực tế, để đạt được những kỳ tích này, con người không phải dựa vào một mà là một tập hợp các khả năng phổ quát mạnh mẽ được gọi là lý trí thông thường.

Là một nhà nghiên cứu trí tuệ nhân tạo, công việc của tôi là một phần trong nỗ lực to lớn nhằm mang lại cho máy tính một điều có vẻ giống như lý trí thông thường. Đó là một nỗ lực vô cùng khó khăn.

Xác định nhanh lý trí thông thường

G. K. Chesterton (1874-1936)

Mặc dù vừa phổ biến vừa thiết yếu đối với cách con người hiểu và học hỏi thế giới xung quanh, nhưng lý trí thông thường đã không có một định nghĩa chính xác duy nhất. G. K. Chesterton, nhà triết học và thần học người Anh, đã có bài viết nổi tiếng vào đầu thế kỷ 20 rằng “lý trí thông thường là một điều hoang dã, man rợ và vượt ra ngoài quy tắc”. Các định nghĩa hiện đại ngày nay đồng ý rằng, tối thiểu, đó là khả năng tự nhiên, chứ không do được dạy dỗ chính thức, một năng lực của con người cho phép con người điều hướng cuộc sống hàng ngày.

Lý trí thông thường rộng lớn một cách bất thường và không chỉ bao gồm các khả năng xã hội, như quản lý kỳ vọng và lý luận về cảm xúc của người khác, mà cũng còn cả ý thức vật lý đơn giản, chẳng hạn như biết rằng một tảng đá nặng không thể được đặt một cách an toàn trên một chiếc bàn nhựa mỏng manh. Đơn giản, bởi vì mọi người biết rõ những điều như vậy dù không phải vận dụng một cách có ý thức các phương trình vật lý.

Lý trí thông thường cũng bao gồm kiến thức nền tảng về các khái niệm trừu tượng, chẳng hạn như thời gian, không gian và các sự kiện. Kiến thức này cho phép mọi người lập kế hoạch, ước tính và tổ chức mà không cần phải quá chính xác.

Khó tính toán được lý trí thông thường

Thật là kì lạ, lý trí thông thường đã từng là một điều quan trọng thách thức ở biên giới của AI kể từ những ngày đầu tiên của lĩnh vực này vào những năm 1950. Bất chấp những tiến bộ to lớn trong AI, đặc biệt là trong trò chơi và thị giác máy tính, lý trí thông thường của máy móc có sự phong phú của lý trí thông thường của con người vẫn là một khả năng xa vời. Đây có thể là lý do tại sao những nỗ lực của AI được thiết kế cho các vấn đề phức tạp trong thế giới thực với nhiều phần đan xen nhau, chẳng hạn như chẩn đoán và đề xuất phương pháp điều trị cho bệnh nhân COVID-19, đôi khi thất bại thảm hại.

AI hiện đại được thiết kế để giải quyết các vấn đề có tính cụ thể cao, trái ngược với lý trí thông thường, vì lý trí thông thường thì mơ hồ và không thể xác định bằng một bộ quy tắc. Ngay cả những mô hình mới nhất đôi khi cũng mắc phải những lỗi vô lý, cho thấy rằng mô hình thế giới của AI còn thiếu điều gì đó cơ bản. Ví dụ, ta có văn bản sau:

“Bạn đã tự rót cho mình một ly việt quất, nhưng sau đó do lơ đãng, bạn đã đổ khoảng một thìa cà phê nước ép nho vào đó. Có vẻ ổn. Bạn thử ngửi nó, nhưng bạn bị cảm nặng, vì vậy bạn không thể ngửi thấy bất cứ điều gì. Bạn đang rất khát. Vì vậy, bạn”

GPT-3, một phần mềm AI tạo sinh ngôn ngữ tự nhiên được chào mời cao, đã ghi thêm vào

“uống đi. Bây giờ bạn đã chết.”

Những nỗ lực đầy tham vọng gần đây đã công nhận lý trí thông thường của máy móc là một vấn đề AI gần như không thể giải quyết được trong thời đại chúng ta, một vấn đề đòi hỏi sự hợp tác đồng bộ giữa các tổ chức trong nhiều năm. Một ví dụ đáng chú ý là chương trình Machine Common Sense (Lý trí thông thường của máy móc) kéo dài 4 năm do U.S. Defense Advanced Research Projects Agency (Cơ quan Dự án Nghiên cứu Tiên tiến Quốc phòng Hoa Kỳ) khởi động vào năm 2019 để đẩy nhanh nghiên cứu trong lĩnh vực này sau khi cơ quan này công bố một bài phác thảo vấn đề và hiện trạng nghiên cứu trong lĩnh vực này.

Chương trình Machine Common Sense tài trợ cho nhiều nỗ lực nghiên cứu hiện nay về lý trí thông thường của máy móc, bao gồm cả chương trình Multi-modal Open World Grounded Learning and Inference (MOWGLI) (Học tập và suy luận dựa trên thế giới mở đa phương thức) của chính chúng tôi. MOWGLI là sự hợp tác giữa nhóm nghiên cứu của chúng tôi tại Đại học Southern California và các nhà nghiên cứu AI từ Viện Công nghệ Massachusetts, Đại học California tại Irvine, Đại học Stanford và Học viện Bách khoa Rensselaer. Dự án nhằm mục đích xây dựng một hệ thống máy tính có thể trả lời một loạt các câu hỏi về lý trí thông thường.

Mô hình transformer để giải cứu?

Một lý do để lạc quan về việc cuối cùng có thể bẻ khóa lý trí thông thường của máy móc là sự phát triển gần đây của một loại AI học sâu tiên tiến được gọi là mô hình transformer.

Mô hình transformer có thể mô hình hóa ngôn ngữ tự nhiên một cách mạnh mẽ và, với một số điều chỉnh, có thể trả lời các câu hỏi đơn giản về lý trí thông thường. Trả lời câu hỏi về lý trí thông thường là bước đầu tiên cần thiết để xây dựng các chatbot^[*] có thể trò chuyện theo cách giống như con người.

Trong vài năm gần đây, rất nhiều nghiên cứu đã được công bố về mô hình transformer, với các ứng dụng trực tiếp vào lập luận về lý trí thông thường. Sự tiến bộ nhanh chóng này với tư cách là một cộng đồng đã buộc các nhà nghiên cứu trong lĩnh vực này phải đối mặt với hai câu hỏi liên quan nằm giữa khoa học và triết học: Vậy lý trí thông thường là gì? Và làm thế nào chúng ta có thể chắc chắn một AI có lý trí thông thường hay không?

Để trả lời câu hỏi đầu tiên, các nhà nghiên cứu chia lý trí thông thường thành các loại khác nhau, bao gồm lý trí thông thường về xã hội học, tâm lý học và kiến thức nền tảng. Các tác giả của một cuốn sách gần đây lập luận rằng các nhà nghiên cứu có thể tiến xa hơn nữa bằng cách chia các danh mục này thành 48 lĩnh vực chi tiết, chẳng hạn như lập kế hoạch, phát hiện mối đe dọa và cảm xúc.

Tuy nhiên, không phải lúc nào các lĩnh vực này cũng có thể được tách biệt một cách rõ ràng. Trong bài viết gần đây của chúng tôi, các thí nghiệm đã gợi ý rằng một câu trả lời rõ ràng cho câu hỏi đầu tiên có thể có vấn đề. Ngay cả khi nhà chú giải là con người chuyên nghiệp - những người phân tích văn bản và phân loại các thành phần của văn bản - trong nhóm của chúng tôi cũng không đồng ý về những khía cạnh nào của lý trí thông thường được áp dụng cho một câu cụ thể. Các nhà chú giải đồng ý về các phạm trù tương đối cụ thể như thời gian và không gian nhưng lại bất đồng về các khái niệm trừu tượng hơn.

Nhận biết lý trí thông thường của AI

Ngay cả khi bạn chấp nhận rằng có một số chồng chéo và mơ hồ trong các lý thuyết về lý trí thông thường là không thể tránh khỏi, thì liệu các nhà nghiên cứu có bao giờ thực sự chắc chắn rằng một AI có lý trí thông thường không? Chúng ta thường đặt câu hỏi cho máy móc để đánh giá lý trí thông thường của chúng, nhưng con người điều hướng cuộc sống hàng ngày theo những cách thú vị hơn nhiều. Con người sử dụng một loạt các kỹ năng, được hoàn thiện bởi quá trình tiến hóa, bao gồm khả năng nhận biết nguyên nhân và kết quả cơ bản, giải quyết vấn đề sáng tạo, ước tính, lập kế hoạch và các kỹ năng xã hội thiết yếu, chẳng hạn như trò chuyện và thương lượng. Cho dù danh sách này có thể dài và không đầy đủ, một AI cũng phải thành công không ít hơn trước khi những người tạo ra nó có thể tuyên bố chiến thắng trong nghiên cứu lý trí thông thường của máy móc.

Có một điều đã trở nên quá rõ ràng là ngay cả nghiên cứu về mô hình transformer cũng đang mang lại hiệu suất ngày càng giảm. Mô hình transformer ngày càng lớn và tốn nhiều điện hơn. Một mô hình transformer gần đây được phát triển bởi công cụ tìm kiếm khổng lồ Baidu của Trung Quốc có hàng tỷ thông số. Cần một lượng lớn dữ liệu để tập tành hiệu quả. Tuy nhiên, cho đến nay nó đã được chứng minh là không thể nắm bắt được các sắc thái của lý trí thông thường của con người.

Mayank Kejriwal

Ngay cả những người tiên phong về học sâu dường như cũng nghĩ rằng có thể cần nghiên cứu cơ bản mới trước khi mạng nơ-ron ngày nay có thể tạo ra bước nhảy vọt như vậy. Tùy thuộc vào mức độ thành công của dòng nghiên cứu mới này, ta không thể nói liệu sẽ có lý trí thông thường của máy móc trong 5 năm hay 50 năm nữa không.

Vài nét về tác giả

Mayank Kejriwal là Trợ lý Giáo sư nghiên cứu Kỹ thuật Hệ thống & Công nghiệp, Đại học Southern California.

Người dịch: Lê Thị Hạnh

Nguồn: “An AI expert explains why it’s hard to give computers somethin you take for granted: common sense”, The Conversation, 17.8.2021.

----

Bài có liên quan: