27.7.25

Có phải ChatGPT đang huỷ hoại não bộ con người?

CÓ PHẢI CHATGPT ĐANG HỦY HOẠI NÃO BỘ CON NGƯỜI?

5 ĐIỂM CỦA BẢN THẢO BÀI NGHIÊN CỨU CHƯA QUA BÌNH DUYỆT (PREPRINT) CỦA HỌC VIỆN CÔNG NGHỆ MASSACHUSETTS (MIT) VỀ NHỮNG TÁC ĐỘNG CỦA TRÍ TUỆ NHÂN TẠO.

Lần đầu tiên, một nghiên cứu khoa học đã  thử  đo lường tác động của việc sử dụng thường xuyên ChatGPT lên não bộ con người.

Những kết quả - được MIT Media công bố trong một bản thảo bài nghiên cứu chưa qua bình duyệt – dường như nêu  ra một xu hướng rõ ràng: làm việc dựa vào các mô hình ngôn ngữ của trí tuệ nhân tạo sẽ làm mất khả năng kiểm soát nhận thức và sẽ thay đổi hành vi.

Đáng lo ngại hơn: những người sử dụng sẽ tiếp thu một cách thụ động những thiên vị thuật toán của những người thiết kế mô hình ngôn ngữ lớn LLM (Large Language Model).

Chúng tôi tổng hợp những thông tin của một nghiên cứu đáng để khởi động cuộc tranh luận về  một biên giới địa chính trị mới – não bộ của chúng ta.

A group of posters with different colored lines

AI-generated content may be incorrect.
Hình ảnh: (xem Nguồn, © MIT Media Lab)

NHỮNG ĐIỂM CHÍNH

  • Nghiên cứu hoạt động não bộ của một mẫu nhỏ gồm 54 người đã tiến hành ba buổi rải ra trong vòng bốn tháng dường như cho thấy rằng về phương diện tế bào thần kinh, ngôn ngữ và hành vi, những người sử dụng ChatGPT đạt hiệu suất  có vẻ thua kém một cách có hệ thống so với những người không dùng chatbot cho những công việc giống nhau..  
  • 83,3% những người dùng ChatGPT được trắc nghiệm trong nghiên cứu này có thể sẽ không có khả năng nêu ra những đoạn văn mà họ đã viết ra vài phút trước.
  • Trong cuộc thử nghiệm này, 55% của việc “tải nhận thức” cần thiết để viết một tiểu luận mà không cần một sự trợ giúp nào có thể sẽ giảm với việc sử dụng LLM và điều này làm cho não bị xuống cấp.
  • Theo thời gian, viết với ChatGPT có thể sẽ làm tích tụ một “món nợ nhận thức” làm cho việc trở lại với một hoạt động bình thường của trí não trở nên khó khăn khi thực hiện những công việc mà không sử dụng LLM.
  • Preprint[1] là một bài báo chưa được bình duyệt. Do đó có thể có những sai lầm về phương pháp luận và các kết luận có thể được sửa đổi một cách đáng kể: đặc biệt là bản chất của những ghi chép đã được thực hiện có thể không cho phép thiết lập những suy luận được trình bày trong nghiên cứu.
  • Trong một bản thảo preprint dài 206 trang do MIT Media Lab công bố, Nataliya Kosmyna và các đồng tác giả (bản thảo đầy đủ có trong đường liên kết này) lần đầu tiên trình bày một cách chính xác như vậy về những tác động của việc sử dụng các mô hình ngôn ngữ lớn (LLM) như ChatGPT lên não bộ con người.

1.    Một nghiên cứu định tính: phương pháp luận của một mô hình thử nghiệm chưa từng có

Trong thí nghiệm mà các tác giả ở MIT đã tiến hành trong nhiều tháng, các nhà nghiên cứu đã khảo sát nỗ lực nhận thức được gây ra bởi ba phương thức soạn thảo một tiểu luận tại kỳ thi tuyển vào đại học ở Mỹ (SAT-Scholastic Assessment Test) và đã nghiên cứu hoạt động của nhận thức của ba nhóm khác nhau bằng cách xem xét cùng những chỉ báo như nhau ở mỗi nhóm.

  • Nhóm thứ nhất đã viết mà không có bất kỳ sự trợ giúp nào (brain-only);
  • Nhóm thứ hai dùng một công cụ tìm kiếm thông dụng (Search Engine như Google chẳng hạn);
  • Nhóm thứ ba dùng mô hình ngôn ngữ lớn ChatGPT (LLM).

54 người tình nguyện do MIT Media Lab tuyển chọn đã làm việc ba buổi rải ra trong vòng bốn tháng. Mỗi buổi gồm có việc viết ra trong 20 phút một tiểu luận trả lời một trong 9 chủ đề được cung cấp, và thực hiện ba chủ đề khác nhau cho mỗi buổi.

Ba buổi này đã giúp các nhà nghiên cứu rút ra những khác biệt trong hoạt động của não bộ về phương diện hoạt động nhận thức, kiểu nỗ lực được huy động – bằng cách so sánh những vùng nào của não bộ được huy động nhiều nhất – và những hệ quả về hành vi do sử dụng một công cụ tìm kiếm hay một LLM gây ra – chẳng hạn như khả năng nêu ra bài viết của mình, khả năng xem tiểu luận là của mình và khả năng suy nghĩ một cách có phê phán.
Nhưng cuộc thí nghiệm cũng đã tìm cách thấu hiểu, trong những điều kiện viết tiểu luận như nhau, tác động có thể có với việc sử dụng một mô hình ngôn ngữ lớn LLM trong thời hạn – chẳng hạn như ChatGPT.
Nhằm tạo ra những số đo so sánh, 18 trong số những người tình nguyện của MIT đã trở lại trong một buổi thứ tư để thực hiện thí nghiệm chéo, với mục tiêu là phân tích những thay đổi của hoạt động não bộ: của những người đã làm việc với LLM với những người đã làm việc không có bất kỳ trợ giúp nào, và ngược lại.Trong nghiên cứu, các nhóm này được chú thích là “LLM>Brain-only” và “Brain-only >LLM (xem dưới đây, điểm 4).

Các điều kiện thử nghiệm cho ba loại viết bài là như sau:

  • Trong giả thuyết có sự trợ giúp của LLM, việc viết được thực hiện với việc chỉ sử dụng GPT-4o trong một cửa sổ dành cho việc này và không cho phép dùng bất kỳ một trang web internet nào khác ;
  • Trong giả thuyết dùng một công cụ tìm kiếm thông dụng, được tự do truy cập Internet ngoại trừ các  LLM ;
  • Trong giả thuyết viết không có bất kỳ sự trợ giúp nào (brain-only) thì không có bất kỳ dụng cụ kỹ thuật số nào – nghĩa là không có màn hình – được phép.
  • Trong khi những tình nguyện viên viết, sinh lý thần kinh nơ ron của họ đã được ghi nhận nhờ một loạt các điện cực và cảm biến gắn trưc tiếp lên da đầu của họ.

Để làm phức tạp thêm thao tác và tái tạo các điều kiện trong môi trường trường học, một giai đoạn cuối gồm có việc cho điểm các bài viết, một là bởi con người và một là bởi một trí tuệ nhân tạo được thiết kế riêng thích hợp cho việc này.

Cuối cùng, vào cuối cuộc thí nghiệm, các tình nguyện viên trả lời một bảng hỏi.

Được thực hiện với một số hạn chế những người tham gia, thử nghiệm này chủ yếu là định tính cho phép đưa ra những xu hướng có thể là những hướng nghiên cứu, trong lúc chờ đợi những nghiên cứu định lượng được tiến hành với một số mẫu lớn hơn.

2 — Những tác động về nhận thức của việc sử dụng ChatGPT: các mô hình ngôn ngữ lớn LLM có làm hao mòn hoạt động trí não của chúng ta không?

Các kết quả của nghiên cứu có vẻ rõ ràng dứt khoát: “sự liên thông của não bộ” suy giảm một cách có hệ thống tuỳ theo sự hỗ trợ bên ngoài.

Nhóm làm việc chỉ dùng trí não của mình thể hiện các mạng lưới các tế bào thần kinh vững chắc và trải rộng nhất  ; nhóm sử dụng sự trợ giúp của công cụ tìm kiếm cho thấy mức độ gắn kết trung bình ; và nhóm đã làm việc với sự trợ giúp của của mô hình ngôn ngữ lớn (LLM) tạo ra mức độ kết nối tổng thể yếu nhất.

Nói các khác: sự trợ giúp từ bên ngoài càng lớn thì biên độ của các vùng hoạt động trong não bộ (biên độ sóng não) càng thấp.

Biên độ này được nghiên cứu từ một chỉ báo, đó là Dynamic Direct Transfer Function (dDTF) - Hàm truyền trực tiếp động.

Nhờ các dữ liệu được các điện cực ghi lại, nhóm nghiên cứu dùng công cụ toán học này để quan sát theo từng khoảnh khắc vùng nào của não bộ “điều khiển” trực tiếp một vùng khác với một tần suất nhất định. Tần suất này cho phép các nhà khoa học thần kinh theo dõi theo thời gian thực luồng thông tin trực tiếp giữa các vùng của não bộ, từng tần suất một, và từ đó rút ra những chỉ dấu thích đáng.

Về mặt này, những số liệu của nghiên cứu thật nổi bật: nhóm đã làm việc không có sự trợ giúp có mức độ hoạt động cao nhất ; nhóm đã làm việc với một công cụ tìm kiếm có mức độ hoạt động thấp hơn từ 34 đến 48%.

Riêng nhóm làm việc với ChatGPT chứng kiến tổng biên độ nhận thức bị suy giảm gần 55%.

Một sự quan sát rất chi tiết hoạt động này trên các vùng khác nhau của não bộ bộc lộ nhiều điểm đặc thù. 

  • Nhóm đã viết bài nhờ sự trợ giúp của một công cụ tìm kiếm thể hiện một hoạt động được gia tăng trên vỏ não thị giác chẩm, cho thấy hoạt động của não bộ tập trung vào việc tìm kiếm các thông tin thị giác và tổng hợp chúng trong giai đoạn tìm kiếm.
  • Kết quả này có vẻ chứng thực việc những người tham gia đã sàng lọc và tuyển chọn một số thông tin nhằm viết tiểu luận của họ. Đó là một sự “tích hợp với yêu cầu khắt khe về mặt nhận thức các nguồn lực về thị giác, chú ý và điều hành” được huy động bởi các màn hình.
  • Nếu những người sử dụng mô hình ngôn ngữ lớn (LLM) cũng thông qua một màn hình nhưng nhóm của họ không thể hiện “những mức độ tương đương với sự kích hoạt vỏ não về thị giác”. Nói cách khác: mục tiêu của việc họ tương tác với màn hình dường như khác biệt: việc sử dụng ChatGPT làm giảm nhu cầu của họ về tìm kiếm hình ảnh, kéo dài và sàng lọc về  ngữ nghĩa. Sự “tải nhận thức” được chuyển sang sự tích hợp theo quy trình và điều phối  vận động.
  • Cuối cùng, về phần mình, nhóm chỉ dùng trí não của mình cho thấy những kích hoạt mạnh mẽ bên ngoài vỏ não thị giác, đặc biệt là “ở những vùng của não bộ được bao hàm trong tích hợp ngữ nghĩa, hình thành ý niệm sáng tạo và năng lực tự điều tiết chức năng điều hành”.
  • Những kết quả này gợi ý rằng việc sử dụng mô hình ngôn ngữ lớn (LLM)  có gia tăng hiệu năng của công việc, nhưng nhất là nó gây ra một tác động lên kiến trúc của nhận thức.

Như nghiên cứu nêu ra: “Nhóm “chỉ dùng trí não” đã khai thác những mạng lưới thần kinh nơ ron rộng lớn được phân bố để tạo  nội dung ngay từ bên trong ; nhóm dùng “công cụ tìm kiếm” đã dựa vào những chiến lược lai tạo về quản lý thông tin thị giác và kiểm soát điều chỉnh ; và nhóm “LLM” đã tối ưu hoá sự tích hợp theo quy trình những gợi ý do trí tuệ nhân tạo tạo ra.”

3 — Những hệ quả về hành vi: mất khả năng hành động do việc sử dụng LLM gây ra.

TẠI SAO NHỮNG NGƯỜI SỬ DỤNG CHATGPT KHÔNG NHỚ NHỮNG GÌ HỌ ĐÃ VIẾT RA?

Những dữ liệu được cho là “hành vi” - đặc biệt là những dữ liệu liên quan đến khả năng trích dẫn, với sự chính xác của các trích dẫn và nắm rõ các tiểu luận – kéo dài và củng cố cho các kết luận của nghiên cứu trong lĩnh vực liên thông của các tế bào thần kinh nơ ron.

Những kết quả này gợi ý rằng động thái chức năng của hệ thống được kích hoạt trong khi viết tiểu luận sẽ  định hình các quá trình như trí nhớ, tính hiệu quả của tự kiểm soát và mức độ nắm vững nội dung được viết ra.

Sự khác biệt về hành vi liên tục nhất và có ý nghĩa nhất giữa các nhóm đã được quan sát qua khả năng đọc thuộc tiểu luận của chính mình.

  • Về lĩnh vực này, những người sử dụng LLM đạt những kết quả rõ ràng thấp hơn: 83% những người tham gia nói có khó khăn khi đọc tiểu luận của họ sau buổi đầu tiên – và không một ai cung cấp được dù chỉ một trích dẫn đúng chính bài viết của họ.
  • Sự yếu kém này vẫn kéo dài, dù có phần ít hơn, trong những buổi tiếp theo: 6 trong số 18 người tham gia vẫn không dẫn ra đúng bài của họ trong buổi thứ ba.

Khó khăn này tương ứng trực tiếp với sự sút giảm liên thông của não bộ trong nhóm dùng LLM: thực vậy, nói chung những dao động này mạnh hơn khi các cá nhân tạo ra và xây dựng kết cấu từ bên trong của nội dung thay vì tích hợp một cách thụ động những thông tin được tạo ra từ bên ngoài.

Đặc biệt, nghiên cứu nêu bật thực trạng là sự giảm sút của hoạt động nhận thức ở những người sử dụng LLM ”có lẽ phản ánh một sự né tránh của các quá trình mã hoá sâu của trí nhớ, vì những người tham gia đọc, tuyển chọn và viết lại những gợi ý do công cụ tạo ra mà không tích hợp chúng vào các mạng lưới trí nhớ tình tiết”.

Những tình nguyện viên dùng một công cụ tìm kiếm như Google hoặc không dựa vào bất kỳ một công cụ kỹ thuật số nào không thể hiện những yếu kém như thế.

  • Vào buổi thứ hai, cả hai nhóm đều đạt một khả năng trích dẫn hầu như hoàn hảo, và ở buổi thứ ba  100% các tình nguyện viên của cả hai nhóm đã tuyên bố là có khả năng đọc/nhớ được bài tiểu luận của họ, chỉ một vài khác biệt nhỏ về sự chính xác của các trích dẫn.
  • Ngược lại, hoàn toàn không có những trích dẫn đúng trong nhóm dùng LLM trong buổi thứ nhất và những yếu kém kéo dài trong các buổi tiếp theo, điều này gợi ý rằng không những sự mã hoá ký ức là hời hợt, mà nhất là ngay chính nội dung ngữ nghĩa có lẽ đã không được hoàn toàn nhập vào nội tâm.

AI LÀ TÁC GIẢ CÁC BÀI VIẾT VỚI TRÍ TUỆ NHÂN TẠO? NGHIÊN CỨU MỘT SỰ PHÂN LY?

Một sự khác biệt lớn về hành vi nổi lên từ nghiên cứu là nhận thức của các tình nguyện viên về tác giả của tiểu luận của họ.

Trong khi nhóm làm việc không có sự trợ giúp đồng lòng khẳng định họ sở hữu hoàn toàn các văn bản của họ (16/18 ở buổi đầu tiên và 17/18 ở buổi thứ ba), nhóm viết với sự trợ giúp của ChatGPT thể hiện một cảm giác không rõ ràng về vấn đề này.

·       Do đó, một số tình nguyện viên tự nhận là tác giả của những bài viết của họ, một số khác thẳng thắn phủ nhận, và rất nhiều tình nguyện viên chỉ nhận một phần là công sức của họ (từ 50 đến 90%). 

·       Việc đồng sáng tạo của người và trí tuệ nhân tạo đã được đúc kết thành lý thuyết trong các trang viết của chúng tôi qua mô hình Jianwei Xun, mô hình này đề xuất thông qua khái niệm chế độ thôi miên, một hệ thống viết văn bản tiếp nhận hoàn toàn và xây dựng từ sự đóng góp của các mô hình ngôn ngữ lớn trong quá trình thiết lập mối quan hệ giữa tác phẩm và tác giả.

Tóm lại, nghiên cứu kết luận rằng ”những câu trả lời này ngụ ý một sự sút giảm ý thức về khả năng hành động của nhận thức”. 

Theo các tác giả, điều này nêu bật một vấn đề: các công cụ của trí tuệ nhân tạo, mặc dù là quý báu để hỗ trợ hiệu suất công việc, lại có thể vô tình cản trở liệu pháp nhận thức chuyên sâu, sự ghi nhớ và sự gắn kết đích thực với chất liệu được viết ra.

Sự quan sát thực nghiệm này dường như cung cấp bằng chứng rằng nếu những người sử dụng dựa quá nhiều vào các công cụ của trí tuệ nhân tạo, họ có thể nghĩ rằng đã nắm được một cách một cách hời hợt những kiến thức nhưng không biến chúng thành của mình và làm chủ chúng.

4 — Trí tuệ nhân tạo mang tính huỷ hoại: quan sát những  thiệt hại do các mô hình ngôn ngữ lớn (LLM) gây ra cho não bộ.

Một trong những điều lý thú của nghiên cứu này là đã đề nghị một số tình nguyện viên thực hiện một buổi viết thứ tư.

Trong buổi này, các nhóm đã chuyển đổi những thực hành của họ để tìm những sự khác biệt của hoạt động nhận thức bằng cách chuyển từ việc sử dụng lặp đi lặp lại nhiều lần mô hình ngôn ngữ lớn LLM qua tình trạng hoàn toàn không dùng LLM – và ngược lại.

Kết quả rất ấn tượng: những tình nguyện viên chuyển từ dùng ChatGPT qua chỉ dùng trí não của họ gặp nhiều khó khăn trong việc tái tạo một mạng lưới liên kết và một hoạt động trí não cũng phong phú như thế ; những người được dùng trí tuệ nhân tạo sau ba tiểu luận tự do (không dùng trí tuệ nhân tạo) đã cho thấy một đỉnh điểm hoạt động chưa từng có, là dấu hiệu họ dùng công cụ như là một yếu tố nhân thêm chứ không phải thay thế - họ cũng viết những câu lệnh (cho trí tuệ nhân tạo) chính xác hơn và đa dạng hơn.

Những người trước đây viết không có công cụ trợ giúp và khi đã có quyền sử dụng trí tuệ nhân tạo (nhóm  “Brain-only > LLM”), cho thấy một sự gia tăng đáng kể của liên thông não bộ tổng hợp, gợi ý rằng sự huy động được trí tuệ nhân tạo hỗ trợ tạo ra những mức độ cao về tích hợp nhận thức, tái kích hoạt trí nhớ và kiểm soát đi xuống[2] .

Ngược lại, đối với nhóm đã viết bài với trí tuệ nhân tạo từ những buổi đầu và khi không được dùng trí tuệ nhân tạo trong buổi thứ tư, thì việc dùng LLM lặp đi lặp lại nhiều lần đã phản ánh một sự sút giảm rõ rệt tính liên kết qua thời gian.

Theo các tác giả: ”các kết quả này làm nổi bật sự tương tác động giữa hỗ trợ nhận thức và gắn kết tế bào thần kinh nơ ron trong các bối cảnh học tập với sự trợ giúp của trí tuệ nhân tạo.

5 — Khởi nguồn (Inception): dấu ấn của thuật toán chống lại dấu ấn của trí nhớ

Một kết quả khác đáng lo ngại hơn của buổi thứ tư là các tình nguyện viên của nhóm “LLM>Brain-only” đã nhiều lần tập trung vào một tập hợp những ý tưởng hạn chế hơn.

Theo các tác giả, sự lặp đi lặp lại này có thể gợi ý rằng có thể nhiều người tham gia không đi sâu vào chủ đề hoặc đã không xem xét một cách kỹ lưỡng chất liệu do LLM cung cấp.

Sơ đồ này phản ánh sự tích tụ một món nợ nhận thức: lặp đi lặp lại việc dùng đến các hệ thống bên ngoài chẳng hạn như mô hình ngôn ngữ lớn LLM có thể thay thế các quá trình nhận thức có yêu cầu cao vốn cần thiết cho tư duy độc lập bằng các quá trình tích hợp thuần tuý.

Do đó nợ nhận thức có thể trì hoãn nỗ lực trí tuệ  trong ngắn hạn nhưng sẽ kéo theo các tổn thất trong dài hạn như suy giảm tinh thần phê phán, gia tăng tính dễ bị tổn thương đối với sự thao túng và suy giảm tính sáng tạo.

Về vấn đề này, nghiên cứu kết luận rằng “khi những người tham gia tái tạo những gợi ý mà không đánh gia tính chính xác hoặc tính thích đáng của những gợi ý này, họ từ bỏ không những sự sở hữu các ý tưởng, mà còn có thể có nguy cơ biến thành của mình những quan điểm hời hợt hoặc sai lệch.”

Phân tích những kết quả khác nhau này chỉ ra rằng một sự lệ thuộc sớm vào trí tuệ nhân tạo có thể dẫn đến một sự mã hoá ký ức hời hợt hơn.

Những yếu kém quan trọng của nhóm dùng LLM – đặc biệt là về phương diện trí nhớ – do đó có thể là dấu hiệu của một sự tích hợp nội bộ yếu kém từ những bài tiểu luận đầu tiên – có thể quy cho xử lý nhận thức từ bên ngoài hướng đến LLM.

Ngược lại, chỉ riêng việc không dùng LLM trong các giai đoạn đầu có thể có tiềm năng tạo thuận lợi cho sự xuất hiện của trí nhớ.

Đối với những người viết không dùng bất kỳ sự trợ giúp kỹ thuật số nào, những cố gắng không có trợ giúp từ đầu do đó đã tạo thuận lợi cho sự hình thành các dấu vết ký ức bền vững, cho phép một sự tái kích hoạt hiệu quả hơn – ngay cả khi các công cụ LLM được đưa vào sử dụng về sau.

Người dịch: Thái Thị Ngọc Dư

Nguồn: « ChatGPT est-il en train de casser le cerveau humain? 5 points sur le preprint du MIT sur les effets de l’IA », Le grand continent, 19.6.2025.

Chú thích:

[1] Preprint là một bài báo nghiên cứu chưa qua sự đánh giá của bình duyệt. Như vậy, có thể có những sai lầm về phương pháp luận và các kết luận vẫn còn có thể sửa đổi (ND).

[2] Theo Google: Trong thần kinh học, “kiểm soát đi xuống” (descending control) đề cập đến khả năng của não bộ điều khiển các hoạt động của cơ thể, từ các chuyển động đơn giản đến các chức năng phức tạp hơn như suy nghĩ và cảm xúc. Hệ thần kinh trung ương, bao gồm não và tủy sống, đóng vai trò trung tâm trong việc kiểm soát này, truyền tín hiệu xuống hệ thần kinh ngoại biên để điều phối các hoạt động (ND).

Print Friendly and PDF