CÓ PHẢI CHATGPT ĐANG HỦY HOẠI NÃO BỘ CON
NGƯỜI?
5 ĐIỂM CỦA BẢN
THẢO BÀI NGHIÊN CỨU CHƯA QUA BÌNH DUYỆT (PREPRINT) CỦA HỌC VIỆN CÔNG NGHỆ
MASSACHUSETTS (MIT) VỀ NHỮNG TÁC ĐỘNG CỦA TRÍ TUỆ NHÂN TẠO.
Lần
đầu tiên, một nghiên cứu khoa học đã thử
đo lường tác động của việc sử dụng
thường xuyên ChatGPT lên não bộ con người.
Những
kết quả - được MIT Media công bố trong một bản thảo bài nghiên cứu chưa qua
bình duyệt – dường như nêu ra một xu
hướng rõ ràng: làm việc dựa vào các mô hình ngôn ngữ của trí tuệ nhân tạo sẽ làm mất khả năng
kiểm soát nhận thức và sẽ thay đổi hành vi.
Đáng
lo ngại hơn: những người sử dụng sẽ tiếp thu một cách thụ động những thiên vị thuật
toán của những người thiết kế mô hình ngôn ngữ lớn LLM (Large Language Model).
Chúng tôi tổng hợp những thông tin của một nghiên cứu đáng để khởi động cuộc tranh luận về một biên giới địa chính trị mới – não bộ của chúng ta.
Hình ảnh: (xem Nguồn, © MIT Media Lab) |
NHỮNG ĐIỂM CHÍNH
- Nghiên cứu hoạt động não bộ của một mẫu nhỏ gồm
54 người đã tiến hành ba buổi rải ra trong vòng bốn tháng dường như cho thấy rằng
về phương diện tế bào thần kinh, ngôn ngữ và hành vi, những người sử dụng
ChatGPT đạt hiệu suất có vẻ thua kém một
cách có hệ thống so với những người không dùng chatbot cho những công việc giống nhau..
- 83,3% những người dùng ChatGPT được trắc nghiệm
trong nghiên cứu này có thể sẽ không có khả năng nêu ra những đoạn văn mà họ đã
viết ra vài phút trước.
- Trong cuộc thử nghiệm này, 55% của việc “tải
nhận thức” cần thiết để viết một tiểu luận mà không cần một sự trợ giúp nào có
thể sẽ giảm với việc sử dụng LLM và điều này làm cho não bị xuống cấp.
- Theo thời gian, viết với ChatGPT có thể sẽ làm
tích tụ một “món nợ nhận thức” làm cho việc trở lại với một hoạt động bình thường
của trí não trở nên khó khăn khi thực hiện những công việc mà không sử dụng
LLM.
- Preprint[1]
là
một bài báo chưa được bình duyệt. Do đó có thể có những sai lầm về phương pháp
luận và các kết luận có thể được sửa đổi một cách đáng kể: đặc biệt là bản chất
của những ghi chép đã được thực hiện có thể không cho phép thiết lập những suy
luận được trình bày trong nghiên cứu.
- Trong
một bản thảo preprint dài 206
trang do MIT Media Lab công bố, Nataliya Kosmyna và các đồng tác giả (bản thảo
đầy đủ có trong đường liên kết này)
lần đầu tiên trình bày một cách chính xác như vậy về những tác động của việc sử
dụng các mô hình ngôn ngữ lớn (LLM) như ChatGPT lên não bộ con người.
1. Một
nghiên cứu định tính: phương pháp luận của một mô hình thử nghiệm chưa từng có
Trong
thí nghiệm mà các tác giả ở MIT đã tiến hành trong nhiều tháng, các nhà nghiên
cứu đã khảo sát nỗ lực nhận thức được gây ra bởi ba phương thức soạn thảo một
tiểu luận tại kỳ thi tuyển vào đại học ở Mỹ (SAT-Scholastic Assessment Test) và
đã nghiên cứu hoạt động của nhận thức của ba nhóm khác nhau bằng cách xem xét
cùng những chỉ báo như nhau ở mỗi nhóm.
- Nhóm
thứ nhất đã viết mà không có bất kỳ sự trợ giúp nào (brain-only);
- Nhóm
thứ hai dùng một công cụ tìm kiếm thông dụng (Search Engine như Google
chẳng hạn);
- Nhóm
thứ ba dùng mô hình ngôn ngữ lớn ChatGPT (LLM).
54
người tình nguyện do MIT Media Lab tuyển chọn đã làm việc ba buổi rải ra trong
vòng bốn tháng. Mỗi buổi gồm có việc viết ra trong 20 phút một tiểu luận trả
lời một trong 9 chủ đề được cung cấp, và thực hiện ba chủ đề khác nhau cho mỗi
buổi.
Ba
buổi này đã giúp các nhà nghiên cứu rút ra những khác biệt trong hoạt động của
não bộ về phương diện hoạt động nhận thức, kiểu nỗ lực được huy động – bằng
cách so sánh những vùng nào của não bộ được huy động nhiều nhất – và những hệ
quả về hành vi do sử dụng một công cụ tìm kiếm hay một LLM gây ra – chẳng hạn
như khả năng nêu ra bài viết của mình, khả năng xem tiểu luận là của mình và
khả năng suy nghĩ một cách có phê phán.
Nhưng
cuộc thí nghiệm cũng đã tìm cách thấu hiểu, trong những điều kiện viết tiểu
luận như nhau, tác động có thể có với
việc sử dụng một mô hình ngôn ngữ lớn LLM trong thời hạn – chẳng hạn như
ChatGPT.
Nhằm
tạo ra những số đo so sánh, 18 trong số những người tình nguyện của MIT đã trở
lại trong một buổi thứ tư để thực hiện thí nghiệm chéo, với mục tiêu là phân
tích những thay đổi của hoạt động não bộ: của những người đã làm việc với LLM
với những người đã làm việc không có bất kỳ trợ giúp nào, và ngược lại.Trong
nghiên cứu, các nhóm này được chú thích là “LLM>Brain-only” và “Brain-only
>LLM (xem dưới đây, điểm 4).
Các điều kiện thử
nghiệm cho ba loại viết bài là như sau:
- Trong giả thuyết có sự trợ giúp của LLM, việc viết được thực hiện với việc chỉ sử dụng GPT-4o trong một cửa sổ dành cho việc này và không cho phép dùng bất kỳ một trang web internet nào khác ;
- Trong giả thuyết dùng một công cụ tìm kiếm thông dụng, được tự do truy cập Internet ngoại trừ các LLM ;
- Trong giả thuyết viết không có bất kỳ sự trợ giúp nào (brain-only) thì không có bất kỳ dụng cụ kỹ thuật số nào – nghĩa là không có màn hình – được phép.
- Trong khi những tình nguyện viên viết, sinh lý thần kinh nơ ron của họ đã được ghi nhận nhờ một loạt các điện cực và cảm biến gắn trưc tiếp lên da đầu của họ.
Để
làm phức tạp thêm thao tác và tái tạo các điều kiện trong môi trường trường
học, một giai đoạn cuối gồm có việc cho điểm các bài viết, một là bởi con người
và một là bởi một trí tuệ nhân tạo được thiết kế riêng thích hợp cho việc này.
Cuối cùng, vào
cuối cuộc thí nghiệm, các tình nguyện viên trả lời một bảng hỏi.
Được
thực hiện với một số hạn chế những người tham gia, thử nghiệm này chủ yếu là
định tính cho phép đưa ra những xu hướng có thể là những hướng nghiên cứu,
trong lúc chờ đợi những nghiên cứu định lượng được tiến hành với một số mẫu lớn
hơn.
2 — Những tác động về nhận thức của việc sử dụng
ChatGPT: các mô hình ngôn ngữ lớn LLM có làm hao mòn hoạt động trí não của
chúng ta không?
Các
kết quả của nghiên cứu có vẻ rõ ràng dứt khoát: “sự liên thông của não bộ” suy
giảm một cách có hệ thống tuỳ theo sự hỗ trợ bên ngoài.
Nhóm
làm việc chỉ dùng trí não của mình thể hiện các mạng lưới các tế bào thần kinh
vững chắc và trải rộng nhất ; nhóm sử dụng sự trợ giúp của công cụ tìm
kiếm cho thấy mức độ gắn kết trung bình ; và nhóm đã làm việc với sự trợ
giúp của của mô hình ngôn ngữ lớn (LLM) tạo ra mức độ kết nối tổng thể yếu
nhất.
Nói
các khác: sự trợ giúp từ bên ngoài càng lớn thì biên độ của các vùng hoạt động
trong não bộ (biên độ sóng não) càng thấp.
Biên
độ này được nghiên cứu từ một chỉ báo, đó là Dynamic Direct Transfer
Function (dDTF) - Hàm
truyền trực tiếp động.
Nhờ
các dữ liệu được các điện cực ghi lại, nhóm nghiên cứu dùng công cụ toán học
này để quan sát theo từng khoảnh khắc vùng nào của não bộ “điều khiển” trực
tiếp một vùng khác với một tần suất nhất định. Tần suất này cho phép các nhà
khoa học thần kinh theo dõi theo thời gian thực luồng thông tin trực tiếp giữa
các vùng của não bộ, từng tần suất một, và từ đó rút ra những chỉ dấu thích
đáng.
Về
mặt này, những số liệu của nghiên cứu thật nổi bật: nhóm đã làm việc không có
sự trợ giúp có mức độ hoạt động cao nhất ; nhóm đã làm việc với một công
cụ tìm kiếm có mức độ hoạt động thấp hơn từ 34 đến 48%.
Riêng nhóm làm
việc với ChatGPT chứng kiến tổng biên độ nhận thức bị suy giảm gần 55%.
Một sự quan sát rất chi tiết hoạt động này trên các vùng khác nhau của não bộ bộc lộ nhiều điểm đặc thù.
- Nhóm đã viết bài nhờ sự trợ giúp của một công cụ tìm kiếm thể hiện một hoạt động được gia tăng trên vỏ não thị giác chẩm, cho thấy hoạt động của não bộ tập trung vào việc tìm kiếm các thông tin thị giác và tổng hợp chúng trong giai đoạn tìm kiếm.
- Kết quả này có vẻ chứng thực việc những người tham gia đã sàng lọc và tuyển chọn một số thông tin nhằm viết tiểu luận của họ. Đó là một sự “tích hợp với yêu cầu khắt khe về mặt nhận thức các nguồn lực về thị giác, chú ý và điều hành” được huy động bởi các màn hình.
- Nếu những người sử dụng mô hình ngôn ngữ lớn (LLM) cũng thông qua một màn hình nhưng nhóm của họ không thể hiện “những mức độ tương đương với sự kích hoạt vỏ não về thị giác”. Nói cách khác: mục tiêu của việc họ tương tác với màn hình dường như khác biệt: việc sử dụng ChatGPT làm giảm nhu cầu của họ về tìm kiếm hình ảnh, kéo dài và sàng lọc về ngữ nghĩa. Sự “tải nhận thức” được chuyển sang sự tích hợp theo quy trình và điều phối vận động.
- Cuối cùng, về phần mình, nhóm chỉ dùng trí não của mình cho thấy những kích hoạt mạnh mẽ bên ngoài vỏ não thị giác, đặc biệt là “ở những vùng của não bộ được bao hàm trong tích hợp ngữ nghĩa, hình thành ý niệm sáng tạo và năng lực tự điều tiết chức năng điều hành”.
- Những kết quả này gợi ý rằng việc sử dụng mô hình ngôn ngữ lớn (LLM) có gia tăng hiệu năng của công việc, nhưng nhất là nó gây ra một tác động lên kiến trúc của nhận thức.
Như
nghiên cứu nêu ra: “Nhóm “chỉ dùng trí não” đã khai thác những mạng lưới thần
kinh nơ ron rộng lớn được phân bố để tạo
nội dung ngay từ bên trong ; nhóm dùng “công cụ tìm kiếm” đã dựa
vào những chiến lược lai tạo về quản lý thông tin thị giác và kiểm soát điều
chỉnh ; và nhóm “LLM” đã tối ưu hoá sự tích hợp theo quy trình những gợi ý
do trí tuệ nhân tạo tạo ra.”
3 — Những hệ quả về hành vi: mất khả năng hành
động do việc sử dụng LLM gây ra.
TẠI SAO NHỮNG NGƯỜI SỬ DỤNG CHATGPT KHÔNG NHỚ
NHỮNG GÌ HỌ ĐÃ VIẾT RA?
Những dữ liệu
được cho là “hành vi” - đặc biệt là những dữ liệu liên quan đến khả năng trích
dẫn, với sự chính xác của các trích dẫn và nắm rõ các tiểu luận – kéo dài và củng
cố cho các kết luận của nghiên cứu trong lĩnh vực liên thông của các tế bào
thần kinh nơ ron.
Những
kết quả này gợi ý rằng động thái chức năng của hệ thống được kích hoạt trong
khi viết tiểu luận sẽ định hình các quá
trình như trí nhớ, tính hiệu quả của tự kiểm soát và mức độ nắm vững nội dung
được viết ra.
Sự khác biệt về hành vi liên tục nhất và có ý nghĩa nhất giữa các nhóm đã được quan sát qua khả năng đọc thuộc tiểu luận của chính mình.
- Về lĩnh vực này, những người sử dụng LLM đạt những kết quả rõ ràng thấp hơn: 83% những người tham gia nói có khó khăn khi đọc tiểu luận của họ sau buổi đầu tiên – và không một ai cung cấp được dù chỉ một trích dẫn đúng chính bài viết của họ.
- Sự yếu kém này vẫn kéo dài, dù có phần ít hơn, trong những buổi tiếp theo: 6 trong số 18 người tham gia vẫn không dẫn ra đúng bài của họ trong buổi thứ ba.
Khó
khăn này tương ứng trực tiếp với sự sút giảm liên thông của não bộ trong nhóm
dùng LLM: thực vậy, nói chung những dao động này mạnh hơn khi các cá nhân tạo
ra và xây dựng kết cấu từ bên trong của nội dung thay vì tích hợp một cách thụ
động những thông tin được tạo ra từ bên ngoài.
Đặc biệt, nghiên cứu nêu bật thực trạng là sự giảm sút của hoạt động nhận thức ở những người sử dụng LLM ”có lẽ phản ánh một sự né tránh của các quá trình mã hoá sâu của trí nhớ, vì những người tham gia đọc, tuyển chọn và viết lại những gợi ý do công cụ tạo ra mà không tích hợp chúng vào các mạng lưới trí nhớ tình tiết”.
Những tình nguyện viên dùng một công cụ tìm kiếm như Google hoặc không dựa vào bất kỳ một công cụ kỹ thuật số nào không thể hiện những yếu kém như thế.
- Vào buổi thứ hai, cả hai nhóm đều đạt một khả năng trích dẫn hầu như hoàn hảo, và ở buổi thứ ba 100% các tình nguyện viên của cả hai nhóm đã tuyên bố là có khả năng đọc/nhớ được bài tiểu luận của họ, chỉ một vài khác biệt nhỏ về sự chính xác của các trích dẫn.
- Ngược lại, hoàn toàn không có những trích dẫn đúng trong nhóm dùng LLM trong buổi thứ nhất và những yếu kém kéo dài trong các buổi tiếp theo, điều này gợi ý rằng không những sự mã hoá ký ức là hời hợt, mà nhất là ngay chính nội dung ngữ nghĩa có lẽ đã không được hoàn toàn nhập vào nội tâm.
AI
LÀ TÁC GIẢ CÁC BÀI VIẾT VỚI TRÍ TUỆ NHÂN TẠO? NGHIÊN CỨU MỘT SỰ PHÂN LY?
Một
sự khác biệt lớn về hành vi nổi lên từ nghiên cứu là nhận thức của các tình
nguyện viên về tác giả của tiểu luận của họ.
Trong
khi nhóm làm việc không có sự trợ giúp đồng lòng khẳng định họ sở hữu hoàn toàn
các văn bản của họ (16/18 ở buổi đầu tiên và 17/18 ở buổi thứ ba), nhóm viết
với sự trợ giúp của ChatGPT thể hiện một cảm giác không rõ ràng về vấn đề này.
·
Do
đó, một số tình nguyện viên tự nhận là tác giả của những bài viết của họ, một
số khác thẳng thắn phủ nhận, và rất nhiều tình nguyện viên chỉ nhận một phần là
công sức của họ (từ 50 đến 90%).
·
Việc
đồng sáng tạo của người và trí tuệ nhân tạo đã được đúc kết thành lý thuyết
trong các trang viết của chúng tôi qua mô hình Jianwei
Xun, mô hình này đề
xuất thông qua khái niệm chế độ thôi miên, một hệ thống viết văn bản tiếp
nhận hoàn toàn và xây dựng từ sự đóng góp của các mô hình ngôn ngữ lớn trong
quá trình thiết lập mối quan hệ giữa tác phẩm và tác giả.
Tóm
lại, nghiên cứu kết luận rằng ”những câu trả lời này ngụ ý một sự sút giảm
ý thức về khả năng hành động của nhận thức”.
Theo
các tác giả, điều này nêu bật một vấn đề: các công cụ của trí tuệ nhân tạo, mặc
dù là quý báu để hỗ trợ hiệu suất công việc, lại có thể vô tình cản trở liệu
pháp nhận thức chuyên sâu, sự ghi nhớ và sự gắn kết đích thực với chất liệu
được viết ra.
Sự
quan sát thực nghiệm này dường như cung cấp bằng chứng rằng nếu những người sử
dụng dựa quá nhiều vào các công cụ của trí tuệ nhân tạo, họ có thể nghĩ rằng đã
nắm được một cách một cách hời hợt những kiến thức nhưng không biến chúng thành
của mình và làm chủ chúng.
4 — Trí tuệ nhân tạo mang tính huỷ hoại: quan
sát những thiệt hại do các mô hình ngôn
ngữ lớn (LLM) gây ra cho não bộ.
Một
trong những điều lý thú của nghiên cứu này là đã đề nghị một số tình nguyện
viên thực hiện một buổi viết thứ tư.
Trong buổi này,
các nhóm đã chuyển đổi những thực hành của họ để tìm những sự khác biệt của
hoạt động nhận thức bằng cách chuyển từ việc sử dụng lặp đi lặp lại nhiều lần mô
hình ngôn ngữ lớn LLM qua tình trạng hoàn toàn không dùng LLM – và ngược lại.
Kết
quả rất ấn tượng: những tình nguyện viên chuyển từ dùng ChatGPT qua chỉ dùng
trí não của họ gặp nhiều khó khăn trong việc tái tạo một mạng lưới liên kết và
một hoạt động trí não cũng phong phú như thế ; những người được dùng trí
tuệ nhân tạo sau ba tiểu luận tự do (không dùng trí tuệ nhân tạo) đã cho thấy
một đỉnh điểm hoạt động chưa từng có, là dấu hiệu họ dùng công cụ như là một
yếu tố nhân thêm chứ không phải thay thế - họ cũng viết những câu lệnh (cho trí
tuệ nhân tạo) chính xác hơn và đa dạng hơn.
Những
người trước đây viết không có công cụ trợ giúp và khi đã có quyền sử dụng trí
tuệ nhân tạo (nhóm “Brain-only > LLM”),
cho thấy một sự gia tăng đáng kể của liên thông não bộ tổng hợp, gợi ý rằng sự
huy động được trí tuệ nhân tạo hỗ trợ tạo ra những mức độ cao về tích hợp nhận
thức, tái kích hoạt trí nhớ và kiểm soát đi xuống[2]
.
Ngược
lại, đối với nhóm đã viết bài với trí tuệ nhân tạo từ những buổi đầu và khi không
được dùng trí tuệ nhân tạo trong buổi thứ tư, thì việc dùng LLM lặp đi lặp lại
nhiều lần đã phản ánh một sự sút giảm rõ rệt tính liên kết qua thời gian.
Theo
các tác giả: ”các kết quả này làm nổi bật sự tương tác động giữa hỗ trợ
nhận thức và gắn kết tế bào thần kinh nơ ron trong các bối cảnh học tập với sự
trợ giúp của trí tuệ nhân tạo.
5 — Khởi
nguồn (Inception): dấu ấn của thuật toán chống lại dấu ấn của
trí nhớ
Một
kết quả khác đáng lo ngại hơn của buổi thứ tư là các tình nguyện viên của nhóm “LLM>Brain-only”
đã nhiều lần tập trung vào một tập hợp những ý tưởng hạn chế hơn.
Theo
các tác giả, sự lặp đi lặp lại này có thể gợi ý rằng có thể nhiều người tham
gia không đi sâu vào chủ đề hoặc đã không xem xét một cách kỹ lưỡng chất liệu
do LLM cung cấp.
Sơ
đồ này phản ánh sự tích tụ một món nợ
nhận thức: lặp đi lặp lại việc dùng đến các hệ thống bên ngoài chẳng hạn
như mô hình ngôn ngữ lớn LLM có thể thay thế các quá trình nhận thức có yêu cầu
cao vốn cần thiết cho tư duy độc lập bằng các quá trình tích hợp thuần tuý.
Do
đó nợ nhận thức có thể trì hoãn nỗ lực trí tuệ trong ngắn hạn nhưng sẽ kéo theo các tổn thất trong
dài hạn như suy giảm tinh thần phê phán, gia tăng tính dễ bị tổn thương đối với
sự thao túng và suy giảm tính sáng tạo.
Về
vấn đề này, nghiên cứu kết luận rằng “khi những người tham gia tái tạo những
gợi ý mà không đánh gia tính chính xác hoặc tính thích đáng của những gợi ý này,
họ từ bỏ không những sự sở hữu các ý tưởng, mà còn có thể có nguy cơ biến thành
của mình những quan điểm hời hợt hoặc sai lệch.”
Phân
tích những kết quả khác nhau này chỉ ra rằng một sự lệ thuộc sớm vào trí tuệ
nhân tạo có thể dẫn đến một sự mã hoá ký ức hời hợt hơn.
Những
yếu kém quan trọng của nhóm dùng LLM – đặc biệt là về phương diện trí nhớ – do
đó có thể là dấu hiệu của một sự tích hợp nội bộ yếu kém từ những bài tiểu luận
đầu tiên – có thể quy cho xử lý nhận thức từ bên ngoài hướng đến LLM.
Ngược
lại, chỉ riêng việc không dùng LLM trong các giai đoạn đầu có thể có tiềm năng
tạo thuận lợi cho sự xuất hiện của trí nhớ.
Đối
với những người viết không dùng bất kỳ sự trợ giúp kỹ thuật số nào, những cố
gắng không có trợ giúp từ đầu do đó đã tạo thuận lợi cho sự hình thành các dấu
vết ký ức bền vững, cho phép một sự tái kích hoạt hiệu quả hơn – ngay cả khi
các công cụ LLM được đưa vào sử dụng về sau.
Người dịch: Thái Thị Ngọc Dư
Nguồn: « ChatGPT est-il en train de casser le cerveau
humain? 5 points sur le preprint du MIT sur les effets de l’IA », Le
grand continent, 19.6.2025.
Chú thích:
[1]
Preprint là một bài báo nghiên cứu chưa
qua sự đánh giá của bình duyệt. Như vậy, có thể có những sai lầm về phương pháp
luận và các kết luận vẫn còn có thể sửa đổi (ND).
[2] Theo Google: Trong thần kinh học, “kiểm soát đi xuống” (descending control) đề cập đến khả năng của não bộ điều khiển các hoạt động của cơ thể, từ các chuyển động đơn giản đến các chức năng phức tạp hơn như suy nghĩ và cảm xúc. Hệ thần kinh trung ương, bao gồm não và tủy sống, đóng vai trò trung tâm trong việc kiểm soát này, truyền tín hiệu xuống hệ thần kinh ngoại biên để điều phối các hoạt động (ND).
