KHOA HỌC THẦN KINH, TÂM LÝ HỌC VÀ KINH TẾ HỌC: CHỨNG CỨ VỀ HỆ THỐNG 3
Trong bài viết trước, tôi đã phác thảo quan niệm về Hệ thống 3, nó là gì và tại sao nó lại quan trọng. Nhìn ngắn gọn, Hệ thống 3 là năng lực tâm lý để tưởng tượng về tương lai và đánh giá việc bạn sẽ hạnh phúc như thế nào trong đó – dựa trên việc bản thân quá trình tưởng tượng đem lại cho bạn mức độ hài lòng ra sao.
Rất nhiều nghiên cứu khác nhau đã kết hợp với nhau để cho ra kết quả về việc nhìn nhận Hệ thống 3 như một quá trình tâm lý riêng biệt. Tôi tóm tắt các bước chính như sau:
Ivan Pavlov (1849-1936) Khối cấu trúc nền tảng của Hệ thống 3 là mối quan hệ kích thích – phản hồi. Từ lâu, chúng ta đã biết rằng con người dễ dàng học được các mối quan hệ kích thích – phản hồi khi họ được tưởng thưởng cho sự phản hồi. Các ví dụ kinh điển đến từ Pavlov (người thưởng đồ ăn cho những con chó và phát hiện ra rằng chúng sẽ bắt đầu trở nên phấn khích khi nhìn thấy chiếc áo choàng trắng của người làm thí nghiệm – như bất kỳ người chủ vật nuôi nào cũng sẽ nhận ra), và Skinner (người đã huấn luyện chim bồ câu biết mổ vào một cái công tắc, hành vi này nằm trong mối liên hệ với việc được cho ăn). Mặc dù những thí nghiệm ban đầu này được thực hiện trên động vật, có rất nhiều chứng cứ cho thấy nguyên lý tương tự áp dụng được cho con người. Một ví dụ điển hình sẽ là việc ta nhìn thấy cái vỏ bao bì của một thanh sô-cô-la và háo hức dự đoán hương vị của sô-cô-la bên trong. (Kích thích – phản hồi không chỉ là nền tảng cho Hệ thống 1 – mà còn cho Hệ thống 3, chúng phát triển từ cùng những nguồn gốc).- Bước tiếp theo là ý tưởng về các biểu tượng kế thừa |successor representation|. Các
nhà khoa học thần kinh (ví dụ như Stachenfeld và cộng sự, 2017) đã chỉ ra
rằng chúng ta lưu trữ trong não bộ của mình tiến trình hoàn chỉnh gồm các
bước cần thiết để đạt được mục tiêu. Mỗi bước này có thể lần lượt
được xem xét như một mối quan hệ kích thích – phản hồi riêng lẻ. Nói
cách khác, một chuỗi những mối quan hệ kích thích – phản hồi có thể được
liên hệ với nhau, trong đó sự phản hồi của bước này trở thành kích thích
cho bước tiếp theo.
Peter Dayan (1965-) - Schultz, Dayan và Montague (1997) đã chỉ ra rằng sự phản hồi tạo động lực có thể di chuyển dọc theo chuỗi này khi nó trở nên quen thuộc hơn. Hãy tưởng tượng chuỗi A-> B-> C thể hiện quá trình mà trong đó một kích thích A dự báo sự phản hồi B, và tiếp đó B lại dự báo sự phản hồi C. C là ‘phần thưởng’ trên thực tế. Chẳng hạn, A có thể là logo của nhà sản xuất sô-cô-la; B là vỏ bao bì của một thanh sô-cô-la; và C là thanh sô-cô-la thật. Khi bạn thấy nhiều bao bì sô-cô-la hơn và bóc nó ra để khám phá thanh sô-cô-la, chính cái vỏ bao bì sẽ bắt đầu trở thành động lực thúc đẩy bạn trước khi bạn thậm chí có cơ hội chạm vào thanh sô-cô-la. Lần lượt sau đó, hình logo có thể trở thành động lực thúc đẩy.
- Có thể kiểm soát cách động lực thay đổi theo phần thưởng bằng mô hình Rescorla-Wagner (Rescorla và Wagner, 1972): trải qua một sự kiện, nếu phần thưởng nhiều hơn (hoặc ít hơn) so với kỳ vọng, não bộ ra quyết định sẽ học cách củng cố (hoặc làm suy yếu) mối kết nối nhân quả và được thúc đẩy để lặp lại (hoặc tránh) hành động.
- Công trình gần đây hơn của Dayan thảo luận ý tưởng về sự rút ngắn
|truncation|: rằng chúng ta lên kế hoạch về mặt tâm lý cho các bước trong
một quá trình, nhưng chúng ta không lập kế hoạch từ đầu đến cuối. Mà
thay vào đó, chúng ta dừng lại tại một số thời điểm, và quyết định của
chúng ta dựa trên mức độ tốt đẹp của mọi thứ tại thời điểm đó. Ví dụ,
một người chơi cờ có thể nhìn thấy trước ba hoặc bốn bước và đưa ra một
phán đoán về mức độ tốt đẹp của vị trí [của mình] tại thời điểm đó, thay
vì cố gắng tính toán tất cả các khả năng cho đến cuối cuộc chơi, một điều
sẽ là bất khả thi.
Dave Lagnado - Điều này vì thế mà liên quan đến việc cải thiện các biểu tượng nhân quả |causal representation|. Một biểu tượng nhân quả có thể được coi là một mạng lưới phức hợp được tạo thành từ các “lợi thế” kích thích - phản hồi riêng biệt. Sloman và Lagnado (2015) thảo luận về cách các biểu tượng nhân quả có thể hỗ trợ cho sự mô phỏng tâm lý và cho sự phát triển những câu chuyện tường thuật về thế giới.
- Một tập hợp riêng biệt những khám phá đã và đang được phát triển song
song trong các tài liệu tâm lý học. Ý tưởng về viễn tượng |prospection|
đã được Gilbert và Wilson mô tả vào năm 2009 trong một bài báo trên tạp
chí Science |Khoa học|. Họ đã quan sát được rằng con người suy nghĩ
về tương lai, và cảm thấy vui sướng khi làm việc đó. Điều này có thể
có những hệ quả về sức khỏe tâm lý, và nhìn chung dường như là một hoạt
động thông thường của con người.
Giovanni Pezzulo - Nghiên cứu của Pezzulo và Rigoli đã được đăng trên tạp chí Frontiers of Neuroscience vào năm 2011 “Giá trị của tầm nhìn xa: viễn tượng ảnh hưởng đến việc ra quyết định như thế nào”. Họ đã tạo ra một mô hình để giải thích bằng cách nào mà những người ra quyết định có thể tưởng tượng ra những động lực về tương lai của họ và sử dụng những động lực này để tính toán những hành động nào mà họ sẽ muốn thực hiện trong tương lai – và để hành động phù hợp ở hiện tại.
- Đến lượt công việc này được xây dựng
dựa trên hai ý tưởng cốt lõi. Đầu tiên là ý tưởng về việc ra quyết
định dựa trên mô hình (phân biệt với những quyết định không dựa trên mô
hình). Học tập không dựa trên mô hình |model-free learning| (như
những thí nghiệm của Pavlov ở trên) bắt đầu từ một kích thích bên ngoài và
học được hành động hoặc hành vi tương ứng. Hãy xem một công tắc –
nhấn công tắc. Không có một biểu tượng có ý nghĩa nào về việc công
tắc có ý nghĩa là gì, hoặc tại sao việc nhấn vào nó là một điều
tốt. Học tập dựa trên mô hình |model-based learning| giới thiệu một
bước trung gian. Bạn thấy sự kích thích, và trong tâm trí, bạn xem
xét điều này có nghĩa là gì, và cập nhật mô hình tâm lý của bạn về thế
giới. Học tập và ra quyết định dựa trên mô hình hóa ra có sức ảnh
hưởng lớn hơn nhiều, nhất là trong các tình huống phức tạp hơn, và có vẻ
như con người sử dụng các biểu tượng dựa trên mô hình bởi vì sẽ không thể
học đủ được những sự kết hợp giữa kích thích và hành vi để phản ánh tất cả
những sự hiểu biết của chúng ta theo một cách không dựa trên mô hình.
George Loewenstein (1955-)
10. Một hướng nghiên cứu khác mà họ rút ra là ý tưởng về lợi ích từ sự mong đợi và sự lo sợ. Sự mong đợi là khi chúng ta thích suy nghĩ về các sự kiện tích cực trong tương lai; sự lo sợ là khi chúng ta cảm thấy đau đớn khi nghĩ về những sự kiện tiêu cực trong tương lai. George Loewenstein đã nghiên cứu sâu rộng vấn đề này (Loewenstein 1987) và xác định rằng con người rất thích quá trình mong đợi, và đôi khi sẵn sàng trì hoãn một hoạt động thú vị để kéo dài niềm vui sướng của việc mong đợi nó xảy đến.
11. Thomas Schelling, trong cuốn “The Mind As a Consuming Organ |Tâm trí Như một Cơ quan Cảm thụ| (1983)” đã đặt câu hỏi tại sao chúng ta lại khóc khi xem chuỗi chương trình truyền hình “Lassie”. Chúng ta có nghĩ rằng Lassie là có thật, hay những điều xảy ra với nó [cô chó đó] trong chương trình là có thật? Dĩ nhiên là không. Nhưng chúng ta vẫn thích chương trình này: trí tưởng tượng của chúng ta mang đến cho chúng ta phần thưởng cho việc ‘giả vờ tin’ vào thế giới hư cấu này. Điều này có lẽ được kết nối với khả năng tâm lý của sự đồng cảm (Ainslie và Monterosso 2002).
12. Những công trình Khoa học thần kinh vào giữa những năm 2000 (Padoa-Schippoa và Assad, 2006; Kable và Glimcher, 2007) đã khám phá ra rằng não bộ biểu trưng các giá trị khen thưởng khi chúng ta đưa ra những quyết định hướng đến mục tiêu. Thay vì được khen thưởng khi thực hiện một số hành động nhất định, chúng ta (hoặc, chí ít là, những con khỉ) được thưởng cho việc tiêu thụ những món đồ vật cụ thể. Biểu tượng của những món đồ vật này trong tâm trí cung cấp chứng cứ cho ý tưởng về suy luận dựa trên mô hình |model-based reasoning|.
13. Nghiên cứu gần đây về học tập tính toán |computational learning| (Hamrick 2018, Re Richt 2018) cho thấy mô phỏng tâm lý là một cách hữu hiệu để giải quyết vấn đề và các thuật toán phần mềm sử dụng phương pháp này cho thấy sự tương đồng với việc ra quyết định của con người. Điều này không trực tiếp chứng minh rằng tâm trí loài người quyết định mọi thứ theo cùng một cách, nhưng nó cung cấp sự hỗ trợ cho tính khả thể |plausibility| của ý tưởng này.
Từ đây, bước quan trọng là nhận ra rằng học tập dựa trên mô hình dựa vào một mạng lưới nền tảng của các mối quan hệ kích thích - phản hồi, biểu tượng kế thừa, suy luận nhân quả, chuyển đổi chất dopamine, sự rút ngắn, sự mong đợi, viễn tượng và sự đồng cảm đều có thể được xem là những góc nhìn khác nhau về một hệ thống hoặc quá trình phổ biến: Hệ thống 3.
![]() |
Steven A. Sloman |
Sự mong đợi về mỗi [một kết quả] trong số các kết quả liên tiếp này cung cấp niềm vui sướng (hoặc nỗi đau đớn, nếu kết quả là tiêu cực). Do đó, người ra quyết định trải qua niềm vui sướng nếu lựa chọn đó là một lựa chọn tốt và điều này khuyến khích họ thực hiện hành động (và tương ứng là không thực hiện nếu sự mở rộng về mặt tâm lý này gây nên nỗi đau đớn). Số lượng phần thưởng có được từ sự mong đợi có liên quan đến số lượng phần thưởng đạt được từ trải nghiệm thực tế. Trải nghiệm về phần thưởng hiện tại để đổi lấy các hoạt động trong tương lai là điều giải quyết ‘nghịch lý của viễn tượng’ |prospection paradox|: làm sao não bộ của chúng ta có thể buộc chúng ta từ bỏ phần thưởng hiện tại để ủng hộ khả năng về phần thưởng trong tương lai?
Hãy thấy rằng người ra quyết định có thể có được niềm vui chỉ đơn giản bằng cách suy nghĩ về các hành động có thể xảy ra – họ thực sự không cần phải làm gì cả! Đây là bước quan trọng thúc đẩy con người có viễn tượng – mong đợi về một sự kiện, ngay cả khi sự kiện đó sẽ không bao giờ xảy ra, đem lại [cho họ] phần thưởng.
![]() |
Robert A. Rescorla (1940-) |
Do đó, não bộ được thúc đẩy để tiếp tục tưởng tượng, chiêm nghiệm, tưởng thưởng các hoạt động. Động lực có thể được xem như là cả nhiên liệu, lẫn giải thưởng, cho quá trình này; theo thời gian, nhiên liệu được “dùng hết” để nói một cách ẩn dụ và động lực giảm đi. Có khả năng động lực và phần thưởng cho các sự kiện tưởng tượng sẽ chuyển sang một trạng thái cân bằng ổn định. Khi não bộ lang thang khắp mạng lưới của những kết quả tưởng tượng này, nó đang gián tiếp thử nghiệm các mức thưởng của mỗi sự kiện và những [sự kiện] kế thừa của nó. Vì nó [não bộ] mô phỏng một chuỗi các sự kiện và nhận ra rằng phần thưởng cho kết quả là ít hơn, hoặc nhiều hơn, so với kỳ vọng, nó điều chỉnh các nhiệm vụ lấy phần thưởng để nhằm phản ánh dự đoán chính xác hơn của nó về mức độ tích cực của các sự kiện đó nếu chúng diễn ra.
Khi não bộ học được những phần thưởng mới, nó sẽ thích ứng với những phần thưởng đó trong mạng lưới này; và khi gặp phải những tình huống mới, nó cố gắng tái hiện lại mạng lưới đã có lên khung cảnh mới. Điều này cũng xảy ra khi chúng ta xem một chương trình truyền hình (chứa thế giới hư cấu của chính nó, trong đó chúng ta phát triển một biểu tượng tâm lý mới), hoặc tưởng tượng về cuộc sống của một người khác.
Trong tất cả các trường hợp như vậy, chúng ta được khen thưởng khi tưởng tượng ra những điều có thể xảy ra – ở tương lai, trong một thế giới hư cấu, hoặc về một người khác – mặc dù thậm chí chúng ta không nhận được phần thưởng trực tiếp, ngay lập tức cho bất kỳ sự kiện nào trong số đó. Hệ thống 3 là thứ liên kết tương lai với hiện tại; thế giới hư cấu với thế giới thực; và cuộc sống của người khác với cuộc sống của chính chúng ta.
Hệ thống 3 cung cấp một cơ chế mà chúng ta quan tâm đến, và được khen thưởng hoặc bị trừng phạt, những kết quả mang tính biểu tượng thuần túy. Ví dụ tiêu biểu là sự thành công hay thất bại của một dự án làm việc (mà chúng ta có thể quan tâm sâu sắc ngay cả khi nó không có khả năng ảnh hưởng đến mức độ an toàn công việc hoặc thu nhập của chúng ta), một sự gắn kết về mặt chính trị với những biểu tượng như quốc kỳ hoặc một chính sách chữ ký số |signature policy|, trải nghiệm khi bước sang tuổi 30, 40, 50 hoặc 60 (hay thậm chí 25, cho dù ý tưởng này có lẽ gây khó chịu cho nhiều độc giả), những kết quả của các sự kiện thể thao và nhiều trải nghiệm phi-vật chất khác. Chính tác động của những trải nghiệm này lên các mạng lưới nhân quả của chúng ta, hoặc lên các mô phỏng tâm lý mà chúng kích hoạt, mang lại phần thưởng hoặc nỗi đau.
Hệ thống 3 có khác hoàn toàn với Hệ thống 1 và 2 không? Đây là một vấn đề liên quan đến sự phán đoán hơn là chứng cứ, nhưng tôi sẽ lập luận rằng:
- Hệ thống 1 chủ yếu là về các quá trình vô thức, nhanh – trong khi Hệ thống 3, tuy tự động, nhưng lại chậm hơn và cũng có thể là hoàn toàn có ý thức.
- Các quá trình của Hệ thống 2 là về tái tạo chính xác, sau đó kiểm soát về mặt biểu tượng và logic các quy luật về vật chất trong thế giới hiện thực. Ví dụ, Hệ thống 2 có thể cho bạn biết rằng nếu tiết kiệm 1.000 đô ngày hôm nay, bạn sẽ có 1.030 đô vào năm tới. Nó không thể cho bạn biết là bạn sẽ cảm thấy như thế nào về điều đó, hay điều nào tốt hơn. Tuy nhiên, Hệ thống 3 cho phép bạn thử cảm giác khi chi tiêu 1.000 đô, sự hài lòng tự mãn khi không chi tiêu và niềm vui bạn có thể nhận được trong năm tới từ khoản tiền lãi thêm 30 đô đó.
- Hệ thống 3 kéo theo một quá trình tâm lý cụ thể và riêng biệt không giống như những bước nhảy không theo mô hình, tức thời của Hệ thống 1 và cũng không giống như sự suy luận không có cảm xúc, dựa trên quy tắc, phi-nhân quả của Hệ thống 2.
Tôi tin rằng Hệ thống 3 cung cấp một mô tả tốt về một nhóm các quyết định không được giải thích rõ bằng lý thuyết hiện có và là một nền tảng vững chắc để hiểu được sự đánh giá các trạng thái tâm lý dưới góc độ kinh tế (tại trái tim của một lĩnh vực mới nổi thuộc kinh tế học nhận thức).
Giám đốc điều hành, Inon
Nguyễn Thị Thanh Trúc & Nguyễn Việt Anh dịch
Nguồn: Neuroscience, psychology and economics: the evidence for System 3 (long), Knowing and Making, ngày 27 tháng 4 năm 2018.
