21.5.21

Khoa học thần kinh, tâm lý học và kinh tế học: chứng cứ về Hệ thống 3

KHOA HỌC THẦN KINH, TÂM LÝ HỌC VÀ KINH TẾ HỌC: CHỨNG CỨ VỀ HỆ THỐNG 3

Trong bài viết trước, tôi đã phác thảo quan niệm về Hệ thống 3, nó là gì và tại sao nó lại quan trọng. Nhìn ngắn gọn, Hệ thống 3 là năng lực tâm lý để tưởng tượng về tương lai và đánh giá việc bạn sẽ hạnh phúc như thế nào trong đó – dựa trên việc bản thân quá trình tưởng tượng đem lại cho bạn mức độ hài lòng ra sao.

Rất nhiều nghiên cứu khác nhau đã kết hợp với nhau để cho ra kết quả về việc nhìn nhận Hệ thống 3 như một quá trình tâm lý riêng biệt. Tôi tóm tắt các bước chính như sau:

Ivan Pavlov (1849-1936)
Khối cấu trúc nền tảng của Hệ thống 3 là mối quan hệ kích thích – phản hồi. Từ lâu, chúng ta đã biết rằng con người dễ dàng học được các mối quan hệ kích thích – phản hồi khi họ được tưởng thưởng cho sự phản hồi. Các ví dụ kinh điển đến từ Pavlov (người thưởng đồ ăn cho những con chó và phát hiện ra rằng chúng sẽ bắt đầu trở nên phấn khích khi nhìn thấy chiếc áo choàng trắng của người làm thí nghiệm – như bất kỳ người chủ vật nuôi nào cũng sẽ nhận ra), và Skinner (người đã huấn luyện chim bồ câu biết mổ vào một cái công tắc, hành vi này nằm trong mối liên hệ với việc được cho ăn). Mặc dù những thí nghiệm ban đầu này được thực hiện trên động vật, có rất nhiều chứng cứ cho thấy nguyên lý tương tự áp dụng được cho con người. Một ví dụ điển hình sẽ là việc ta nhìn thấy cái vỏ bao bì của một thanh sô-cô-la và háo hức dự đoán hương vị của sô-cô-la bên trong. (Kích thích – phản hồi không chỉ là nền tảng cho Hệ thống 1 – mà còn cho Hệ thống 3, chúng phát triển từ cùng những nguồn gốc).
Bước tiếp theo là ý tưởng về các biểu tượng kế thừa |successor representation|. Các nhà khoa học thần kinh (ví dụ như Stachenfeld và cộng sự, 2017) đã chỉ ra rằng chúng ta lưu trữ trong não bộ của mình tiến trình hoàn chỉnh gồm các bước cần thiết để đạt được mục tiêu. Mỗi bước này có thể lần lượt được xem xét như một mối quan hệ kích thích – phản hồi riêng lẻ. Nói cách khác, một chuỗi những mối quan hệ kích thích – phản hồi có thể được liên hệ với nhau, trong đó sự phản hồi của bước này trở thành kích thích cho bước tiếp theo.
Peter Dayan (1965-)
Schultz, Dayan và Montague (1997) đã chỉ ra rằng sự phản hồi tạo động lực có thể di chuyển dọc theo chuỗi này khi nó trở nên quen thuộc hơn. Hãy tưởng tượng chuỗi A-> B-> C thể hiện quá trình mà trong đó một kích thích A dự báo sự phản hồi B, và tiếp đó B lại dự báo sự phản hồi C. C là ‘phần thưởng’ trên thực tế. Chẳng hạn, A có thể là logo của nhà sản xuất sô-cô-la; B là vỏ bao bì của một thanh sô-cô-la; và C là thanh sô-cô-la thật. Khi bạn thấy nhiều bao bì sô-cô-la hơn và bóc nó ra để khám phá thanh sô-cô-la, chính cái vỏ bao bì sẽ bắt đầu trở thành động lực thúc đẩy bạn trước khi bạn thậm chí có cơ hội chạm vào thanh sô-cô-la. Lần lượt sau đó, hình logo có thể trở thành động lực thúc đẩy.
Có thể kiểm soát cách động lực thay đổi theo phần thưởng bằng mô hình Rescorla-Wagner (Rescorla và Wagner, 1972): trải qua một sự kiện, nếu phần thưởng nhiều hơn (hoặc ít hơn) so với kỳ vọng, não bộ ra quyết định sẽ học cách củng cố (hoặc làm suy yếu) mối kết nối nhân quả và được thúc đẩy để lặp lại (hoặc tránh) hành động.
Công trình gần đây hơn của Dayan thảo luận ý tưởng về sự rút ngắn |truncation|: rằng chúng ta lên kế hoạch về mặt tâm lý cho các bước trong một quá trình, nhưng chúng ta không lập kế hoạch từ đầu đến cuối. Mà thay vào đó, chúng ta dừng lại tại một số thời điểm, và quyết định của chúng ta dựa trên mức độ tốt đẹp của mọi thứ tại thời điểm đó. Ví dụ, một người chơi cờ có thể nhìn thấy trước ba hoặc bốn bước và đưa ra một phán đoán về mức độ tốt đẹp của vị trí [của mình] tại thời điểm đó, thay vì cố gắng tính toán tất cả các khả năng cho đến cuối cuộc chơi, một điều sẽ là bất khả thi.
Dave Lagnado
Điều này vì thế mà liên quan đến việc cải thiện các biểu tượng nhân quả |causal representation|. Một biểu tượng nhân quả có thể được coi là một mạng lưới phức hợp được tạo thành từ các “lợi thế” kích thích - phản hồi riêng biệt. Sloman và Lagnado (2015) thảo luận về cách các biểu tượng nhân quả có thể hỗ trợ cho sự mô phỏng tâm lý và cho sự phát triển những câu chuyện tường thuật về thế giới.
Một tập hợp riêng biệt những khám phá đã và đang được phát triển song song trong các tài liệu tâm lý học. Ý tưởng về viễn tượng |prospection| đã được Gilbert và Wilson mô tả vào năm 2009 trong một bài báo trên tạp chí Science |Khoa học|. Họ đã quan sát được rằng con người suy nghĩ về tương lai, và cảm thấy vui sướng khi làm việc đó. Điều này có thể có những hệ quả về sức khỏe tâm lý, và nhìn chung dường như là một hoạt động thông thường của con người.
Giovanni Pezzulo
Nghiên cứu của Pezzulo và Rigoli đã được đăng trên tạp chí Frontiers of Neuroscience vào năm 2011 “Giá trị của tầm nhìn xa: viễn tượng ảnh hưởng đến việc ra quyết định như thế nào”. Họ đã tạo ra một mô hình để giải thích bằng cách nào mà những người ra quyết định có thể tưởng tượng ra những động lực về tương lai của họ và sử dụng những động lực này để tính toán những hành động nào mà họ sẽ muốn thực hiện trong tương lai – và để hành động phù hợp ở hiện tại.
Đến lượt công việc này được xây dựng dựa trên hai ý tưởng cốt lõi. Đầu tiên là ý tưởng về việc ra quyết định dựa trên mô hình (phân biệt với những quyết định không dựa trên mô hình). Học tập không dựa trên mô hình |model-free learning| (như những thí nghiệm của Pavlov ở trên) bắt đầu từ một kích thích bên ngoài và học được hành động hoặc hành vi tương ứng. Hãy xem một công tắc – nhấn công tắc. Không có một biểu tượng có ý nghĩa nào về việc công tắc có ý nghĩa là gì, hoặc tại sao việc nhấn vào nó là một điều tốt. Học tập dựa trên mô hình |model-based learning| giới thiệu một bước trung gian. Bạn thấy sự kích thích, và trong tâm trí, bạn xem xét điều này có nghĩa là gì, và cập nhật mô hình tâm lý của bạn về thế giới. Học tập và ra quyết định dựa trên mô hình hóa ra có sức ảnh hưởng lớn hơn nhiều, nhất là trong các tình huống phức tạp hơn, và có vẻ như con người sử dụng các biểu tượng dựa trên mô hình bởi vì sẽ không thể học đủ được những sự kết hợp giữa kích thích và hành vi để phản ánh tất cả những sự hiểu biết của chúng ta theo một cách không dựa trên mô hình.
George Loewenstein (1955-)

10. Một hướng nghiên cứu khác mà họ rút ra là ý tưởng về lợi ích từ sự mong đợi và sự lo sợ. Sự mong đợi là khi chúng ta thích suy nghĩ về các sự kiện tích cực trong tương lai; sự lo sợ là khi chúng ta cảm thấy đau đớn khi nghĩ về những sự kiện tiêu cực trong tương lai. George Loewenstein đã nghiên cứu sâu rộng vấn đề này (Loewenstein 1987) và xác định rằng con người rất thích quá trình mong đợi, và đôi khi sẵn sàng trì hoãn một hoạt động thú vị để kéo dài niềm vui sướng của việc mong đợi nó xảy đến.

11. Thomas Schelling, trong cuốn “The Mind As a Consuming Organ |Tâm trí Như một Cơ quan Cảm thụ| (1983)” đã đặt câu hỏi tại sao chúng ta lại khóc khi xem chuỗi chương trình truyền hình “Lassie”. Chúng ta có nghĩ rằng Lassie là có thật, hay những điều xảy ra với nó [cô chó đó] trong chương trình là có thật? Dĩ nhiên là không. Nhưng chúng ta vẫn thích chương trình này: trí tưởng tượng của chúng ta mang đến cho chúng ta phần thưởng cho việc ‘giả vờ tin’ vào thế giới hư cấu này. Điều này có lẽ được kết nối với khả năng tâm lý của sự đồng cảm (Ainslie và Monterosso 2002).

12. Những công trình Khoa học thần kinh vào giữa những năm 2000 (Padoa-Schippoa và Assad, 2006; Kable và Glimcher, 2007) đã khám phá ra rằng não bộ biểu trưng các giá trị khen thưởng khi chúng ta đưa ra những quyết định hướng đến mục tiêu. Thay vì được khen thưởng khi thực hiện một số hành động nhất định, chúng ta (hoặc, chí ít là, những con khỉ) được thưởng cho việc tiêu thụ những món đồ vật cụ thể. Biểu tượng của những món đồ vật này trong tâm trí cung cấp chứng cứ cho ý tưởng về suy luận dựa trên mô hình |model-based reasoning|.

13. Nghiên cứu gần đây về học tập tính toán |computational learning| (Hamrick 2018, Re Richt 2018) cho thấy mô phỏng tâm lý là một cách hữu hiệu để giải quyết vấn đề và các thuật toán phần mềm sử dụng phương pháp này cho thấy sự tương đồng với việc ra quyết định của con người. Điều này không trực tiếp chứng minh rằng tâm trí loài người quyết định mọi thứ theo cùng một cách, nhưng nó cung cấp sự hỗ trợ cho tính khả thể |plausibility| của ý tưởng này.

Từ đây, bước quan trọng là nhận ra rằng học tập dựa trên mô hình dựa vào một mạng lưới nền tảng của các mối quan hệ kích thích - phản hồi, biểu tượng kế thừa, suy luận nhân quả, chuyển đổi chất dopamine, sự rút ngắn, sự mong đợi, viễn tượng và sự đồng cảm đều có thể được xem là những góc nhìn khác nhau về một hệ thống hoặc quá trình phổ biến: Hệ thống 3.

Steven A. Sloman

Read Montague (1960-)

Trong quá trình của Hệ thống 3, loài người duy trì một biểu tượng tâm lý về thế giới, được kết cấu như một đồ thị nhân quả: một tập hợp những niềm tin về mối quan hệ nhân-quả giữa các sự kiện và các đối tượng trong thế giới. Họ sử dụng đồ thị nhân quả này để đưa ra các quyết định. Khi được trình bày với một lựa chọn mới, họ phát hiện về mặt tâm lý những hệ quả có thể diễn ra của lựa chọn đó: điều gì sẽ diễn ra nếu tôi làm điều đó, sau đó điều gì sẽ diễn ra tiếp theo, v.v. (Biểu tượng kế thừa là một chuỗi cụ thể các bước trong đồ thị này).

Sự mong đợi về mỗi [một kết quả] trong số các kết quả liên tiếp này cung cấp niềm vui sướng (hoặc nỗi đau đớn, nếu kết quả là tiêu cực). Do đó, người ra quyết định trải qua niềm vui sướng nếu lựa chọn đó là một lựa chọn tốt và điều này khuyến khích họ thực hiện hành động (và tương ứng là không thực hiện nếu sự mở rộng về mặt tâm lý này gây nên nỗi đau đớn). Số lượng phần thưởng có được từ sự mong đợi có liên quan đến số lượng phần thưởng đạt được từ trải nghiệm thực tế. Trải nghiệm về phần thưởng hiện tại để đổi lấy các hoạt động trong tương lai là điều giải quyết ‘nghịch lý của viễn tượng’ |prospection paradox|: làm sao não bộ của chúng ta có thể buộc chúng ta từ bỏ phần thưởng hiện tại để ủng hộ khả năng về phần thưởng trong tương lai?

Hãy thấy rằng người ra quyết định có thể có được niềm vui chỉ đơn giản bằng cách suy nghĩ về các hành động có thể xảy ra – họ thực sự không cần phải làm gì cả! Đây là bước quan trọng thúc đẩy con người có viễn tượng – mong đợi về một sự kiện, ngay cả khi sự kiện đó sẽ không bao giờ xảy ra, đem lại [cho họ] phần thưởng.

Robert A. Rescorla (1940-)

Allan R. Wagner (1934-2018)

Công thức Rescorla-Wagner xuất hiện một lần nữa. Giả sử rằng tôi nghĩ về một kết quả và tôi được khen thưởng khi nghĩ về nó. Não bộ của tôi đang tưởng thưởng cho tôi bởi vì nó “muốn” tôi thực hiện hành động mà tôi đang nghĩ đến, bởi vì hành động đó có khả năng dẫn đến một phần thưởng khác (thanh sô-cô-la). Hơn nữa, hành động suy nghĩ về thanh sô-cô-la, rất có thể, được liên kết về mặt thống kê với việc nhận và ăn sô-cô-la – vì vậy não bộ hoàn toàn đúng khi học được liên tưởng này. Nhưng nếu tôi cứ nghĩ về nó và không bao giờ thực sự ăn sô-cô-la, phần thưởng được mong đợi sẽ ít hơn kỳ vọng, và động lực của tôi để tiếp tục tưởng tượng về nó sẽ giảm đi. Về lâu về dài, người ta có thể kỳ vọng động lực nghĩ về sô-cô-la sẽ nhanh chóng biến mất hoàn toàn: nhưng trên thực tế, sự rút ngắn đã ngăn chặn điều này xảy ra. Não bộ lại rời đi để làm những việc khác trước khi phần thưởng bị dập tắt hoàn toàn.

Do đó, não bộ được thúc đẩy để tiếp tục tưởng tượng, chiêm nghiệm, tưởng thưởng các hoạt động. Động lực có thể được xem như là cả nhiên liệu, lẫn giải thưởng, cho quá trình này; theo thời gian, nhiên liệu được “dùng hết” để nói một cách ẩn dụ và động lực giảm đi. Có khả năng động lực và phần thưởng cho các sự kiện tưởng tượng sẽ chuyển sang một trạng thái cân bằng ổn định. Khi não bộ lang thang khắp mạng lưới của những kết quả tưởng tượng này, nó đang gián tiếp thử nghiệm các mức thưởng của mỗi sự kiện và những [sự kiện] kế thừa của nó. Vì nó [não bộ] mô phỏng một chuỗi các sự kiện và nhận ra rằng phần thưởng cho kết quả là ít hơn, hoặc nhiều hơn, so với kỳ vọng, nó điều chỉnh các nhiệm vụ lấy phần thưởng để nhằm phản ánh dự đoán chính xác hơn của nó về mức độ tích cực của các sự kiện đó nếu chúng diễn ra.

Khi não bộ học được những phần thưởng mới, nó sẽ thích ứng với những phần thưởng đó trong mạng lưới này; và khi gặp phải những tình huống mới, nó cố gắng tái hiện lại mạng lưới đã có lên khung cảnh mới. Điều này cũng xảy ra khi chúng ta xem một chương trình truyền hình (chứa thế giới hư cấu của chính nó, trong đó chúng ta phát triển một biểu tượng tâm lý mới), hoặc tưởng tượng về cuộc sống của một người khác.

Trong tất cả các trường hợp như vậy, chúng ta được khen thưởng khi tưởng tượng ra những điều có thể xảy ra – ở tương lai, trong một thế giới hư cấu, hoặc về một người khác – mặc dù thậm chí chúng ta không nhận được phần thưởng trực tiếp, ngay lập tức cho bất kỳ sự kiện nào trong số đó. Hệ thống 3 là thứ liên kết tương lai với hiện tại; thế giới hư cấu với thế giới thực; và cuộc sống của người khác với cuộc sống của chính chúng ta.

Hệ thống 3 cung cấp một cơ chế mà chúng ta quan tâm đến, và được khen thưởng hoặc bị trừng phạt, những kết quả mang tính biểu tượng thuần túy. Ví dụ tiêu biểu là sự thành công hay thất bại của một dự án làm việc (mà chúng ta có thể quan tâm sâu sắc ngay cả khi nó không có khả năng ảnh hưởng đến mức độ an toàn công việc hoặc thu nhập của chúng ta), một sự gắn kết về mặt chính trị với những biểu tượng như quốc kỳ hoặc một chính sách chữ ký số |signature policy|, trải nghiệm khi bước sang tuổi 30, 40, 50 hoặc 60 (hay thậm chí 25, cho dù ý tưởng này có lẽ gây khó chịu cho nhiều độc giả), những kết quả của các sự kiện thể thao và nhiều trải nghiệm phi-vật chất khác. Chính tác động của những trải nghiệm này lên các mạng lưới nhân quả của chúng ta, hoặc lên các mô phỏng tâm lý mà chúng kích hoạt, mang lại phần thưởng hoặc nỗi đau.

Hệ thống 3 có khác hoàn toàn với Hệ thống 1 và 2 không? Đây là một vấn đề liên quan đến sự phán đoán hơn là chứng cứ, nhưng tôi sẽ lập luận rằng:

Hệ thống 1 chủ yếu là về các quá trình vô thức, nhanh – trong khi Hệ thống 3, tuy tự động, nhưng lại chậm hơn và cũng có thể là hoàn toàn có ý thức.
Các quá trình của Hệ thống 2 là về tái tạo chính xác, sau đó kiểm soát về mặt biểu tượng và logic các quy luật về vật chất trong thế giới hiện thực. Ví dụ, Hệ thống 2 có thể cho bạn biết rằng nếu tiết kiệm 1.000 đô ngày hôm nay, bạn sẽ có 1.030 đô vào năm tới. Nó không thể cho bạn biết là bạn sẽ cảm thấy như thế nào về điều đó, hay điều nào tốt hơn. Tuy nhiên, Hệ thống 3 cho phép bạn thử cảm giác khi chi tiêu 1.000 đô, sự hài lòng tự mãn khi không chi tiêu và niềm vui bạn có thể nhận được trong năm tới từ khoản tiền lãi thêm 30 đô đó.
Hệ thống 3 kéo theo một quá trình tâm lý cụ thể và riêng biệt không giống như những bước nhảy không theo mô hình, tức thời của Hệ thống 1 và cũng không giống như sự suy luận không có cảm xúc, dựa trên quy tắc, phi-nhân quả của Hệ thống 2.

Tôi tin rằng Hệ thống 3 cung cấp một mô tả tốt về một nhóm các quyết định không được giải thích rõ bằng lý thuyết hiện có và là một nền tảng vững chắc để hiểu được sự đánh giá các trạng thái tâm lý dưới góc độ kinh tế (tại trái tim của một lĩnh vực mới nổi thuộc kinh tế học nhận thức).

Leigh Caldwell

Giám đốc điều hành, Inon

Leigh Caldwell

Leigh Caldwell là một nhà Toán học đang làm công việc có tính thương mại về kinh tế học hành vi và kinh tế học thông tin. Ông là Giám đốc điều hành của công ty Inon, một công ty chuyên tư vấn về kinh tế học và phần mềm có trụ sở tại London (Anh), và cũng là người đứng đầu Trung tâm Kinh doanh Trí tuệ, một viện nghiên cứu mới chuyên khám phá các phương pháp phân tích cho kinh doanh và cách áp dụng các nguyên lý của kinh tế học và các khoa học cứng |hard science| trong những môi trường có tính thương mại. Ông cũng viết một blog về kinh tế học thông tin và kinh tế học hành vi, có tên là Knowing and Making |Biết và Tạo|. Ông đã nhận được bằng toán học và vật lý học từ Đại học Glasgow từ năm 18 tuổi.

Nguyễn Thị Thanh Trúc & Nguyễn Việt Anh dịch

Nguồn: Neuroscience, psychology and economics: the evidence for System 3 (long), Knowing and Making, ngày 27 tháng 4 năm 2018.