19.6.22

Bản đồ học xã hội: phân tích dữ liệu

BẢN ĐỒ HỌC XÃ HỘI: PHÂN TÍCH DỮ LIỆU[1]

Alain Desrosières

Alain Desrosières (1940-2013)

Phải chăng phân tích dữ liệu kiểu Pháp là đứa con của tháng năm năm 1968? Được phổ biến trong các khoa học xã hội ở Pháp vào những năm 1970, phân tích các tương ứng như được Jean-Paul Benzécri và các cộng sự của ông chủ trương, dưới mắt một số nhà nghiên cứu được xem là “thiên tả”, đối lập với các kĩ thuật kinh trắc nổi tiếng là “thiên hữu”. Ngày nay câu hỏi trên có vẻ ngớ ngẫn: bản thân các công cụ thống kê dường như không “thiên tả” hay “thiên hữu”. Làm sao giải thích hình ảnh này, đặc trưng cho tâm trạng thời hậu 1968? Những lập luận thời bấy giờ được những người bảo vệ một phân tích dữ liệu “thiên tả” thuộc hai loại: 1) phân tích này được xem như một kĩ thuật thuần tuý có tính mô tả, không có lí thuyết kinh tế đằng sau (ngầm ám chỉ không có lí thuyết tân cổ điển) nhằm nêu bật, một cách không có tiên kiến, những cấu trúc cơ bản vùi sâu trong một tập dữ liệu dày đặc và bí hiểm. 2) Nối tiếp tinh thần tháng năm 1968, tính đa chiều của kĩ thuật này được xem là sự bảo đảm cho tính đa nguyên, đối lập với những biểu trưng đơn chiều có tính quy giản, vốn đồng nghĩa với sự đơn điệu và thứ bậc[2]. Những đối thủ của quan điểm này nhận xét một cách kinh điển rằng các công cụ kĩ thuật không có màu sắc ý thức hệ hay chính trị và đối với một phân tích tương quan hay với việc giải một mô hình có những phương trình đồng thời thì các hình thức đều giống nhau (chéo hoá các ma trận phương sai-hiệp phương sai, nghiên cứu các giá trị riêng và vectơ riêng).

Những văn bản thống kê do các chuyên gia của bộ môn này viết thường có tính khuyến nghị, nếu không nói là có tính quy phạm. Tuỳ trường hợp, chúng đưa lên hàng đầu một “phương pháp luận” được xem là “tốt”: có tính xác suất hay không (Benzécri), theo tần số luận hay theo Bayes, lấy cảm hứng từ Fisher hay từ Neyman và Pearson trong trường hợp các kiểm định. Đôi lúc, chúng biện hộ cho một tính “bổ sung” hay một “tổng hợp” giữa những cách tiếp cận trước đó được xem là tương phản nhau. Bài viết này chọn theo một quan điểm xã hội học hơn là có tính khoa học luận. Vấn đề là nhận diện những mạng lập luận và cách sử dụng xã hội trong đó những phương pháp luận khác nhau được huy động và theo dõi sự hình thành, quỹ đạo và diễn dịch lại của những mạng này.

Có thể cuộc tranh luận xưa kia nói đến ở đây là dịp để xem xét cách mà các khoa học xã hội, kể từ những năm 1970, đã chiếm lĩnh phân tích dữ liệu gọi là “theo kiểu Pháp” (nghĩa là xuất phát từ những công trình của Benzécri, Brigitte Cordier-Escoffier, Ludovic Lebart và vài tác giả khác). Chắc chắn một câu trả lời đầu tiên cho câu hỏi trên là nhắc lại rằng “tính trung lập cần thiết và khách quan của khoa học không thể bị bất kì đảng phái nào thôn tính”. Nhưng cũng có thể suy nghĩ về cách mà những thuyết hình thức được tích hợp trong những hệ thống lập luận trí thức và (hay) hành động, và bằng cách nào những cấu trúc của các cơ chế này thay đổi theo các bộ môn (trong trường hợp này, ví dụ: tâm lí học, xã hội học hay sử học). Trước hết, chúng tôi chọn làm sợi chỉ dẫn đường là tính đối ngẫu của hai ví dụ hình thức, ví dụ của tương quan và ví dụ của hồi quy tuyến tính, cả hai là sinh đôi về mặt cú pháp nhưng được sử dụng về mặt ngữ nghĩa và trong thực tiễn với những mục đích và những hệ thống lập luận khác nhau. Chúng tôi sẽ đề cập đến trường hợp của tâm lí học dị biệt, trong những năm từ 1900 đến 1940, rồi trường hợp của xã hội học Pháp, trong những năm 1970. Trong cả hai trường hợp này, phân tích dữ liệu đã cho phép vượt qua hình ảnh cổ điển về một không gian được đồng nhất với một thước đo một chiều nhằm biểu diễn một hay nhiều “trục khác”, và như thế dẫn đến những phân tích tinh tế hơn[3].

Ý tưởng về tính đa chiều xuất hiện trước tiên trong tâm lí học

Karl Pearson (1857-1936)

Tương quan và hồi quy được Karl Pearson hình thức hoá, trong khuôn khổ của mô hình luật chuẩn hai chiều, mà những liên hệ (cú pháp) giữa các công thức của hai ví dụ trên là đặc biệt đơn giản (Benzécri, 1982). Nhưng tuỳ theo là gắn kết chiều cao của cha và con hoặc chiều dài của chân và tay của cùng một cá nhân thì sự kiến giải (ngữ nghĩa) cú sự gắn kết là hoàn toàn khác. Trong một trường hợp, chiều cao của người cha “giải thích” chiều cao người con, hồi quy tuyến tính là hình thức (không đối xứng) có vẻ là phù hợp. Điều này giả định là có một mô hình kéo theo chiều hướng của sự “giải thích” này. Trái lại chỉ có thể gắn kết chiều dài của tay và chân bằng một hình thức đối xứng (hình thức của hồi quy) vì ở đây chỉ có thể giải thích chiều dài của một chi bằng chiều dài của một chi khác[4]. Phán quyết thông dụng “sự tương quan không kéo theo một quan hệ nhân quả” không chỉ đúng một cách kinh điển vì những lí do được viện ra, nhưng chính hình thức của phán quyết cũng không gợi ý rõ ràng là có quan hệ nhân quả, trong khi ngược lại trường hợp của hồi qui tuyến tính lại gợi ý là có điều này. Đây là điểm xuất phát của luận chứng đầu trong số hai luận chứng: những phân tích bằng khái niệm tương quan không đặt thành tiền đề chiều hướng của một nhân quả có thể.

Bản thân Pearson, chịu ảnh hưởng của khoa học luận duy kinh nghiệm của nhà vật lí Ernst Mach, phản bác mạnh mẽ ý niệm nhân quả, ủng hộ ý niệm đồng quan hệ, nghĩa là những đều đặn quan sát được về các đồng tần suất, đặc biệt từ các bảng tiếp liên (như các bảng của phân tích những tương ứng), cộng được theo cột và dòng, phân phối những quan sát chéo theo những tiêu chí khác nhau. Theo ông, công thức hồi quy tuyến tính không kéo theo một nhân quả mà chỉ là một cách để trình bày những đều đặn cục bộ được quan sát chứ không phải một tất định luận đầy đủ. Chỉ lâu sau này mới có sự trượt dài sang ý tưởng “giải thích” (với sự phân biệt biến “giải thích” và biến “được giải thích”). Do đó sự khác biệt về tầm ngữ nghĩa và thực dụng của hai công cụ, tương quan và hồi quy, chỉ có sau cú trượt dài này.

Ý tưởng cho rằng tương quan không kéo theo khái niệm nhân quả giải thích sự thành công của tương quan kể từ Charles Spearman (một môn đồ của Karl Pearson), người nghiên cứu những quan hệ giữa những thành quả học tập của học sinh một lớp trong nhiều môn khác nhau. Ông cho là phải loại bỏ việc “giải thích” điểm môn tiếng Anh bằng điểm môn toán, và ngược lại. Do đó tương quan thắng thế. Tương quan dẫn đến “phân tích nhân tố” của các nhà tâm lí học. Họ theo đuổi một phương pháp điển hình của khoa đo lường “triệu chứng” trong các khoa học về sự sống (Benzécri, 1982). Lịch sử các tranh luận nối tiếp nhau về những công cụ của các phân tích đa chiều này, và về những cách kiến giải chúng, cung cấp một ví dụ về những cách đọc được ghi nhận trong các hệ thống lập luận ý thưc hệ khác nhau (Gould, 1983). Các bên tham gia là các học giả người Anh Charles Spearman (1863-1945), Cyril Burt (1883-1971) rồi người Mĩ Louis-Leon Thurstone (1877-1955) [Martin, 1997].

Francis Galton (1822-1911)

Thông minh tổng quát (hay “nhân tố g”) của Spearman (1904) là một biến tiềm ẩn, “trung bình” của những kết quả n bài thi của p học sinh. Nhân tố này được xác định như là hoành độ của phép chiếu một điểm-cá nhân trục quán tính chính của đám mây các p điểm tượng trưng thành quả của học sinh trong không gian n chiều các bài thi[5]. Sau đó lí thuyết của Spearman được Burt bổ sung, rồi bị Thurstone phê phán và đánh đổ. Tuy vẫn chấp nhận ý niệm thông minh tổng quát, song Burt tìm cách, một mặt, phân tích và kiến giải phương sai không được nhân tố g giải thích (liệu có những nhân tố phụ phản ánh những năng khiếu đặc biệt, độc lập với g chăng?) và, mặt khác, chứng minh rằng thông minh tổng quát là bẩm sinh và di truyền, như hầu hết các nhà sinh trắc học xuất thân từ trường phái ưu sinh học của Galton, Pearson và Fisher tin tưởng (MacKenzie, 1981). Công trình của ông đã được sử dụng tại Anh, từ năm 1944 đến năm 1965, để trắc nghiệm trẻ em 11 tuổi và phân bổ chúng theo học những phân ban khác nhau, bằng trắc nghiệm gọi là eleven+.

Nhưng năm 1935, học giả Mĩ Thurstone giáng một đòn mạnh vào ý tưởng cho rằng thông minh là một đại lượng một chiều được trục thứ nhất của phân tích nhân tố phát hiện. Ông hình dung làm cho phân tích này tinh tế hơn bằng cách phân tách g, khi khéo léo quay vòng các trục, thành bảy năng khiếu tinh thần sơ đẳng độc lập với nhau, dựa trên việc là có thể tập hợp các trắc nghiệm trong những tập con có tương quan cao, điều này có lợi thế là không xếp hạng các cá nhân theo một thước đo duy nhất và phù hợp hơn với lí tưởng dân chủ Mĩ, đối lập với thứ bậc cứng nhắc một chiều của xã hội Anh. Như vậy ý tưởng về tính đa chiều, điển hình của phân tích dữ liệu, xuất hiện trong phân tích nhân tố của các nhà tâm lí[6]. Không có máy tính hỗ trợ, các nhà tâm trắc học đã rất khéo léo để “quay vòng các trục”, trong một không gian nhiều chiều. Chủ yếu được các nhà tâm lí học sử dụng, các nhà xã hội học, ít ra là ở Pháp, ít biết kĩ thuật này cho đến những năm 1960.

Pierre Bourdieu (1930-2002)

Tuy nhiên có một thử nghiệm biệt lập và không có được sự tiếp nối. Năm 1954, Jean Porte, người sáng tạo danh mục phân loại xã hội-nghề nghiệp (CSP) tiến hành tại INSEE một “điều tra chọn mẫu về thính giả”, tiền thân của chỉ báo audiomat. Trong một “phân tích nhân tố các thị hiếu”, báo trước hai mươi lăm năm tác phẩm Sự ưu biệt của Pierre Bourdieu (1979), ông tiến hành một phân tích nhân tố một bảng những tương quan giữa các sở thích đối với những buổi phát thanh có nội dung khác nhau. Để làm điều này, ông sử dụng phương pháp của Thurstone gọi là “centroide”: “Chỉ có thể biện minh một thao tác như thế bằng sự thành công của nó, nghĩa là bằng khả năng kiến giải các kết quả của phương pháp này” (Porte, 1954). Ông kiến giải nhân tố thứ nhất như là nhân tố đối lập các buổi “phát thanh có chất lượng” với các buổi “phát thanh nhẹ nhàng”. Còn nhân tố thứ hai đối lập các buổi “phát thanh âm nhạc” với các buổi “phát thanh tiếng nói”. Nhưng phân tích chỉ nhắm vào sự gần nhau của các buổi phát thanh chứ không vào sở thích của những thính giả khác nhau theo danh mục CSP, và nhất là phân tích chưa dẫn tới một bản đồ, vốn là điểm đặc trưng của phân tích những thành phần chính và của phân tích những tương ứng.

Phân tích mô tả và quy nạp, theo Malinvaud

Edmond Malinvaud (1923-2015)
Jean-Paul Benzécri (1932-2019)

Kể từ cuối những năm 1960, các phương pháp này nhanh chóng được phổ biến trong các khoa học xã hội, không chỉ từ những công trình của ê-kíp do Benzécri tập hợp mà còn của nhiều nhà nghiên cứu Pháp khác[7]. Trong phần giới thiệu một số của tạp chí Annales de l’INSEE năm 1970 dành riêng cho phân tích dữ liệu, Malinvaud (người sáng lập tạp chí này chủ yếu để công bố các nghiên cứu kinh trắc) phân biệt thống kê mô tả với thống kê quy nạp (suy luận) mà, theo ông, đòi hỏi phải đặt ra, trước khi quan sát các dữ liệu để phân tích, một mô hình áp dụng vào hiện tượng được nghiên cứu và là kết quả của những hiểu biết có trước đó. Tiếp đó, ông giải thích:

Trong thực tiễn, mọi sự không phải bao giờ cũng hiện ra rõ nét như vậy. Đôi lúc những hiểu biết có trước đó không đủ chính xác để áp đặt một mô hình, dù cho đó là mô hình tổng quát và ít ràng buộc nhất có thể. Đôi lúc bản chất của những quy nạp từ các dữ liệu không được khoanh vùng một cách tiên nghiệm. Đúng ra vấn đề là trình bày các dữ liệu dưới một dạng dễ hiểu, và trong một bước khai phá đầu tiên, để mở rộng cửa nhiều nhất có thể cho lớp những kiến giải mà dữ liệu sẽ dẫn đến. Như vậy, thống kê mô tả, mà đối tượng là việc trình bày các dữ liệu, không còn được quan niệm chỉ như việc cung cấp những giá trị của những đặc điểm sẽ được sử dụng trong một số quy trình quy nạp cụ thể. Đúng hơn nó nhắn đến việc trở thành điểm quy chiếu cơ bản cho sự xem xét một cách rất linh hoạt các kết quả quan trắc. Phong trào hiện nay ủng hộ “phân tích dữ liệu” không gì khác hơn là đợt nhiệt tình mới đối với những kĩ thuật của thống kê mô tả... mà sự đổi mới một phần là do sự phổ biến của các công cụ tính toán tin học (Malinvaud, 1970, trang 8).

Như vậy Malinvaud mở các trang của tạp chí của ông cho những tác giả hưởng ứng phân tích dữ liệu theo kiểu Benzécri (Anita Bensaid, Jean-Piere Balladur, Michel Volle) đặt phân tích dữ liệu trong một tầm nhìn tổng quát hơn, và như vậy trả lời, theo cách giàu sắc thái tinh tế của ông, các phê phán nêu trên đối với thống kê suy luận vốn giả định có một mô hình trước đó[8]. Ông đặt phân tích dữ liệu trong một tập rộng lớn hơn những kĩ thuật, như việc xử lí các chuỗi thời gian, phân tích phổ, loại bỏ những giá trị lệch lạc...). Ông trích dẫn dài dòng John Tuckey để biện minh cho tính bổ sung giữa phân tích khai phá và quy nạp. Năm 1983, Jean-Claude Deville và Malinvaud (lúc bấy giờ là Tổng giám đốc INSEE từ năm 1974) trình bày trước Royal Statistical Society tại London những công trình được thực hiện ở INSEE, dưới tựa đề “Data Analysis in Official Socio-Economic Statistics”, và phát triển cũng các chủ đề này[9].

Trong cuộc tranh luận sau phần trình bày, Sir John Boreham, giám đốc Central Statistical Office (tổng cục thống kê Anh, tương đương với INSEE) đối lập phân tích mô tả, không với phân tích quy nạp, nhưng với phân tích hướng dẫn vốn “... liên quan đến chúng ta hơn, vì chúng ta là một cơ quan thống kê của chính phủ... mà nhiệm vụ chính là trước tiên sản xuất các thống kê, và sau đó là cung cấp các tư vấn...”. Điều này gợi ý là, đối với ông, quả thật rằng thống kê suy luận được định hướng để tiến hành tư vấn và đánh giá chuyên gia nhằm hành động và ra quyết định. Sự trao đổi này giữa những người có trách nhiệm các cơ quan thống kê của hai nước cho thấy là có sự phân biệt giữa, một mặt, phân tích mô tả và khai phá dữ liệu không có tiên kiến và, mặt khác, “phân tích hướng dẫn”, qui nạp, mô hình hoá và tư vấn cho quân vương, cho dù sự phân biệt này không có vẻ đơn giản như thế.

Giả thiết xuất phát của chúng tôi là tương quan và hồi qui tuyến tính, về mặt cú pháp, là hai khái niệm sinh đôi (hình thức hoá nguyên thuỷ là rất gần nhau) nhưng khác nhau về mặt ngữ nghĩa và thực tiễn (ta không bắt chúng nói và làm những việc giống nhau). Giống như trong Kinh thánh, anh em sinh đôi của những năm 1890 có hậu duệ là các công cụ, mà đối với một số người trong những năm 1980, cạnh tranh nhau. Các hình thức hoá toán học là gần nhau, nhưng những cách sử dụng chúng về mặt xã hội là khác biệt, cho dù Malinvaud mong muốn những cách này bổ sung cho nhau. Chẳng hạn, trong các cách đọc và bình luận các phân tích dữ liệu, chủ ngữ các động từ thường là các nhóm xã hội hay ngành kinh tế (những mục của các danh mục xã hội hay kinh tế) hay ngay cả các cá nhân, trong khi trong các phân tích quy nạp hay kinh trắc, các chủ ngữ là các biến mà một số “giải thích” những biến khác, theo một cách nhìn hướng dẫn để tư vấn và hành động, như Sir John Boreham nói rõ trong cuộc đối thoại với Malinvaud.

Xã hội học chiếm lĩnh phân tích những tương ứng

Kể từ những năm 1970, phân tích dữ liệu trở nên thật sự thịnh hành và chiếm lĩnh các khoa học xã hội như có thể thấy qua hai tạp chí khác nhau như Cahiers de l’analyse des données (tạp chí của Benzécri) và Actes de la recherche en sciences sociales (tạp chí của Pierre Bourdieu). Nhà thống kê học Benzécri và nhà xã hội học Bourdieu giữ những cương vị so sánh được với nhau trong các không gian của mình: là những nhà tiên tri và người tiên phong đổi mới, mỗi người trong lĩnh vực của bản thân, là những nhà phê phán ảnh hưởng Mĩ (thông qua sự hầu như độc quyền của tiếng Anh và của thống kê suy luận đối với Benzécri và của chủ nghĩa cấu trúc-chức năng rồi của lí thuyết Rational Action đối với Bourdieu). Với Bourdieu, phân tích những tương ứng xuất hiện, vào đầu những năm 1970, như đặc biệt thích hợp với cấu trúc của các “lãnh trường” như đã được chính ông lí thuyết hoá ngay từ những năm 1960. Benzécri và Bourdieu gặp nhau nhiều lần qua trung gian của Henri Rouanet[10], đặc biệt nhân một ngày về phân tích những tương ứng tổ chức tại Sorbonne tháng 11 năm 1978[11].

Nhưng vào khoảng cùng thời gian trên (giữa những năm 1970), phân tích dữ liệu theo kiểu Benzécri cũng đã được sử dụng để mô tả và phân tích không gian xã hội, trong nhiều bối cảnh khác nhau: nghiên cứu hàn lâm, INSEE, các doanh nghiệp công, công ti tư nhân về điều tra chọn mẫu, báo chí đại chúng. Dưới đây, chúng tôi thử trình bày và so sánh những cách sử dụng khác nhau này mà lợi ích là trùng khớp về thời gian (những năm 1970) và chủ đề (mô tả thế giới xã hội). Do đó ở đây ta có gần như một thí nghiệm của xã hội học thống kê vì ba biến (phương pháp, thời điểm, chủ đề nghiên cứu) được cố định.

Ngay từ đầu những năm 1970 này, các nhà xã hội học, nhưng cả các công ti nghiên cứu thị trường và báo chí (đặc biệt các news magazine hàng tuần) đã cảm nhận lợi ích của phân tích những tương ứng để mô tảbiểu trưng bằng cách hiển thị một không gian xã hội nhiều chiều so với những bảng số chéo nhau khô khan. Đối với họ các bảng này có vẻ ít tính tổng hợp và khó đọc hơn những sơ đồ được xây dựng từ các trục đầu tiên của các phân tích những tương ứng, mặc dù các trục này không thể hiện trực tiếp những nối kết hay tương quan giữa các biến. Như vậy một cách khác để các dữ liệu lên tiếng được phổ biến, khác với phương pháp giải thích, “tương quan” và mô hình hoá do thống kê bản sản sinh. Nhiều cuộc tranh luận (và hiểu lầm) trong những năm 1970 và 1980 là kết quả của sự thay đổi cách nhìn này.

Việc trình bày trên cùng một hình, những sự gần nhau tương đối giữa các nhóm xã hội (được xác định theo những cách đa dạng) và những đặc tính (theo xác suất) đi cùng các nhóm này, bản thân các đặc điểm này cũng được biểu trưng trên hình, khiến các sơ đồ có sức gợi ý cao. Ta biết những sai lầm kiến giải có thể do tính đơn giản biểu kiến này gây ra, đặc biệt do chỉ một phần của thông tin và của phương sai những dữ liệu cơ bản được phép chiếu trên các trục đầu tiên giữ lại. Hơn nữa sự gần nhau giữa một điểm “nhóm xã hội” và một điểm “đặc tính” không trực tiếp là một điều có ý nghĩa: duy chỉ hệ thống đầy đủ những vị trí tương đối mới có ý nghĩa. Nhưng vấn đề ở đây là xem xét những giả thiết về các lí do (được một số người đánh giá là tốt hay xấu) của sự thành công trong những năm 1970 của hình dạng bản đồ xã hội này, độc lập với những “sai lầm” hay xấp xỉ đáng tiếc đôi lúc phạm phải. Sự phổ biến của tin học và những phần mềm đầu tiên chéo hoá các ma trận có vai trò thiết yếu trong cao trào đột ngột này của phân tích những tương ứng. Thật vậy, trước đây, không thể nào tìm các vectơ riêng của những ma trận có một số vô cùng lớn những cột và dòng.

Phân tích dữ liệu, trình bày (hay không) từ những công trình của Benzécri và từ luận án tiên phong được bảo vệ năm 1964 của Brigitte Cordier (Bà Escoffier) được nhập vào các khoa học xã hội vào cuối những năm 1960, đặc biệt do Ludovic Lebart nhập về Credoc (Lebart, 1969), rồi do Michel Volle nhập về INSEE (Annales de l’Insee, n° 1970). Đó có thể là phân tích những thành phần chính (Bensaid, 1970; Desrosières, 1972), phân loại từ dưới lên hay từ trên xuống (Guibert, Laganier, Volle, 1971), phân tích những tương ứng đơn nhằm vào một bảng tiếp liên, tức một bảng phân phối một tổng thể theo hai tiêu chí cộng tính (ví dụ, theo thành phần xã hội và tỉnh cư trú). Tiếp đó phân tích những tương ứng bội cho phép mở rộng phương pháp để khai thác một điều tra qua các câu hỏi, bằng cách xây dựng một bảng phân liệt đầy đủ: trên các dòng là những cá nhân trả lời các câu hỏi và trên các cột là tất cả những tiết mục có thể của tất cả các hỏi và được mã hoá đầy đủ. Những đặc tính của một phân tích những tương ứng một bảng như thế (chỉ gồm có những số 0 và 1 và do đó kích cỡ là rất lớn) được nghiên cứu vào chi tiết, đặc biệt bởi Lebart, Morineau và Tabart (1977). Đặc biệt, ta có thể phân biệt những biến hoạt động góp phần vào việc xác định các trục nhân tố và những biến minh hoạ tuy không góp phần vào việc này nhưng có thể được phóng chiếu và hiển thị trong không gian của các trục này. Khả năng này sẽ được các nhà xã hội học tận dụng nhiều. Ví dụ, những hành vi xã hội được xử lí là những biến hoạt động và những thành phần xã hội là những biến minh hoạ. Điều này cho phép kiểm tra và xác nhận tính tương đối tổng quát của cấu trúc hai chiều của không gian xã hội được Bourdieu (1976 và 1979) làm cho nổi tiếng, nhưng cũng được nhiều công trình khác, độc lập với tác giả, trước và sau ông nêu bật.

Không gian này được một “trục lớn”, trục giải thích phần lớn phương sai của những dữ liệu ban đầu, đối lập các giới bình dân và các giới được ưu đãi, cấu trúc nên. Không gian này tương ứng với bậc thang xã hội một chiều kinh điển của xã hội học định lượng Anh. Nhưng phân tích những tương ứng cho phép làm hiện lên một trục thứ hai, ít cổ điển hơn, trực giao với trục đầu, đối lập những thành phần có học, sống ở đô thị và gần với khu vực công với những thành phần khác, thường là không làm công ăn lương, sống ở nông thôn hay gần với thế giới của những doanh nghiệp nhỏ. Quả thật là danh mục Pháp những phân loại xã hội-nghề nghiệp do INSEE đề xuất trong những năm 1950 và kể từ đó được các nghiên cứu thực nghiệm về xã hội Pháp sử dụng rộng rãi, đã tạo điều kiện thuận lợi cho việc định hình cấu trúc này và việc so sánh giữa những nghiên cứu về những chủ đề vô cùng khác nhau (Desrosières và Thévenot, 2002). Với những biến thể khác nhau, cấu hình không gian xã hội này, xuất hiện, một cách ít nhiều trực tiếp, ngay trong các phân tích những tương ứng đầu tiên, vào khoảng năm 1970.

Chẳng hạn, trong phiên bản đầu tiên, in ronéo năm 1970, của cuốn Phân tích dữ liệu, Benzécri đặt cạnh nhau hai phân tích về Paris, một phân tích của J. P. Briane về những kết quả ở Paris của vòng dầu bầu cử tổng thống năm 1969, và một phân tích khác của J. P. Nakache về cấu trúc xã hội-nghề nghiệp của Paris “vào khoảng năm 1955”. Về phân tích bầu cử, trục đối lập, không có gì ngạc nhiên, các quận 7, 8 và 16 bầu cho Pompidou và Poher (ứng viên trung dung) với các quận 11, 18, 19, 20 bầu cho Duclos (ứng viên cộng sản). Nhưng trục thứ hai bộc lộ một sự đối lập ít tầm thường hơn, và đó không gì khác hơn là sự đối lập nói đến ở trên và sẽ được nhiều phân tích sau này trong các năm 1970 làm rõ:

“Trên trục thứ hai, chúng tôi tin là đã nhận thấy những sự phân biệt thường được nêu. Trên phương diện chính trị, là Rocard được sự ủng hộ của một giới trung lưu trí thức sống ở quận 6, đối lập với Ducatel mà vùng ảnh hưởng bao gồm những thành viên thuộc một giới trung lưu khác như các nghệ nhân và tiểu thương hoạt động trong các khu cũ như trong chợ Halles và khu Bastille. Một bên là một khu tuy không hẳn là biệt thự nhưng có ít xưởng và tiệm bán buôn và một bên là một mê cung độc đáo mà Hausmann đã không xoá sổ thành công và có lẽ sẽ tiếp tục sống sót ở chợ Rungis... Trên bản đồ chính trị, chỉ có các quận 5, 6, 13, 14 và 15 là nằm dưới trục thứ nhất, với Rocard và Krivine...” (Benzécri, 1970).

Kể từ thời điểm này, phân tích những tương ứng sẽ được ba giới khá khác nhau sử dụng rộng rãi để sản xuất, một mặt, những bản đồ và, mặt khác, những loại hình của thế giới xã hội, mặt này bổ sung cho mặt kia. Thật lí thú khi so sánh phong cách, lập luận và thuật hùng biện được ba thế giới này vận dụng. Việc cầu viện đến phân tích những tương ứng trong những năm 1970 là dịp để làm điều này[12]. 1) Những công ti nghiên cứu tiếp thị và công ty thăm dò dư luận bằng các cuộc điều tra chọn mẫu [Cofremca, Aesop/Agoramétrie, CCA, ...] nhanh chóng chiếm lĩnh phân tích những tương ứng để phục vụ báo chí, các chính đảng hay doanh nghiệp. Phong cách trình bày vừa đơn giản vừa nhiều tưởng tượng. Ít chi tiết được cung cấp về các phương pháp thu thập và xử lí dữ liệu. 2) Nghiêm cứu hàn lâm tìm thấy ở phân tích này một công cụ mạnh để triển khai và đưa ra ánh sáng những khái niệm lí thuyết, ví dụ, như đối với xã hội học của Bourdieu, là lãnh trường, habitus và cấu trúc của vốn. 3) Sau các công trình tiên phong của CREDOC về “Hình thái học xã hội của các đơn vị cấp xã ở đô thị” (Lebart, Tabard, 1971), hệ thống thống kê công cộng và những trung tâm gần với hệ thống này (INSEE, INED, CREDOC) sử dụng công cụ này để khai phá những tệp tin của các cuộc điều tra của mình với một phong cách kĩ thuật và khô khan hơn. Trong trường hợp này, các phương pháp luận toán học được làm rõ hơn là trong trường hợp của hai thế giới trên.

Máy tính xác thực Kinh thánh

Ba năm lên tiếp, từ 1973 đến 1975, tuần san Le Nouvel Observateur đăng dưới tựa “Giá của một người Pháp” nhiều nghiên cứu dài nhằm vào một danh sách chi tiết các ngành nghề để so sánh những thu nhập, bất lợi, đặc quyền và những đường sự nghiệp thường gặp của các ngành nghề này. Nhiều bản đồ lớn được in cùng mà phương pháp được giới thiệu, vào tháng chín năm 1973, như sau:

“Ba bản đồ được gọi, trong ngôn ngữ của nhà thống kê, là một “phân tích dữ liệu”. Chúng biểu trưng ba khía cạnh khác nhau của cùng một hình ảnh: hình ảnh của một khối lượng khổng lồ có 18 chiều trong đó dịch chuyển, như bấy nhiêu thiên hà trong không gian, 150 ngành nghề được xem xét. Vị trí của mỗi thiên hà là một thoả hiệp phức tạp giữa những dạng ít nhiều hấp dẫn của 18 tiêu chí được chúng tôi chọn để vẽ nên “hình dạng” của mỗi một nghề: lề thói, việc làm an toàn, thời gian rảnh rỗi, không cực nhọc về thân thể, bằng cấp, hứng thú của công việc, triển vọng trong tương lai, tự do trong công việc, thù lao-lương bổng, ưu đãi bằng hiện vật, cạnh tranh, kinh nghiệm, tinh thần doanh nghiệp, đóng góp tài chính ban đầu, tránh thuế. Chẳng hạn, điểm “giáo viên tiểu học” được cực “việc làm an toàn” thu hút nhiều hơn là cực “tránh thuế” hay cực “cạnh tranh”, sẽ nằm ở phía cưới bên trái trong lúc một công chứng viên ở Paris, vừa có những lợi thế tài chính lẫn sự thoả mãn mà uy tín mang lại, sẽ nằm giữa sự trọng vọng và tiền bạc.

Do đó, khối lượng khổng lồ này được máy tính vẽ lại trên giấy nhờ những tính toán khéo léo nhưng vẫn giữ lại những khác biệt quan sát được giữa các ngành nghề vẽ lên một bản đồ dưới dạng bình đồ trong đó những mặt trời kéo theo xung quanh chúng những hệ thống hành tinh. Tại sao tất cả các mặt trời này đều được “phóng chiếu” trên đường thẳng của bản đồ? Đó không phải là điều ngẫu nhiên nhưng mà do điều được các nhà kinh tế gọi là “hiệu ứng Mathieu”, người viết Kinh thánh từng nói: “Đối với ai đã có tất cả, mọi thứ sẽ được cho thêm nữa. Và đối với ai không được bao nhiêu, mọi thứ sẽ bị thu hồi!”. Hai mươi thế kỉ sau, máy tính xác thực Kinh thánh khi đặt vào vùng bên phải hầu hết những lợi thế vật chất và tinh thần, máy tính chứng minh điều ta đã biết từ lâu: trong thế giới đầy bất công của chúng ta, các lợi thế được cộng dồn và tiếc thay các bất lợi cũng thế!

(Josette Alia, Le Nouvel Observateur, 24 tháng chín năm 1973, trang 52).

Có thể so sánh ý tưởng “cộng dồn các lợi thế”, tất nhiên là chính xác và được phản ánh trong trục thứ nhất “giải thích” phần lớn phương sai, với “nhân tố g” của Spearman trong tâm lí học. Những phân tích sau này, bằng những phương pháp luận đa chiều, cho phép triển khai những không gian phức tạp hơn. Trong thực tế, vào tháng chín năm 1974, tuần san tiếp tục loạt bài “Giá của một người Pháp” và kết hợp phân tích những tương ứng với sự phân loại, để trình bày một mặt, một bản đồ làm hiện lên rõ ràng hai trục và, mặt khác, trên bản đồ này những tập các thành phần xã hội hợp thành “5 nước Pháp” được bài viết mô tả thể theo vị trí của chúng. Một chi tiết lí thú: sự dàn trang đã thay đổi. Trong khi các phân tích của năm 1973, một cách cổ điển, được trình bày với trục thứ nhất nằm ngang và trục thứ nhì đứng thẳng thì năm 1974, ngược lại, xuất hiện một phiên bản về mặt xã hội học nói rõ ràng hơn. Trục thứ nhất, tương ứng với “thang bậc xã hội” đứng thẳng, còn trục thứ hai đối lập bên phía trái những thành phần có bằng cấp và gần với khu vực công với những thành phần có vốn kinh tế ở bên phía phải thì nằm ngang. Một hình vẽ của Wiaz tóm tắt cách nhìn này, với hai người leo cây, một người ở bên trái thân cây trèo lên từ những bằng cấp, và một người (đội mũ cao thành) ở bên phải thân cây trèo lên từ một đống tiền. Như vậy ngôn ngữ của bản đồ thống kê được thể hiện bằng hình ảnh của ngôn ngữ báo chí.

Hình 1: Không gian xã hội 2 chiều, dưới con mắt của nhà hình hoạ Wiaz năm 1974

(Le Nouvel Observateur, “Giá của một người Pháp”, 16 tháng 9 năm 1974, trang 65)

“Máy tính tạo ra một đám mây mà khi in trên giấy hiện ra như được kéo dài dọc theo một trục thẳng đứng. Trục này, nói như nhà thống kê, là “trục nhân tố” đầu tiên bị thu nhập “khống chế”. Ở phía dưới là những ai thu nhập ít nhất. Ở phía trên là những ai thu nhập nhiều nhất. Ở bên phải là những ai có được nghề nghiệp nhờ di sản họ nhận được nhưng họ không được đào tạo cao: đó là những người “độc lập”, con đường thăng tiến tư bản chủ nghĩa. Ở bên trái, ngược lại, là những làm công ăn lương và thăng tiến nhờ bằng cấp của họ. Có tất cả năm nhóm khác biệt nhau rõ ràng. Từ dưới lên trên: những người bị bóc lột, những nhà tư bản nhỏ, các tầng lớp trung lưu làm công ăn lương, những nhà tư bản truyền thống. Và tận cùng trên cao là giới được gọi là “kĩ trị”, giới “tinh hoa trí thức”.

(FranVois-Henri de Virieu, Le Nouvel Observateur, 16 tháng 9 năm 1974, trang 6)

Năm 1975, nghiên cứu vẫn tiếp diễn. Trong khoảng thời gian trên, phương pháp “phân tích nhân tố” được tập san sử dụng bị phê phán. Định đề tính độc lập và trung lập [của phân tích dữ liệu - ND] đối với mọi mô hình tiên nghiệm bị đặt thành vấn đề, cho dù chỉ thông qua danh mục xã hội-nghề nghiệp được sử dụng, vốn đã là một mô hình trong số những mô hình của thế giới xã hội. Như vậy, tờ báo nói rõ quan điểm của mình về công cụ thống kê như sau:

“Lợi thế của phân tích nhân tố là cho phép xử lí đồng thời một số lượng lớn thông tin. Có thể dùng một chùm những lập luận và tránh bất tiện chính của những “mô hình” toán học cổ điển buộc người sử dụng phải lạm dụng những đơn giản hoá cho một thực tại xã hội-kinh tế mà theo định nghĩa là phức tạp. Mặc dù có những lợi thế nhưng phân tích này là một kĩ thuật không hoàn hảo. Phân tích không phải là một công cụ trung tính vì đặt cơ sở, trong một số điều khác, trên ba điều tiên nghiệm:

1)   “Metric” được sử dụng là metric của “Chi 2”, nghĩa là những khoảng cách giữa hai điểm là kết quả của những so sánh theo phần trăm. Tất cả mọi thứ trở thành so sánh được nhưng lại bỏ qua không tính đến ý niệm kích cỡ [...].

2)   Phương pháp không sắp xếp các “biến” theo thứ bậc được. Trong phân tích, việc bị thất nghiệp là một “thông tin” không quan trọng hơn việc thường đi xem phim [...].

3)   Phương pháp sử dụng những toán học đặt nền tảng trên nguyên lí không mâu thuẫn: ta ở xa hơn, cao hơn, bên tả hơn, bên hữu hơn nhưng ta không bao giờ là cái gì khác. Điều này loại bỏ sự mâu thuẫn, xung đột vốn là cơ sở của trò chơi xã hội.”

(Alain Duhameau[13], Le Nouvel Observateur, 16 tháng 9 năm 1974)

Tư duy theo các quan hệ

Trong một thế giới hoàn toàn khác, và chắc chắn là độc lập, xã hội học hàn lâm khám phá lợi ích của phân tích những tương ứng vào khoảng năm 1975. Bourdieu và những nhà nghiên cứu thuộc Trung tâm xã hội học châu Âu (CSE) tập trung vào việc phân tích hệ thống phức tạp những quan hệ giữa các giai cấp xã hội, những thị hiếu và thực hành của các giai cấp thì thấy ở phân tích này một công cụ mạnh để hiển thị các quan hệ trên. Thật vậy, lí thuyết các lãnh trường mô tả các tác nhân xã hội trên quan điểm những so sánh lẫn nhau của họ về những vị thế tương đối của mỗi tác nhân, trong những không gian ảo các quan hệ, mỗi tác nhân được đặc trưng bằng “habitus” của bản thân, những đặc tính sở đắc và được nội tâm hoá định hướng (theo xác suất) các đánh giá và hành vi. Phân tích những tương ứng được tổ chức theo quan điểm những quan hệ giữa những thực hành được ghi nhận về mặt thống kê trong các cuộc điều tra, và chính xác hơn của những phép thấu xạ giữa không gian các nhóm xã hội và các không gian của những thực hành. “Phải tư duy theo các quan hệ”, đó là khẩu hiệu lấy cảm hứng từ hai tác phẩm Triết học những hình thái biểu tượng của Cassirer và Kiến trúc gôtích và tư duy kinh viện của Panofsky, mà Bourdieu đã giữ lại khái niệm habitus trong lời tựa cho bản dịch tiếng Pháp của tác phẩm sau. Bourdieu nhiều lần nói đến mối quan tâm của ông đối với phương pháp của Benzécri:

Tôi sử dụng nhiều phương pháp phân tích những tương ứng vì nó chủ yếu là một quy trình các quan hệ mà triết lí thể hiện hoàn toàn điều, theo tôi, cấu thành thực tại xã hội. Quy trình này “tư duy” bằng những quan hệ như tôi đã cố gắng làm với khái niệm lãnh trường” (Bourdieu, lời tựa cho bản dịch tiếng Đức cuốn Le métier de sociologue, 1991, dẫn theo trang của Henri Rouanet).

Ở nơi khác, ông phản bác sự đối lập giữa “phương pháp thuần tuý mô tả” và “phân tích hồi quy” trong mức độ mà, theo ông, phương pháp “giải thích” các chiến lược của các tác nhân (bằng cách gán cho động từ “giải thích” một nghĩa chắc chắn là khá khác với nghĩa của các nhà kinh trắc, khi họ cô lập những “biến” gắn với những mục đích và phương tiện, trong những mô hình nhắm đến, trực tiếp hay không, những hành động vào thế giới):

Những ai biết các nguyên lí của phân tích những tương ứng bội sẽ hiểu sự tương hợp của phương pháp phân tích toán học này với tư duy bằng khái niệm lãnh trường. Một khi đã tính đến toàn bộ các tác nhân hiệu quả (cá nhân, và thông qua họ, các thể chế) và toàn bộ các đặc tính – hay cơ may – của nguyên lí hành động của họ có thể chờ đợi là phân tích những tương ứng, được sử dụng như thế, vốn không có gì là một phương pháp thuần tuý mô tả như những ai đối lập nó với phương pháp hồi qui muốn nhìn nhận như vậy, sẽ làm rõ cấu trúc của những sự tương phản hay, cũng là thế thôi, cấu trúc của sự phân phối các quyền lực và lợi ích đặc biệt quyết định và giải thích những chiến lược của các tác nhân” (Bourdieu, Các cấu trúc xã hội của nền kinh tế, 2000, trang 128, được Henri Rouanet trích dẫn).

(hình do người dịch bổ sung từ bài La distinction – Critique social du jugement trên wikipedia)

Trong thực tế, kể từ năm 1975, phân tích những tương ứng trở thành một trong những thương hiệu của phương pháp luận của CSE, hai mươi năm trước khi các nhà nghiên cứu của trung tâm này, chịu ảnh hưởng của Michel Gollac và Henri Rouanet, đề cập vấn đề những quan hệ giữa phân tích dữ liệu và các phương pháp hồi qui[14]. Sơ đồ của không gian xã hội 2 chiều được trình bày năm 1976 trong một số của tạp chí Actes de la recherche en sciences sociales dưới tựa Anatomie du goût, rồi được phát triển năm 1979 trong cuốn sách đồ sộ La distinction. Các trục được đặt tên: trục thứ nhất (thẳng đứng) thể hiện vốn toàn diện trong lúc trục thứ hai đối lập những thành phần có vốn văn hoá (bên trái) với những thành phần có vốn kinh tế (bên phải). Những tấm giấy trong suốt được đặt chồng lên bản đồ các thành phần xã hội. Các thị hiếu và cách thực hành văn hoá được biểu trưng trên các tờ trong suốt này. Điều được nói rõ là không phải sự gần nhau của hai điểm của mỗi một sơ đồ chồng lên nhau mà đúng hơn sự thấu xạ của các cấu trúc tương đối của toàn bộ hai hình ảnh mới là quan trọng[15].

Việc này được tiến hành, một mặt, cho toàn bộ không gian xã hội (trang 140-141 của La distinction) và, mặt khác, tách biệt cho mỗi một “biến thể của thị hiếu khống chế” (trang 296) và “biến thể của thị hiếu tiểu tư sản”. Nhưng điều nghịch lí là trong trường hợp của không gian xã hội đầy đủ, Bourdieu nói rõ là không thể trình bày một phân tích những tương ứng đích thực. Điều này được ông biện giải như sau:

Mặc dù chúng có một vài dáng vẻ của phân tích những tương ứng và việc dựng lên không gian xã hội đầy đủ cũng đã nhờ đến sự trợ giúp của các phân tích khác nhau này, và cho dù nhiều phân tích những tương ứng cũng sản sinh ra những không gian được tổ chức theo cùng một cấu trúc..., thì những sơ đồ trình bày ở đây không phải là những biểu đồ mặt phẳng của phân tích những tương ứng” (Bourdieu 1979, chú thích 139).

Luc Boltanski (1940-)

Ngược lại, còn với hai sơ đồ tương ứng với “thị hiếu áp đảo” và “thị hiếu tiểu tư sản” thì đây quả là những phân tích những tương ứng thật sự. Trong hai trường hợp này, các nhóm xã hội không được biểu trưng bằng những điểm nhưng bằng những đa giác có nhiều dạng khác nhau, nhắc nhở là mỗi nhóm tương ứng với một đám mây, nghĩa là một phân phối thống kê mà trọng tâm biểu trưng tốt nhất cho vị thế trung bình, chứ không cho sự phân tán. Cách hiển thị hoá này là một trong những khả năng có ích được những cách biểu trưng bằng bản đồ mà phân tích những tương ứng cung cấp. Mặt khác, giống như một cơ chế nối kết lại những mảng bị đứt gãy, có thể tìm lại được nguyên trạng cấu trúc của không gian đầy đủ bằng cách phóng to những vùng (chuyên gia: Boltanski 1982, trang 392-393; nghệ nhân: Zarka 1979, trang 10-11) hay một tiểu vùng (chủ doanh nghiệp lớn, giám mục, triết gia, nhà kinh tế). Một trong những lợi ích của phân tích những tương ứng bội là cho phép hiển thị rõ ràng vị trí của những cá thể mà thông tin cá nhân là công khai, như trường hợp của các thành viên của một số thế giới xã hội vi mô.

Các ví dụ trên về những cách mà xã hội học hàn lâm sử dụng phân tích dữ liệu dường như xuất phát chủ yếu từ nhóm của Bourdieu và từ một cách đặt vấn đề duy nhất, cách đặt vấn đề của lí thuyết các lãnh trường của ông. Trong thực tế quả đúng là vậy trong thế giới này (nhưng không đúng, như đã thấy, trong các thế giới khác) trong thời kì những năm 1970. Có thể nêu một trường hợp khác, rất sáng tạo, của một thành viên thuộc nhóm này (rồi sau này sẽ tách xa) là Luc Boltanski (1984). Trong một bài có tựa là La dénonciation, ông phân tích một tập thư gốc về những khiếu nại của bạn đọc gởi cho báo Le Monde. Ông đặt câu hỏi về việc tờ báo đánh giá tính bình thường của các lá thư này. Ông nhờ một số người đọc các lá thư này và cho điểm về mức độ bình thường hay “điên loạn” có thể của những lá thư này. Tiếp đó toàn bộ dữ liệu được ông xử lí bằng phân tích những tương ứng bội. Từ đó nổi lên ý niệm giá trị chung sau này sẽ ở cội nguồn của xã hội học các vụ việc và của trào lưu xã hội học thực dụng.

Ngân sách gia đình, hôn nhân, nhân trắc: những cách đọc khác không gian xã hội

Karl Popper (1902-1994)

Sự xuất hiện của cấu trúc hai chiều của không gian xã hội, trước và sau phân tích về các lãnh trường xã hội của Bourdieu, trong những bối cảnh vô cùng khác nhau cho thấy rằng sự táo bạo của tác giả (khi công bố một hình bóng của phân tích những tương ứng, đồng thời thừa nhận rằng đó chỉ là một vẻ bề ngoài của của phân tích này thôi) không phải là không có cơ sở. Có thể xem điều này như một giả thiết được xác thực sau đó (hay ít ra là không bị kiểm sai theo nghĩa của phương pháp luận của Popper). Có thể nêu ba ví dụ của sự hợp thức hoá này: 1) việc phân tích ngân sách các hộ gia đình, 2) sự gần nhau về mặt xã hội được phản ánh qua việc lựa chọn người phối ngẫu, và 3) những đo đạc cơ thể con người (chiều cao và cân nặng).

Như vậy các kết quả của phân tích những tương ứng cuộc điều tra “ngân sách gia đình” năm 1979 của INSEE tái hiện một cách trung thực cấu trúc các vị trí tương đối của những thành phần xã hội đã mô tả (Glaude và Moutardier 1982). Phân tích những tương ứng bội (ACM) tiến hành cho một bảng với ở mỗi hàng là một người trả lời điều tra và ở các cột là, một mặt, những chi tiêu khác nhau của người này được xử lí như những biến hoạt động của phân tích và, mặt khác, là những biến xã hội-kinh tế của người trả lời (thành phần xã hội-kinh tế, thu nhập, quy mô đơn vị đô thị, tuổi...) được phóng chiếu làm biến minh hoạ. Phân tích này bổ sung kiến giải từ nay quen thuộc của trục thứ hai trên bản đồ, một trục có tương quan tốt với các biến quy mô đơn vị đô thị và tuổi. Ba loại quy mô đơn vị đô thị (hơn 100.000 dân, nhỏ hơn 100.000 dân và xã ở nông thôn) nằm dọc theo trục này từ trái sang phải. Bốn lứa tuổi, từ trẻ nhất đến già nhất, cũng nm từ trái sang phải dọc theo trục này.

Phân tích những tương ứng cuộc điều tra “ngân sách gia đình” (M. Glaude và M. Moutardier Économie et statistique, n° 140, trang 160, tháng giêng năm 1982)

Lựa chọn người hôn phối là một chỉ báo tốt của sự gần nhau giữa các môi trường xã hội (Girard 1964). Có thể sử dụng điều này để lập một bản đồ không gian xã hội cho một thời kì mà hầu hết cắc cặp đều thành vợ chồng, và hộ tịch ghi nhận bốn thông tin về nghề nghiệp: nghề nghiệp của vợ và chồng và nghề nghiệp của bố họ. Khó sử dụng thông tin về nghề nghiệp của vợ chồng vì lúc họ cưới nhau chưa có thông tin này hay chưa được xác định. Trái lại thông tin về nghề nghiệp của bố họ rất có ý nghĩa về môi trường xuất thân của họ. Một phân tích những tương ứng đơn được tiến hành trên một bảng tiếp liên (21x21) chéo nhau 21 thành phần xã hội-nghề nghiệp của bố những người cưới nhau năm 1972 (Desrosières 1978). Đường chéo của bảng này rất đậm nét: tất nhiên tính đồng nhất xã hội là quan trọng. Nhưng phân tích cũng bộc lộ những sự gần nhau giữa các thành phần xã hội, và cho phép tái hiện không gian xã hội hai chiều đã trình bày[16].

Adolphe Quetelet (1796-1874)

Ta biết là, từ Quetelet, Galton và Pearson, chiều cao con người giữ một vai trò rất cao trong lịch sử thống kê. Thế mà một cách đơn giản để xây dựng không gian xã hội là sử dụng những đo đạc trung bình về các thành phần xã hội (Charraud 1981). Khi ghi trên trục hoành trọng lượng trung bình và trên trục tung chiều cao thì đám mây thu được rất tương tự với các đám mây được phân tích ở trên (và điều này không đòi hỏi bất kì phân tích những tương ứng nào). Chiều cao của một người trưởng thành biến thiên rất ít suốt cuộc đời, nhưng theo dòng các thế hệ, chiều cao trung bình tăng, và chiều cao của các giới được ưu đãi cao hơn chiều cao của các giới bình dân. Ngược lại, trọng lượng phụ thuộc rất nhiều vào những hành vi ăn uống và vận động cơ thể, vốn mang đậm tính xã hội. Việc có một sự đối lập rõ rệt hiện ra giữa, một mặt, các thành phần có bằng cấp và sống ở đô thị với, mặt khác, các giới chủ doanh nghiệp nhỏ cho thấy lợi ích của “trục thứ hai này” không được một xã hội học thường nghiệm biết đến vì thường qui giản không gian xã vội về một thang đo được cho là đồng nghĩa với thang thu nhập.

Hành vi bầu cử: từ đường phân giác này sang đường phân giác khác

Trên một trong những sơ đồ do tập san Le Nouvel Observateur công bố năm 1975 có sự can dự của một biến mới mà thông tin được thu thập từ những cuộc điều tra dư luận: phiếu bầu quốc hội năm 1973. Dõi theo trục thứ nhất từ trên xuống dưới, ta thấy có năm đảng chính trị. Những nhà Cộng hoà độc lập [RI] (thuộc đảng của Valéry Giscard d’Estaing) nằm ở phía trên cao của biểu đồ, trong vùng của những người hành nghề tự do (bác sĩ, luật sư - ND) và các chuyên gia cao cấp. Thấp hơn một chút trên trục này và ở gần trung tâm của biểu đồ là những nhà dân chủ thiên chúa giáo thuộc đảng của Lean Lecanuet ([CENTRE]). Đảng của De Gaulle [UDR] cũng nằm ngang hàng với [CENTRE], nhưng xa hơn về phía bên phải, gần cực của những người “không làm công ăn lương” trên trục thứ hai. Đảng xã hội [PS], đảng của FranVois Mitterand nằm thấp hơn ở phía dưới bên trái, bên cạnh các chuyên gia bậc trung, trong lúc đảng Cộng sản [PC] còn nằm ở phía dưới nữa, trong vùng của các công nhân.

Tất nhiên, cấu hình này phù hợp với những gì người ta biết về xã hội học bầu cử. Tuy nhiên cách trình bày hai chiều kích làm cho phân tích tinh tế hơn. Nói chung, hai khối chính trị lớn tả hữu (mỗi khối đều dồn gần 50% cho Mitterand hay Giscard d’Estaing trong cuộc bầu cử tổng thống năm 1974) được chia cắt trên biểu đồ, không phải bởi một đường nằm ngang mà bằng “đường phân giác thứ hai” Tây Bắc-Đông Nam: cử tri bầu cho Giscard d’Estaing thuộc về (theo xác suất) các tầng lớp trên và thành viên của nhóm người không làm công ăn lương (thương gia, nghệ nhân và nông dân) nhiều hơn, còn cử tri bầu nhiều cho Mitterand là công nhân, viên chức và giới trung lưu làm công ăn lương, đặc biệt là giáo chức. Các đảng cực tả không được hiển thị trên biểu đồ và đảng cực hữu Mặt trận quốc gia chưa ra đời. Kể từ năm 1985, đảng cực hữu này, bắt đầu có ý nghĩa về mặt bầu cử, sẽ làm cho sơ đồ đơn giản này thêm phức tạp, về mặt xã hội chắc chắn sẽ nằm trong góc phần tư Tây-Nam của biểu đồ, trong vùng các tầng lớp trung lưu và bình dân không làm công ăn lương hơn, sống ở nông thôn và các thị trấn nhỏ. Nhưng vào thời điểm đó, báo chí và các công ty thăm dò dư luận không còn sử dụng kiểu biểu trưng này nữa.

(Hình do người dịch bổ sung từ bài Analyse des données et sciences humaines: comment cartographier le monde social? của Alain Desrosières)

Hai mươi hay ba mươi năm sau, cách biểu trưng này về không gian xã hội có thể cho phép trình bày một cách sáng tỏ kết quả hai cuộc trưng cầu dân ý về châu Âu, một cuộc năm 1992 về thoả thuận Maastrich và một cuộc năm 2005 về Hiến pháp châu Âu. Các cuộc bỏ phiếu này gây hoang mang cho các nhà bình luận vốn quen thuộc với xã hội học bầu cử trước đây, vì các nhóm xã hội không được phân phối như trong các cuộc bầu phiếu đối lập cánh tả và cánh hữu. Trong trường hợp này, chính đường “phân giác thứ nhất” (Tây Bắc-Đông Nam), trực giao với đường “phân giác thứ hai” mới phân biệt (theo xác suất) những người trả lời “đồng ý” hay “không đồng ý” trong hai cuộc trưng cầu dân ý trên. Trong cả hai trường hợp, các tầng lớp trên, các thành phần có bằng cấp sống ở đô thị, những người làm công ăn lương trong khu vực công đã bỏ phiếu “đồng ý” nhiều hơn các thành phần bình dân, chủ doanh nghiệp nhỏ và những người sống ở nông thôn. Nhiều cuộc điều tra chọn mẫu tiến hành trong các năm 1992 và 2005 đã xác nhận điều này.

Trong những năm 1970 và 1980, các kĩ thuật phân tích dữ liệu được sử dụng trong một thế giới vô cùng khác với thế giới của nghiên cứu hàn lâm và thế giới của thống kê công nhằm định hình bản đồ những ý kiến và phong cách sống. Đó là công việc của những công ti nghiên cứu tư nhân mà khách hàng là những doanh nghiệp lớn. Có thể kể nhóm AESOP/Agoramétrie của Jean-Pierre Pagès, Trung tâm truyền thông cao cấp (CCA) của Bernard Cathelat và Coframca của Alain de Vulpian[17]. Khi xây dựng các không gian dư luận hay các phân loại phong cách sống, các tổ chức này giới thiệu những bản đồ có những quan hệ với những bản đồ trước đó, nhưng không sử dụng một cách có hệ thống tiêu chí xã hội-kinh tế, hay thậm chí còn bác bỏ rõ ràng nó vì cho là không xác đáng hay “lỗi thời” (trường hợp của CCA). Do đó không dễ kết nối chúng với toàn bộ các công trình đã được tập hợp ở trên. Tuy nhiên chúng đã góp phần rất nhiều cho sự nổi tiếng của phân tích dữ liệu trong thế giới kinh doanh. Chúng tôi đề cập dưới đây hai trường hợp của AESOP/Agoramétrie và của CCA.

Vào cuối những năm 1970, doanh nghiệp công Điện lực Pháp (EDF) lo ngại sự gia tăng của phong trào phản đối điện hạt nhân. Lúc bấy giờ EDF cho rằng đây là một vấn đề “cảm nhận” và dư luận phi lí của một bộ phận công chúng bị thông tin sai lạc. Nhưng để phân tích và hiểu sự lo lắng này, EDF cho là cần thiết phải tích hợp vấn đề này vào một nghiên cứu rộng hơn về những xung đột dư luận xuyên suốt xã hội Pháp. Thừa hưởng một truyền thống quan trọng về nghiên cứu các khoa học xã hội (Meynaud 1996), doanh nghiệp cầu viện Hiệp hội nghiên cứu các cấu trúc của dư luận công khai (AESOP). Hiệp hội này tập hợp những thành viên của các cơ quan lớn hay doanh nghiệp để tiến hành nghiên cứu chung về công tác truyền thông và do Bernard Cazes thuộc Uỷ ban kế hoạch Nhà nước làm chủ tịch[18]. Từ năm 1977 đến năm 1984, AESOP tiến hành bảy cuộc điều tra dư luận ở quy mô toàn quốc về “khoảng năm mươi câu hỏi ý kiến xoay quanh những cuộc xung đột có tính thời sự” thuộc các chủ đề “hiện tượng xã hội” (như tôn giáo, phá thai, quảng cáo, điện hạt nhân, điện mặt trời, tư pháp, kiểm duyệt, đồng tính, nghiệp đoàn, bạo lực, gia đình, đình công, télématique[*],...). Những ai được phỏng vấn được định vị theo một hệ thống thứ bậc có 5 cấp.

Lévi-Strauss (1908-2009)

Một phân tích nhân tố cuộc điêu tra tháng ba năm 1981 cho ra hai không gian chồng lên nhau. Một không gian được đặt tên là “trời” là không gian của một mặt phẳng nhân tố các ý kiến phong phú và một không gian được đặt tên là “đất” trong đó có những đặc điểm xã hội-dân số học (Morland và Pagès 1984). Điều lí thú là so sánh phân tích này với các phân tích trước, mặc dù ở đây tất cả đều khác. Cả phân tích những phân tố của Benzecri lẫn lí thuyết các giai cấp xã hội và các thị hiếu của chúng của Bourdieu đều không được nhắc đến. Phương pháp được sử dụng là phân tích nhân tố của Spearman, và lí thuyết về các huyền thoại của Lévi-Strauss được viện dẫn dài dòng. Bản đồ những ý kiến được trình bày là rất phong phú. Bản đồ những đặc điểm xã hội giống với không gian xã hội đã được giới thiệu ở trên, với một sự đảo ngược thứ tự hai trục đầu tiên. Trục thứ nhất đối lập những người sống ở đô thị, có bằng cấp, trẻ, không có tôn giáo và bầu cho cánh tả với những người lớn tuổi sống ở nông thôn, công giáo, nông dân hay tiểu thương và bầu cho cánh hữu. Trục thứ hai, có vẻ ít có tính giải thích hơn. Trục thứ hai đối lập các chuyên gia cao cấp và công nhân chuyên nghiệp. Điều này xác nhận là, đối với việc phân tích các hiện tượng xã hội, “trục thứ hai” theo nghĩa của các phân tích trước (và ở đây thành trục thứ nhất) là đặc biệt hiệu quả.

Trường hợp của CCA của Bernard Cathelat gây bối rối hơn. Công ty này thành công trong việc làm cho phân tích dữ liệu nổi tiếng, từ những phân tích dữ liệu về những kết quả điều tra. Nhưng không thể có được thông tin, về những bảng câu hỏi cũng như về các phương pháp phân tích, do chúng là những “bí mật kinh doanh”. Những nhóm ad hoc, với những cái tên ưu tiên cho yếu tố tâm lí, được đại chúng hoá một cách khéo léo và có tham vọng thay thế tốt hơn các danh mục của INSEE bị đánh giá là lỗi thời. Từ trái sang phải của một trục đối lập “chủ nghĩa phiêu lưu” với “đặt vào lại trung tâm” ta thấy có những hạng người lợi dụng, tự do vô chính phủ, nghiệp dư, bịp bợm, hoạt động tích cực, năng động, biết chộp thời cơ, có trách nhiệm, có theo dõi, có đạo đức, vì công lợi, bảo thủ. Những nghiên cứu thị trường này gây nên nhiều cuộc tranh cãi gay gắt trong thế giới quản lí và quảng cáo, nhưng không được các nghiên cứu trong khoa hoc xã hội và thống kê công biết đến vì không thể nối khớp chúng với những kết quả khác. Trái lại, chúng được một số giới trong các định chế hành chính, như Bernard Cazes đã mời Cathalat phát biểu tại trước Uỷ ban kế hoạch hoá Nhà nước, quan tâm (Georgakakis 1997). Như vậy, logic cạnh tranh của các tổ chức tư nhân dẫn đến sự phân tán các sản phẩm và không thể nào toan tính cộng đồn những kết quả của các phân tích dữ liệu này.

Những đạo đức khoa học khác nhau?

Một nhà thống kê Mĩ được mời tham gia số đặc biệt này của Electronic Journal for History of Probability and Statistics về phân tích dữ liệu đã có một nhận xét thú vị. Đồng nhất phân tích dữ liệu theo kiểu Pháp với “exploratory data analysis”. Ông nói thêm: “Khía cạnh của phân tích dữ liệu kiểu này mà tôi quan tâm là khó khăn trong việc hoà giải phân tích này với đạo đức vốn đòi hỏi đặt giả thiết TRƯỚC khi tiến hành thí nghiệm hay điều tra và thu thập dữ liệu”. Có thể cách nhìn này là kết quả của sự căng thẳng nêu trên giữa một mặt, các kĩ thuật thống kê mô tả và khai phá, và mặt khác, thống kê suy luận quy nạp mà Malinvaud nhấn mạnh tính bổ sung nhau vào năm 1970. Nhà thống kê trên có thể nghĩ đến những chuẩn nghiên cứu và công bố trên các tạp chí khoa học, và bối cảnh publish or perish của các đại học Mỹ. Các chuẩn này đặt nền tảng trên chuỗi: giả thiết lí thuyết, thử nghiệm hay điều tra được xây dựng trên cơ sở của giả thiết này, kiểm định để xác thực (hay kiểm sai) giả thiết, rồi nếu các kiểm định là có ý nghĩa thì công bố và cuối cùng (quan điểm xã hội học hơn là khoa học luận) cải tiến vị trí của nhà nghiên cứu trên thị trường công việc hàn lâm. Trong khuôn khổ này, những phương pháp kiểu data mining, vốn tìm kiếm một cách máy móc các tương quan tốt nhất và hồi quy có ý nghĩa nhất để, tiếp sau đó, mới đặt những giả thiết được xác thực một cách kì diệu bởi các quan hệ được chọn lọc một cách cẩn thận này tất nhiên hiện ra là không trung thực. Lệch lạc này, được các nhà kinh trắc gọi là “độ lệch Lowell”, sẽ xói mòn sản xuất khoa học trung thực (Armatte và Desrosières 2000).

Có thể phân tích khai phá dữ liệu kiểu Pháp được cảm nhận, trong bối cảnh Anh-Mĩ, qua lưới đọc của logic theory drived này (do lí thuyết hướng dẫn) - ND), đi cùng với khoa học luận thống trị về kiểm sai. Tuy nhiên, trong ví dụ được phát triển ở đây, việc các phân tích những tương ứng trên những dữ liệu vô cùng đa dạng, dồn dập trong những năm 1970, xác thực cấu trúc hai chiều của không gian xã hội, lúc khởi đầu không do một kiến tạo lí thuyết gợi ý. Phân tích khai phá đã chứng tỏ tính ổn định tương đối của nó. Điều cũng đúng là, kể từ những năm 1980, cách khai phá và mô tả dữ liệu này dần dần được thay thế, trong xã hội học định lượng, dần dần bởi các phương pháp hồi qui logistic (mô hình Logit), đặt cơ sở trên ý tưởng “hiệu ứng thuần tuý của các biến” hơn là trên ý tưởng đồng xuất hiện những đặc tính của các tác nhân và nhóm xã hội[19]. Cần xây dựng một xã hội học về những cách sử dụng xã hội các kĩ thuật thống kê khác nhau, có tính khai phá và quy nạp, vượt lên trên những so sánh thuần tuý về phương pháp luận và khoa học luận của chúng vốn quen thuộc với các nhà thống kê.

Ta vừa thấy nhiều ví dụ về tính đa dạng của những cách sử dụng này. Liệu có thể suy ra rằng phân tích dữ liệu “thiên tả” hơn các phương pháp giả thiết-diễn dịch như kinh trắc học, như vài tác giả từng nghĩ vậy vào khoảng năm 1970? Một cách thứ yếu, có thể nhận xét là bản thân Benzécri tự nhận mình là một người công giáo truyền thống. Nghiêm túc hơn, Malinvaud nhắc lại là trong những năm từ 1930 đến 1940, kinh trắc học được tiếng là “thiên tả” do những sử dụng đầu tiên của bộ môn này là vào việc kế hoạch hoá (Frisch, Tinbergen) hay vào các chính sách can thiệp và mô hình hoá keynesian (Lawrence Klein). Bằng hiệu ứng các cân, kinh trắc học mới về các chuỗi thời gian (Sims) đã phát triển những kĩ thuật không đặt cơ sở trên những mô hình hoá tiên nghiệm mà trên việc khai phá những tự tương quan trong nội bộ các chuỗi này (Renault 1999). Điều này cho thấy những liên kết có thể của một kĩ thuật với một tuỳ chọn chính trị chủ yếu có tính lịch sử. Tuy nhiên, những cuộc tranh luận xung quanh hai luận chứng được nêu lên vào khoẳng năm 1970 về một kiến giải chính trị cho phân tích dữ liệu (vị trí hàng đầu của việc khai phá và mô tả, tính đa chiều) đều có mặt trong lời tường thuật rất không đầy đủ về những cách sử dụng phân tích này trong những năm 1970 và 1980. Sự căng thẳng giữa mô tả và quy nạp nằm ở trung tâm của lịch sử sử dụng thống kê trong các khoa học xã hội.

Thư mục

A.E.S.O.P., 1985, Les structures de l’opinion publique en 1984, Agoramétrie, Fontenay aux Roses.

ARMATTE M., 1991, “Une discipline dans tous ses états: la Statistique à travers ses traités (1800-1914), Revue de synthèse, IVème série, n°2, avril-juin, pp. 161-206.

ARMATTE M., 2006, “Les images de la statistique à travers ses traités, Journal Electronique d'Histoire des Probabilités et de la Statistique, Vol. 2, n°2, Décembre, 2006.

ARMATTE M., DESROSIERES A., 2000, “Méthodes mathématiques et statistiques en économie: nouvelles questions sur d'anciennes querelles”, in J.P. Beaud et J.G. Prévost (éds), L'ère du chiffre. Systèmes statistiques et traditions nationales, Presses de l'Université du Québec, Montréal, pp; 431-481.

BENSAÏD A., 1970, “Niveau nutritionnel des populations gabonaises. Une analyse en composantes prinicipales”, Annales de l'INSEE, n° 4, pp. 11-45.

BENZECRI J.P (éd.)., 1970, L’analyse des données (multigraphié). Recueil de textes divers.

BLASIUS J., GREENACRE M., GROENEN P, VELDEN M. van de, 2008. “CARME-N, Correspondence Analysis and Related Methods Network, Bulletin de Méthodologie Sociologique, 99, pp. 73-81. Voir: http://www.carme-n.org/

BOLTANSKI L., 1982, Les cadres. La formation d'un groupe social, Editions de Minuit, Paris.

BOLTANSKI L., avec Y. DARRE et M.A. SCHILTZ, 1984, “La dénonciation, Actes de la recherche en sciences sociales, n° 51, pp. 3-40.

BOURDIEU P., avec M. de SAINT MARTIN, 1976, “Anatomie du goût, Actes de la recherche en sciences sociales, n° 5, pp. 2-81.

BOURDIEU P., 1979, La distinction. Critique sociale du jugement; Editions de Minuit, Paris.

BOURDIEU P., 1991, Préface à l’édition allemande du Métier de sociologue.

BOURDIEU P., 2000, Les structures sociales de l’économie, Seuil, Paris.

CASSIRER E., 1972, Philosophie des formes symboliques (3 volumes); Editions de Minuit,

CHARRAUD A., 1981, “La taille et le poids des Français Économie et Statistique; n° 132, p. 23-38.

CORDIER B. (Mme ESCOUFIER), 1965, Analyse factorielle des correspondances, thèse de 3ème cycle, Université de Rennes.

DESROSIERES A., 1972, “Un découpage de l'industrie en trois secteurs, Economie et Statistique, n° 40, pp. 25-39.

DESROSIERES A., 1978, “Marché matrimonial et structure des classes sociales, Actes de la recherche en sciences sociales, n° 20-21, pp. 97-107.

DESROSIERES A;, 2001, “Entre réalisme métrologique et conventions d'équivalence: les ambiguïtés de la sociologie quantitative, Genèses, n° 43, pp. 112-127.

DESROSIÈRES A. và THÉVENOT L., 1998, Les catégories socioprofessionnelles, La Découverte, coll. Repères.

DEVILLE J.C., 1977, “Analyse harmonique du calendrier de constitution des familles en France. Disparités sociales et évolution de 1920 à 1960, Population, n°1, janvier-février, trang 17-63.

DEVILLE J.C., MALINVAUD E., 1983, “Data Analysis in Official Socio-economic Statistics, Journal of the Royal Statistical Society, A, Vol. 146, Part 4, pp. 335-361.

FRISCH R., 1934, Statistical Confluence Analysis by Means of Complete Regressions Systems, University Institute of Economics, Oslo.

GEORGAKAKIS D.,1997, “Une science en décalage? Genèses et usages des “socio-styles” du Centre de communication avancée (1972-1990), Genèses, n° 29, pp. 51-72.

GIRARD A., 1964, Le choix du conjoint, PUF, Paris.

GLAUDE M., MOUTARDIER M., 1982, “Les budgets des ménages, Économie et statistique, n° 140, pp. 15-34.

GOULD S.J., 1983, La mal-mesure de l'homme. L'intelligence sous la toise des savants. Ramsay, Paris.

GREENACRE M. và BLASIUS J. (chủ biên), 1994, Correspondence Analysis in the Social Sciences. Recent Developments and Applications, Academic Press, London.

GUIBERT B., LAGANIER J., VOLLE M., 1971, “Essais sur les nomenclatures industrielles”, Economie et statistique, n0 20, trang 23-36.

LEBART L., 1969, “Introduction à l'analyse des données”, Consommation/Revue de socioéconomie, n° 3, pp 57-96, et n°4, pp. 65-87.

LEBART L., TABARD N. 1971, “La morphologie sociale des communes urbaines”, Consommation/Revue de Socio-Economie, n0 2, pp. 97-107.

LEBART L., MORINEAU A., TABARD N., 1977, Techniques de la description statistique, Dunod, Paris.

MACKENZIE D., 198, Statistics in Britain, 1865-1930. The Social Construction of Scientific Knowledge, Edinburgh University Press, Edinburgh.

MALINVAUD E., 1970: “L'analyse des données. Statistique inductive, statistique descriptive”, Annales de l'INSEE, n° 4, mai-septembre, pp. 3-8.

MARCUSE H., 1968, L'homme unidimensionnel, Editions de Minuit, Paris.

MARTIN O., 1997, La mesure de l’esprit. Origines et développements de la psychométrie, 1900-1950, L’Harmattan, Paris.

MEYNAUD H. (éd), 1996, Les sciences sociales et l’entreprise: cinquante ans de recherche à EDF, La Découverte, Paris.

MORGAN M.S., 1990, The History of Econometric Ideas, Cambridge University Press, Cambridge.

MORLAT G, PAGES J.P., 1984, Le ciel et la terre. Une approche structuraliste des opinions: le baromètre AESOP. Pièce en trois actes, présentée au Colloque de l’IDATE à Montpellier en 1984.

NETUMIERES F. des, 1997: “Méthode de régression et analyse factorielle, Histoire et Mesure, CNRS, Vol. XII, n° 3/4, pp. 271-298.

PAGES J.P., CAILLIEZ F., ESCOUFIER Y., 1979, “Analyse factorielle: un peu d'histoire et de géométrie, Revue de statistique appliquée, Vol. XXVII, n°1, pp. 5-28.

PANOFSKY E., 1967, Architecture gothique et pensée scolastique, Editions de Minuit, Paris.

PORTE J., 1954, “Une enquête par sondage sur l'auditoire radiophonique”, Bulletin mensuel de statistique, supplément janvier-mars, INSEE, p. 31-58.

RENAULT E., 1998, “Le calibrage ou une controverse sur la place de la statistique dans la modélisation économique”, La Lettre du CREST, 28, INSEE, Paris.

ROUANET H., LEBARON F., LE HAY V., ACKERMANN W., LE ROUX B., 2002, “Régression et analyse géométrique des données: réflexions et suggestions, Mathématiques et sciences humaines, n° 160, pp. 13-45.

ROUANET H., LEBARON F., 2006: “La preuve statistique: examen critique de la régression”, communication au séminaire “Qu'est-ce que Faire preuve?”, CURAPP, 5 mai 2006

SCHILTZ M.A., 1990, “Influence du choix des traitements statistiques sur les opérations élémentaires dans un dépouillement d'enquête: hypothèses, codage et sélection des variables”, communication au Congrès de l'Asociation internationale de sociologie, Madrid, juillet 1990. Etude reprise sous forme modifiée dans Greenacre et Blasius (1994), Correspondence Analysis in the Social Sciences, Academic Press, London.

SPEARMAN C., 1904, “General Intelligence Objectively Determined and Measured”, American Journal of Psychology, n° 15, pp. 201-293.

THURSTONE L.L., 1935, The vectors of mind, University of Chicago Press, Chicago.

VOLLE M. et alii, 1970, “L’Analyse des données et la construction des nomenclatures d’activités économiques de l’industrie”, Annales de l’INSEE, n° 4, pp. 101-131.

VOLLE M., 1980, Analyse des données, Economica, Paris.

ZARCA B., 1979, “Artisanat et trajectoires sociales, Actes de la recherche en sciences sociales, 29, pp. 3-26.

Nguyễn Đôn Phước dịch

Nguồn: “Cartographies de la société: l’analyse des données”, chương 9 cuốn Prouver et gouverner. Une analyse politique des statistiques publiques của Alain Desrosières, Paris, La découverte, 2014, trang 183-211.

----

Bài có liên quan:




Chú thích:

[1] Chương này đã được công bố dưới tựa “Analyse des données et sciences humaines: comment cartographier le monde social?”, Journal électronique d’histoire des probabilités et de la statistique, vol.4, n02, decembre 2008. Văn bản này là một tiểu luận được viết từ một vài tranh luận nổi lên ở Pháp trong những năm 1970, lúc các phương pháp phân tích dữ liệu đang được phổ biến trong các khoa học nhân văn, đặc biệt là trong xã hội học. Nhưng nó hoàn toàn không phải là một nghiên cứu đầy đủ về sự phổ biến này và những hệ quả sau đó, một nghiên cứu còn cần được tiến hành.

[2] Năm 1968, nhà xuất bản Minuit phát hành bản dịch cuốn One-Dimensional Man của Herbert Marcuse, một trong những cuốn sách được sùng bái của năm nổi tiếng này, phê phán mạnh mẽ chủ nghĩa tiêu dùng tư bản.

[3] Một số khoa học xã hội khác, bắt đầu là sử học, đặc biệt là lịch sử các khoa học và lịch sử thống kê, đã viện đến phân tích những tương ứng và các phân loại theo thứ bậc. Chẳng hạn năm 1981, Michel Armatte đã phân tích một bảng tương liên phân phối số trang mà 56 sách giáo khoa thống kê của thế kỉ XIX dành cho 21 chủ đề (Xem tạp chí JEHPS năm 2006: http://www.jehps.net/Decembre2006/Armatte.pdf).

[4] Phán quyết thông dụng “sự tương quan không kéo theo một quan hệ nhân quả” không chỉ đúng vì những lí do được viện ra, nhưng chính hình thức của nó cũng không gợi ý rõ ràng là có nhân quả, trong khi hồi qui tuyến tính lại gợi ý là có điều này.

[5] Về mặt hình thức, phân tích nhân tố của Spearman khác với điều sau này sẽ trở thành phân tích những thành phần chính, vốn là kết quả của những công trình của Karl Pearson (1901) và của Hotelling (1933). Về những khác biệt này, xem Pages, Caillier và Escoufier (1979) khi họ nói rõ là “cho dù các vấn đề do Spearman và Pearson, theo thứ tự, đặt ra là khác nhau thì nói chung phân tích những thành phần chính cung cấp một xấp xỉ tốt cho điều người ta tìm kiếm trong phân tích nhân tố theo nghĩa của Spearman.

[6] Ý tưởng này cũng xuất hiện, cùng thời gian đó, trong kinh trắc học, với những công trình của Ragnar Frisch (1934) với khái niệm “hợp lưu” (Morgan, 1990).

[7] Một lịch sử toàn cảnh của các nghiên cứu này được trình bày trong Pagès, Caillez và Escoufier (1979).

[8] Cùng thời điểm này, một số những môn đồ kinh trắc của ông, ít có tinh thần tự do như ông, cương quyết chống đối khả năng tổ chức dạy phân tích dữ liệu cho sinh viên kinh tế học.

[9] Trước đó, Jean-Claude Deville (1977) đã phát triển một phiên bản độc đáo của phân tích những tương ứng, nhắm vào các biến liên tục, dưới tựa “phân tích điều hoà về lịch hình thành các gia đình”.

[10] Henri Rouanet qua đời tháng mười năm 2008. Trong một sự nghiệp độc đáo, ông đã tiến hành những nghiên cứu thường được cảm nhận là khác biệt (nếu không phải là đối lập nhau): tâm lí học, xác suất, lí thuyết suy luận, thống kê bayesian, phân tích dữ liệu. Có thể tìm thông tin về lộ trình và sự nghiệp của ông từ trang htpp://www.ur1.ca/gc2pc (https://www.cairn.info/revue-bulletin-de-psychologie-2010-2-page-141.htm - ND)

[11] Hai mươi năm sau, vào tháng mười năm 1998, một hội thảo mới về chủ đề này sẽ tập hợp Bourdieu và Rouanet tại Cologne, theo sáng kiến của Jorg Blasius, đồng tác giả (cùng với Michael Greenacre) một tác phẩm tập thể xuất bản năm 1984 giới thiệu phân tích những tương ứng với thế giới nói tiếng Anh. Kể từ năm 1991, có một hệ thống nói tiếng Anh là CARME-N dành cho “phân tích những tương ứng và các phương pháp liên kết với nó” do Blasius và Greenacre chủ trì. Xem: htpp://www.carme-n.org/

[12] Ở đây chúng tôi không tìm cách mô tả sự phổ biến những phương pháp quan trọng khác của phân tích dữ liệu, như các phân tích phân loại (các phân tích dạng cây) lẫn những cách sử dụng khác phân tích những tương ứng. Chúng tôi tập trung vào việc định hình dần dần không gian xã hội hai chiều, mà chiều thứ nhất là thước đo xã hội cổ điển và chiều thứ hai đối lập các thành phần có học với các thành phần sở hữu vốn kinh tế.

[13] Bí danh của Anita Bensaid, lúc bấy giờ còn là thành viên của INSEE, và là một trong bốn tác giả của số 4 của tạp chí Annales de l’INSEE, do Malinvaud viết lời tựa và dành riêng cho phân tích dữ liệu.

[14] Về những khía cạnh khác nhau của sự đối chiếu hai họ phương pháp này, xem Schiltz 1990, Nétumières 1997, Desrosieres 2001, Rouanet, Lebaron, Le Hay, Ackerman và Leroux 2002 và Rouanet và Lebaron 2006.

[15] Trong La distinction, các tờ trong suốt được thay bằng một hệ thống khác: tên gọi của các thành phần xã hội được in màu đen (chữ in đậm trong hình trên - ND) còn của các thị hiếu được in màu đỏ (chữ in nhạt trong hình trên - ND) Bourdieu nói rõ “cần đưa vào một sơ đồ thứ ba trình bày không gian lí thuyết các habitus, nghĩa là những quy tắc phát sinh ra mỗi một lớp những cách thực hành và đặc tính (ví dụ đối với giảng viên, sự khổ hạnh quý phái).

[16] Phân tích những tương ứng các bảng có đường chéo rất đậm nét (như các bảng về tính cơ động xã hội) có một đặc điểm. Đám mây phóng chiếu trên mặt phẳng nhân tố của hai trục đầu tiên có dạng hình trăng lưỡi liềm (hiệu ứng Gutmann), trục thứ hai đối lập các thành phần trung vị với những thành phần ở thái cực. Trái lại, mặp phẳng nhân tố hợp thành bởi trục 1 và 3 tái hiện một cách trung thực không gian xã hội.

[17] Năm 1975 đã tham gia vào các cuộc điều tra của tuần san Nouvel Observateur nói đến trên đây.

[18] Sau này AESOP được Agoramétrie, một tổ chức tiếp tục truyền thống này nghiên cứu truyền thông qua các phân tích nhân tố.

[19] Trong thực tế, bản đồ học xã hội được sản xuất như vậy ít được nhắc đến và sử dụng trong những năm 1980 này, và điều này trùng khớp với sự xa lánh tương đối ý niệm tầng lớp xã hội, trong một phần của xã hội học, cũng như trong các cuộc tranh luận chính trị.

[*] tiền thân của Internet (ND).

Print Friendly and PDF