14.11.24

Dịch tự động là tên gọi của điều gì?

DỊCH TỰ ĐỘNG LÀ TÊN GỌI CỦA ĐIỀU GÌ?

Tác giả: Caroline Rossi[*]

Từ khi các hệ thống dịch tự động gọi là “neuronale” (dựa trên mạng nơ-ron) xuất hiện vào mùa thu năm 2016, dựa trên các kỹ thuật có nguồn gốc từ việc nghiên cứu về trí tuệ nhân tạo, viễn cảnh đưa máy tự động phục vụ người dịch đặt ra nhiều thắc mắc. Nhưng “trí tuệ này”, ta đã hình thành nó như thế nào?

Tôi nghĩ chỉ riêng Sarkozy thôi thì không thể làm bạn chán nản. Vậy, điều làm bạn chán nản là thứ mà cái tên Sarkozy đại diện. Đó mới là điều khiến chúng ta ghi nhớ: sự xuất hiện của cái mang tên Sarkozy, bạn cảm nhận sự xuất hiện ấy như một cú đánh từ thứ đó, cái thứ có lẽ là bẩn thỉu mà cậu bé Sarkozy chỉ là kẻ phục vụ của nó.” Alain Badiou, De quoi Sarkozy est-il le nom? - Sarkozy là tên gọi của điều gì? - Lignes, 2007

Điều gì làm cho những người dịch chán nản? Để trả lời câu hỏi than ôi rất thời sự này, chuyên mục ngôn ngữ “Johnson” (la chronique linguistique “Johnson”) công bố ngày 27 tháng năm vừa qua (2017) trên tuần báo Anh The Economist nhận diện hai loại áp lực: một áp lực vật chất liên quan đến cạnh tranh quốc tế kéo theo một sự hạ thấp quan trọng các giá biểu, và một áp lực bổ sung xuất phát từ việc sử dụng từ nay được phổ quát hoá các công cụ dịch tự động ngày càng hoàn thiện, có khả năng thu hẹp công việc của người dịch vào việc trau chuốt nhanh chóng những văn bản mà người dịch này không viết ra. Nhưng có phải dịch tự động thực sự tạo nên một sự tìm kiếm về công nghệ mà không có mối liên quan với loại áp lực thứ nhất không?

Khi các nhà nghiên cứu hỏi những người dịch, những người này sẵn sàng nêu ra những “va chạm về nhận thức” liên quan đến sự phân đoạn thái quá các văn bản[1] do công việc gây ra trong một môi trường dịch thuật có sự trợ giúp của máy tính (TAO). Để hiểu rõ hơn điều ấy có nghĩa gì, hiện nay có hai loại tiếp cận được ưu tiên. Một mặt, các cách tiếp cận nhận thức và tiện dụng vốn xem người dịch là trung tâm của các mối quan tâm. Những cách tiếp cận này tìm cách hiểu được những hậu quả của những cách thực hành mới ảnh hưởng đến việc dịch gọi là thực dụng (không mang tính văn chương) và tìm cách phân tích tất cả các nhân tố có ảnh hưởng đến công việc, đến sự thoải mái và bản sắc của những người dịch[2]. Mặt khác, những cách tiếp cận dân tộc học chú tâm mô tả nhận thức và trải nghiệm chủ quan của những người dịch.

Tóm lại, những nhà nghiên cứu quan tâm đến những vấn đề này cho chúng ta biết rằng nếu từ nay việc sử dụng phổ biến những bộ nhớ về dịch thuật (cơ sở dữ liệu giúp lưu giữ trong trí nhớ những nội dung dịch thuật đã được thực hiện và nêu chúng trở lại khi ta gặp những đoạn văn tương tự) và sự tích hợp thông dụng của dịch tự động vào thiết bị làm việc của người dịch cho phép họ làm việc nhanh hơn và bảo đảm sự nhất quán về thuật ngữ và hành văn của văn bản dịch, những người dịch coi những yếu tố này như những nguồn gây thất vọng, vì việc sử dụng chúng hầu như luôn luôn gắn với những đòi hỏi về năng suất ngày càng tăng.

Có nên ngạc nhiên về những kết quả mâu thuẫn này không? Làm thế nào để giải thích trong một bối cảnh mà những tiến bộ công nghệ vô cùng nhanh, viễn cảnh đặt máy tự động phục vụ người dịch dường như vẫn còn xa vời? Câu hỏi được đặt ra một cách đặc biệt cấp thiết từ mùa thu năm 2016 với sự xuất hiện của những hệ thống dịch tự động mới gọi là “dựa trên mạng nơ-ron”, dựa trên những kỹ thuật có nguồn gốc từ nghiên cứu về trí tuệ nhân tạo.

Sơ đồ của công việc dịch với sự trợ giúp của máy tính

Theo phỏng chừng đầu tiên, ta có thể trả lời bằng cách nói rằng những người thiết kế máy ít quan tâm đến những người dịch, và ngược lại. Thực vậy, có một khoảng cách lớn giữa các công trình nghiên cứu đưa đến những công nghệ mới về dịch thuật với sự trợ giúp của máy tính, và những công trình tập trung vào mô tả những cách sử dụng và nhận thức hiện nay. Đó là hai loại diễn ngôn liên quan đến dịch thuật, phát triển độc lập với nhau từ nhiều thập kỷ. Hơn nữa, từ cuối những năm 1980, Antoine Berman đã phân biệt traductique (tạm dịch là công nghệ dịch thuật), được định nghĩa là “lý thuyết tính toán về các quy trình dịch thuật chi phối kỷ nguyên công nghệ”, với traductologie (tạm dịch là khoa học dịch thuật), mà ông kêu gọi phát triển và từ này có đặc điểm như “sự suy ngẫm của dịch thuật về chính bản thân nó, dựa trên bản chất kinh nghiệm của dịch thuật.”

Để làm rõ sự đối kháng này, ta có thể dùng một phương pháp mà ngôn ngữ học nhận thức đã thừa nhận giá trị: nghiên cứu các phép ẩn dụ, không phải như những biện pháp tu từ, mà như những yếu tố cấu thành tư duy và văn hoá[3]. Đối với tác giả của bài này, vốn là một người nghiên cứu dịch thuật, đó là hiểu diễn ngôn của công cụ tìm kiếm trên Google, mà ta có thể gắn vào phạm vi của traductique. Google nói gì? Trong một tập tài liệu gồm mười bài báo rất mới, xuất phát từ tìm kiếm của Google về dịch tự động, những hợp phần thường được dùng nhất để nói về dịch thuật cho thấy dịch thuật trước hết được hiểu như một công việc có thể mô hình hoá, do một hệ thống (tin học) đảm nhiệm: hệ thống dịch thuật, công việc dịch thuật, mô hình dịch thuật (translation systemtranslation tasktranslation model). Công việc này được thiết kế như một phép tính và cho kết quả, từ đó có những hợp phần cũng thường gặp: hiệu suất dịch thuật, xác suất dịch thuật, kết quả dịch thuật (translation performancetranslation probabilitiestranslation results). Mặc dù luôn gây ngạc nhiên cho người dịch và nhà nghiên cứu dịch thuật, vì đối với họ dịch thuật biểu thị một điều rất khác với một công việc chính xác và không thể giản lược về một sự tính toán, nhưng sự viện dẫn đến tập hợp các phép ẩn dụ thứ nhất trên đây là không mới. Tập tài liệu thiên về định nghĩa quan niệm truyền thống về dịch thuật tự động, chính vì ý tưởng tự động hoá dịch thuật đã xuất hiện với những máy tính đầu tiên, sau Thế Chiến thứ hai.

Một tập hợp những ẩn dụ thứ hai được phát hiện trong số hữu hạn những văn bản do chúng tôi tập hợp làm cơ sở nghiên cứu cho phép xác định một quan niệm mới hơn nhiều về dịch thuật tự động: quan niệm này là kết quả của những công trình về trí tuệ nhân tạo. Ẩn dụ chính yếu là ẩn dụ về trí não máy tính, và những thuật mô hình hoá mới nhất được sử dụng đã tăng cường ẩn dụ này, bởi vì từ nay ta nói về các “mạng nơ-ron” để mô tả kiến trúc của các hệ thống. Đáng ngạc nhiên hơn nữa: trong khi các hệ thống dịch thuật với sự trợ giúp của thống kê được huấn luyện trên những tập hợp tài liệu lớn về các văn bản dịch, những hệ thống dịch thuật với sự trợ giúp gọi là “mạng nơ-ron” là sản phẩm của một sự học có tính đến mạng lưới những mô hình hoá ở nhiều cấp độ, và được đánh giá là “sâu”. Ta thấy rằng phép ẩn dụ phát triển để đi cùng những tiến bộ của lĩnh vực chuyên môn này, gợi ý rằng ta vẫn tiến đến gần hơn sự vận hành của não bộ con người, có thể cả suy nghĩ của con người mà ta thường gán cho đặc điểm là sâu sắc, hoặc nông cạn. Có phải não bộ của người dịch bị phơi bày?

Ngay cả khi những công bố của Google không hề hứa hẹn gì về tất cả những việc ấy (và người dịch không một lần được đề cập đến trong tài liệu của chúng tôi), mạng lưới các ẩn dụ cũng tất yếu gợi ra điều đó. Cuối cùng, hợp phần cuối cùng thường được sử dụng nhất trong các bài báo mà chúng tôi đã tập hợp liên quan đến sáng tạo đổi mới gần đây nhất của Google: dịch thuật không cần huấn luyện, gọi là “dịch zero-shot ”. Thực vậy, những tiến bộ của các mô hình học sâu được đo lường qua khả năng làm việc từ một kích thích duy nhất (one-shot)[4]. Dịch thuật không cần huấn luyện thể hiện kỳ tích công nghệ mới nhất, bao gồm tạo ra một bản dịch tự động trong một ngôn ngữ mà hệ thống chưa gặp bao giờ. Lần này, chính phép ẩn dụ của trò chơi được sử dụng, trò chơi là hoạt động chính yếu đối với sự phát triển của trẻ em ngay từ tuổi rất nhỏ, nhưng cũng là đối với quá trình xã hội hoá, trong suốt cuộc đời. Trò chơi mà trong suốt cuộc chơi ta có thể thực hiện thành công một phát bắn mà không cần huấn luyện (“Shot!”), với điều kiện đã thử vận may (I’ll give it a shot!). Những máy này vốn thử vận may trong trò chơi dịch thuật, và người ta nói với chúng ta là các máy này đã khá thành công, không nghi ngờ gì nữa, các máy này được thiết kế như những máy tự động với “trí tuệ” có thể sẽ cạnh tranh với trí tuệ của con người. Ta còn ở rất xa công cụ mà bàn tay của người dịch có thể tôi luyện nên[5]: điều mà Google phát triển chính là một cỗ máy dịch thuật, một cơ chế không còn dành tự do cho con người trong trò chơi. 

John Stuart Mill (1806-1873)

Những máy dịch mới này có lẽ không đủ để làm cho những người dịch chán nản, nhưng quá trình tự động hoá mà chúng báo hiệu không khỏi nhắc nhớ lại bước chuyển từ chế tạo tiền công nghiệp qua giai đoạn mà Marx gọi là “Máy móc” công nghiệp. Trước thềm của một giai đoạn mới dành cho những sự phát triển này, Marx trích dẫn Principes d’économie politique (Các nguyên tắc của kinh tế chính trị) của John Stuart Mill: “Ta có thể tự hỏi liệu tất cả các phát minh cơ khí được thực hiện cho đến nay có làm nhẹ bớt công việc nặng nhọc hàng ngày của bất kỳ con người nào hay không[6].” Tiếc thay ta có thể đánh cược thành công rằng, trong bối cảnh hiện nay, những tiến bộ của dịch thuật tự động về bản chất sẽ không rút ngắn những ngày làm việc của người dịch.

Để tìm hiểu thêm:

Antoine Berman. 1989. “La traduction et ses discours”, Meta: journal des traducteurs/Meta: Translators’ Journal, 34 (4), pp. 672-679.

Nicolas Froeliger. 2013. Les noces de l’analogique et du numérique: De la traduction pragmatique, Les Belles Lettres.

Elisabeth Lavault-Olléon. 2016. “Traducteurs à l’œuvre: une perspective ergonomique en traductologie appliquée”, ILCEA.

Matthieu LeBlanc. 2017. ““I can’t get no satisfaction”: an ethnographic account of translators’ experiences of translation memory and shifting business practices”. In Kenny, D. (ed.), Human Issues in Translation Technology, Routledge.

Người dịch: Thái Thị Ngọc Dư

Nguồn:De quoi la traduction est-elle le nom?”, En attendant Nadeau (EaN), 25.7. 2017

----

Bài có liên quan: Trí tuệ, Trí năng, Trí khôn và AI




Chú thích:

[*] Caroline Rossi là giảng sư tại Đại học Grenoble Alpes và là tổng biên tập của tạp chí của Hiệp hội ngôn ngữ học nhận thức Pháp (lAssociation française de linguistique cognitive).

[1] Nói chung, phải làm việc trên từng câu một, đôi khi là trên những đoạn ngắn hơn, và nếu văn bản dài thì ta mất cái nhìn toàn thể: Tất cả những điều này được giải thích rõ trong những công bố mới đây của Sahron O’Brien (Dublin City University), hay của Maureen Ehrensberger-Dow (Zurich University of Applied Sciences).

[2] Đó là những thuật ngữ của Ce sont les termes d’Élisabeth Lavault-Olléon, người đã phát triển cách tiếp cận tiện dụng từ năm 2010 tại Đại học Grenoble Alpes.

[3] Những công trình đầu tiên là của một nhà ngôn ngữ học và một triết gia Mỹ, và tác phẩm được dịch sang tiếng Pháp: Lakoff, George & Johnson, 1985. Les métaphores dans la vie quotidienne (Những phép ẩn dụ trong đời sống hàng ngày), bản dịch của traduction de M. de Fornel, cộng tác với J.-J. Lecercle. Nhà xuất bản Minuit.

[4] “One-shot generalization” là một thuật ngữ tiếng Anh để mô tả khả năng tạo ra một tập hợp những yếu tố tương tự từ duy nhất một yếu tố, ví dụ bất kỳ đó là những phần của một văn bản hoặc hình ảnh.

[5] Số hữu hạn những văn bản do chúng tôi tập hợp làm cơ sở nghiên cứu về các bài báo trên Google không có một chi tiết nào về các công cụ dịch thuật hay công cụ trợ giúp dịch thuật.

[6] Số hữu hạn những văn bản do chúng tôi tập hợp làm cơ sở nghiên cứu về các bài báo trên Google không có một chi tiết nào về các công cụ dịch thuật hay công cụ trợ giúp dịch thuật.

Print Friendly and PDF