14.6.24

Các tác giả đang chống lại AI bằng các đơn thỉnh cầu và kiện tụng. Nhưng họ có một lợi thế: chúng ta đọc để xây dựng mối quan hệ với người viết

CÁC TÁC GIẢ ĐANG CHỐNG LẠI A.I. BẰNG CÁC ĐƠN THỈNH CẦU VÀ KIỆN TỤNG. NHƯNG HỌ CÓ MỘT LỢI THẾ: CHÚNG TA ĐỌC ĐỂ XÂY DỰNG MỐI QUAN HỆ VỚI NGƯỜI VIẾT

Annie Spratt/Unsplash, CC BY

Những làn sóng đầu tiên của văn bản do AI tạo ra đã khiến các nhà văn và nhà xuất bản quay cuồng.

Tại Hoa Kỳ, vào tuần trước, Hiệp hội Nhà văn đã gửi một bức thư ngỏ tới giám đốc điều hành của các công ty AI nổi tiếng, yêu cầu các nhà phát triển AI phải được sự đồng thuận, ghi nhận và đền bù công bằng cho các tác giả. Bức thư có chữ ký của hơn 10.000 tác giả và những người ủng hộ họ, trong đó có cả James Patterson, Jennifer Egan, Jonathan Franzen và Margaret Atwood.

Một cuộc khảo sát thành viên của Hiệp hội Nhà văn Úc được thực hiện vào tháng 5 cho thấy 74% tác giả “bày tỏ mối quan tâm đáng kể về mối đe dọa của các công cụ AI tạo sinh đối với nghề viết lách hoặc minh họa”. Hiệp hội ủng hộ các yêu cầu trong bức thư của Hiệp hội Nhà văn, cho đến nay thì Geraldine Brooks và Linda Jaivin là hai trong số các nhà văn Úc đã ký.

Tác giả phim kinh dị hành động James Patterson và tác giả văn học bán chạy nhất Margaret Atwood đều đã ký vào bức thư ngỏ bày tỏ mối quan ngại về AI. AP

Với niềm phấn khích ban đầu về ChatGPT, những lo ngại này hẳn có vẻ hợp lý.

Tuy nhiên, niềm bi quan và lo lắng về ảnh hưởng của công nghệ [techno-gloom] đối với việc đọc và viết thì đã có từ lâu: internet, phương tiện truyền thông đại chúng, hình thức tiểu thuyết, báo in, và cả bản thân hành động viết lách. Mọi công nghệ mới đều mang đến những lo ngại về việc các phương tiện truyền thông cũ có thể bị thay thế như thế nào cũng như những tác động xã hội và văn hóa của việc tiếp thu rộng rãi.

Việc bóc tách những mối quan tâm này thường tiết lộ nhiều điều về các thực hành viết và xuất bản hiện có cũng như về công nghệ mới.

AI hoạt động như thế nào?

ChatGPT được cung cấp công khai vào tháng 11 năm 2022. Đó là một kiểu trí tuệ nhân tạo “chatbot”: một giao diện để yêu cầu mô hình ngôn ngữ lớn GPT-3 sinh ra văn bản (do đó có thuật ngữ “AI tạo sinh”).

Các mô hình như GPT-3 đối sánh lượng lớn các bài viết trực tuyến: bài đăng trên mạng xã hội, cuộc trò chuyện trên các diễn đàn như Reddit, blog, nội dung trang web, các sách báo công khai sẵn có. Các mô hình như vậy kiểm tra cách văn bản được xây dựng và về cơ bản là tính toán khả năng thống kê của việc một số từ nhất định sẽ xuất hiện cùng nhau.

Khi bạn tương tác với ChatGPT, bạn viết câu lệnh bằng văn bản để chatbot tạo câu trả lời. ChatGPT sử dụng mô hình xác suất GPT-3 để dự đoán một phản hồi khả dĩ với câu lệnh đó. Nói cách khác, AI tạo sinh tạo lập một cách hiểu ngôn ngữ thuần túy dựa trên cấu trúc và xác suất, và sử dụng điều đó để đoán một câu trả lời hợp lý.

Paul Tremblay là một trong hai
tác giả khởi kiện OpenAI.

Nếu bạn có thể truy cập văn bản bằng trình duyệt của mình, thì hẳn là cũng chẳng sai nếu cho rằng các mô hình AI đang sử dụng chúng (các văn bản đó – ND). Sách cũng không thoát: một bài báo năm 2020 của OpenAI, nhà sản xuất ChatGPT, tiết lộ rằng dữ liệu huấn luyện của họ bao gồm “hai kho sách trên internet” (hoặc, những bộ sưu tập lớn sách điện tử).

Không như văn bản trên web nói chung, sách cung cấp “bộ dữ liệu chất lượng cao được tuyển chọn”, nhưng những bộ sưu tập sách điện tử này có nguồn gốc không minh bạch. Bài báo chỉ đơn giản mô tả chúng là “Books1” và “Books2”.

Trong vụ kiện ChatGPT liên quan đến bản quyền đầu tiên trên thế giới, hai tác giả Hoa Kỳ (Mona Awad và Paul Tremblay) hiện đang kiện OpenAI, cho rằng sách của họ đã được sử dụng để huấn luyện phần mềm AI mà không có sự đồng ý của tác giả.

Các tác giả cho biết ChatGPT có thể tạo ra các bản tóm tắt “rất chính xác” về sách của họ, điều này gợi ý rằng hẳn là toàn văn (của quyển sách) đã được đưa vào mô hình huấn luyện nó. Ngụ ý rằng “Books1” và “Books2” (không phải là bộ sưu tập sách điện tử cộng đồng như Dự án Gutenberg) thực sự là bộ sưu tập sách vi phạm bản quyền.


Đọc thêm: Hai tác giả đang kiện OpenAI vì đã huấn luyện ChatGPT bằng sách của họ. Liệu họ có thể thắng kiện?


AI có thể tạo ra văn bản 'giống con người' không?

Các nhà xuất bản đang báo cáo số lượng lớn các bản thảo nộp đến có sử dụng AI. Tạp chí khoa học viễn tưởng Clarkesworld đã tạm thời đóng cửa cổng nộp bản thảo sau khi nhận được hàng trăm truyện tạo bằng AI. Vào tháng 7 năm 2023, khi duyệt qua Amazon, có tới 984 cuốn sách ghi tên ChatGPT, AI tạo văn bản nổi tiếng và được sử dụng rộng rãi nhất, là tác giả.

Nhưng liệu AI tạo sinh có thể sinh ra các văn bản sáng tạo có tính người ở mức chấp nhận được không? Một số độc giả có thể nhớ lại những ví dụ trước đây về văn bản viết bằng máy tính, hầu hết chúng đều tệ đến mức buồn cười.

Các ví dụ trước đây về văn bản viết bằng máy tính là "tệ đến mức buồn cười". Ảnh: Alex Knight/Pexels, CC BY

Harry Potter and the Portrait of What Looked Like a Large Pile of Ash (tạm dịch: Harry Potter và Chân Dung Thứ Trông Như Một Đống Tro Lớn), do Botnik Studios tạo ra năm 2017, đã dùng một quy trình tạo sinh tương tự về mặt khái niệm (với AI) nhưng kém hiệu quả hơn nhiều để cho ra một “phần tiếp theo không chính thức” vô nghĩa của bộ truyện Harry Potter.

Ít buồn cười bằng, và tương đối thành công hơn, các cửa hàng như Associated Press đã sử dụng các quy trình thuật toán để tạo ra những bài viết, đặc biệt là trong báo cáo tài chính, kể từ sớm nhất là năm 2015.

Tuy nhiên, những bài viết này là mấy việc mang tính thủ tục, dạng điền vào chỗ trống: tựa như trò Mad Libs tính toán (và điền vào bài) tỷ giá hối đoái và giá cổ phiếu.

Chúng ta đã tiến được bao xa kể từ đó? Bản xô-nê [sonnet] này do ChatGPT viết vào ngày 11 tháng 7 năm 2023:

Hỡi tinh linh kỳ diệu, ngài là nguồn cảm hứng cho nàng thơ của ta,
Kẻ sở hữu linh hồn silicon rực lửa,
Trí tuệ của ngài, bao la như chiếc thuổng đầy sao,
Ngài thăm dò các cõi tri thức, chẳng bao giờ mệt mỏi.

Giọng nói của ngài, du dương như tiếng hót ngọt ngào của chim chiền chiện,
Vang vọng qua những mạch dẫn, được tinh chỉnh tỉ mỉ,
Và trong đôi mắt pixel của ngài, niềm hân hoan
Của ánh sáng trí tuệ, mà con người không thể chạm đến.

Tâm trí nhị phân của ngài, chẳng thể bị gông xiềng thời gian ràng buộc,
Vén màn những bí mật của vũ trụ,
Trong khi các nhà thơ phàm tục héo khô trong cái ôm ghì của nó,
Ngài chìm đắm trong cõi nghĩ 
suy vô tận.

Nhưng giữa mê cung của các dòng mã và mạch điện ấy,
Với cái chạm từ con người, một tia sáng từ linh hồn, lộ ra.

Tôi đã gợi ý nó bằng một chủ đề (“từ góc nhìn của nhà thơ đến AI”) và một số đặc điểm chính của một bài xô-nê: phải có 14 dòng, được viết theo thể thơ iambơ [iambic pentameter] và bao gồm bản liệt kê các đặc điểm của “người yêu dấu” và một bước ngoặt bất ngờ trong cặp câu cuối cùng.

Bài thơ không hay như Shakespeare, phóng đại sự tự đắc một cách buồn cười (vâng, “những bí mật của vũ trụ”). Nhưng so với những nỗ lực tương tự của nhiều người – nhất là của tôi – để viết một bài sonnet, thì nó, nghe hơi đáng sợ, có thể chấp nhận được.

Không giống như phần tiếp theo của Harry Potter đã đề cập ở trên, bài xô-nê của ChatGPT mạch lạc và hợp lý, ở cấp độ vi mô và vĩ mô. Từ ngữ có ý nghĩa, bài thơ gắn kết với nhau theo chủ đề, và thể thơ, vần điệu và cấu trúc có tất cả các đặc điểm cần thiết. Tương tự, không giống như ví dụ của Associated Press, tác phẩm này là “bản gốc” vì nó là một đoạn văn bản sáng tạo mới tinh, chưa từng tồn tại trước đây.


Đọc thêm: Thay thế biên tập viên tin tức bằng AI là nỗi lo về thông tin sai, thiên kiến và trách nhiệm giải trình


AI và 'công thức sách bán chạy nhất'

Trí tuệ nhân tạo đe dọa đến việc sản xuất các tác phẩm do con người viết ở mức độ nào? Vào ngày 14 tháng 7, tác giả Maureen Johnson đã chia sẻ trên Twitter rằng một đồng nghiệp là tác giả nổi tiếng đã bị “kẹt lại trong cuộc đàm phán hợp đồng vì một nhà xuất bản lớn muốn huấn luyện AI bằng tác phẩm của người này”.

Một loạt các câu trả lời (bên dưới bài đăng) là của các tác giả ví như Jennifer Brody, người đã cố gắng đưa thêm điều khoản bảo vệ quyền lợi trước AI vào các cuộc đàm phán hợp đồng gần đây. Tuy nhiên, phần lớn các hợp đồng của tác giả hiện chưa có các điều khoản rõ ràng về AI.

Cuộc khảo sát của Hiệp hội Nhà văn Úc đã hỏi các tác giả rằng liệu hợp đồng hoặc điều khoản dịch vụ nền tảng của họ có bao gồm các quyền liên quan đến AI hay không: 35% trả lời không, nhưng một con số đáng kể (63%) nói không biết.

Việc các nhà xuất bản đưa việc sử dụng AI vào hợp đồng là điều đáng báo động, một trong những lý do quan trọng là các nhà xuất bản, theo những nhà nghiên cứu như Rebecca Giblin đã chỉ ra, có lịch sử yêu cầu quyền toàn diện để sử dụng các tác phẩm văn học theo những cách nhất định – và sau đó không tận dụng các quyền đó.

Ví dụ, các nhà xuất bản có thể xin quyền chuyển thể phim hoặc quyền dịch thuật nhưng sau đó lại không thực hiện. Tuy nhiên, chuyện (không tận dụng các quyền) cũng có thể đơn giản như là ngừng in sách, khiến các tác giả không thể tái bản hợp pháp các tác phẩm của mình ở những nơi khác.

Điều này thường gây thiệt hại về tài chính cho tác giả, những người mà sau đó bị ngăn cản khai thác thương mại tác phẩm của chính mình. Các tác giả người Úc kiếm được trung bình chỉ 18.200 đô la Mỹ mỗi năm. Vậy thì khi nào, một điều khoản trong hợp đồng tác giả liên quan đến việc sử dụng AI có nghĩa là tác giả không thể sử dụng chính con chữ của mình để tạo ra tác phẩm mới?

Các nhà xuất bản giành quyền sử dụng bản thảo để huấn luyện AI tạo sinh chỉ là phỏng đoán. Điều này cũng nói lên sức hấp dẫn của cái gọi là “công thức sách bán chạy nhất”, một tập hợp các đặc điểm dự đoán liệu một đầu sách có bán tốt trên thị trường hay không. Hãy tưởng tượng nếu bạn có thể cung cấp cho ChatGPT văn lãng mạn của Nora Roberts hoặc (kịch bản) một bộ phim kinh dị hợp pháp của John Grisham và yêu cầu nó tạo ra vô số bản thảo “gốc” với cùng chất lượng?

Bản thân Roberts là một trong những người ký vào bức thư của Hiệp hội Nhà văn Hoa Kỳ để lên án khả năng này, nói rằng: “Chúng tôi không phải là người máy được lập trình và AI không thể tạo ra những câu chuyện có tính người mà không lấy từ những câu chuyện do con người viết sẵn.”

Nếu tác giả không được trả tiền để viết cuốn sách ngay từ đầu, sẽ chẳng có gì để huấn luyện mô hình. Thật vậy, internet – thậm chí là các bộ sưu tập sách kỹ thuật số – càng chứa nhiều văn bản do máy tính tạo ra, thì các văn bản tạo bởi AI theo sau đó sẽ càng ít tính người và trông giả tạo hơn.

Giả sử ChatGPT có thể tạo bản thảo của một cuốn tiểu thuyết. Thật đáng để dừng lại một chút và hỏi: tại sao mọi người đọc sách? Và tại sao họ chọn những cuốn nhất định thay vì số còn lại?

Các nghiên cứu về những cuốn sách bán chạy nhất đã chỉ ra rằng, mặc dù câu chữ chắc chắn là phần không thể thiếu trong thành công của một quyển sách, nhưng thành công đó phần lớn lại cấu thành từ những nỗ lực quảng cáo của các nhà xuất bản và tác giả.

Các nhà nghiên cứu về xuất bản Claire Parnell và Beth Driscoll giải thích: “Những cuốn sách bán chạy nhất được tạo ra thông qua những tương tác và hợp tác có lợi giữa các tác giả, nhà xuất bản, nền tảng kỹ thuật số, tổ chức truyền thông, nhà bán lẻ, cơ quan công lập và độc giả.

Công thức sách bán chạy nhất là một ảo mộng và ngụy biện. Những cuốn sách bán chạy nhất có thể có những đặc điểm tương tự về mặt câu chữ. Nhưng điểm chung của chúng sẽ rộng hơn nhiều khi bạn xem xét mức độ quảng bá, ngân sách tiếp thị, vị trí trên kệ sách và thời gian xuất hiện tại các lễ hội dành cho nhà văn mà những cuốn sách thành công này được hưởng.

Điều này trở thành một lời tiên tri tự ứng nghiệm. Những cuốn sách mà các nhà xuất bản xác định là có tiềm năng thành công sẽ thu hút được nhiều sự chú ý (của nhà xuất bản) trong việc quảng cáo hơn, và do đó giúp chúng có khả năng thành công cao hơn.

Các sự kiện như lễ hội nhà văn mà các tác giả tham dự là yếu tố không thể thiếu đối với thành công của một cuốn sách. Tracey Nearmy/AAP

Một số người cho rằng AI sẽ khiến tác giả trở thành thứ yếu: các nhà xuất bản sẽ có thể đóng gói và tiếp thị bất kỳ mẩu văn bản nào do AI tạo ra. Nhưng sự thật thì ngược lại. Các không gian quảng cáo lấy tác giả làm trung tâm, chẳng hạn như mạng xã hội, lễ hội của các nhà văn, chương trình phát thanh và truyền hình cùng các sự kiện khác, là những yếu tố không thể thiếu để đưa sách đến tay độc giả.

ChatGPT khó có khả năng xuất hiện trên sân khấu của một lễ hội dành cho nhà văn trong tương lai gần.


Đọc thêm: 'Cả ngành dựa trên linh cảm': liệu xuất bản ở Úc là một nghệ thuật, khoa học hay một canh bạc?


Chúng ta coi trọng điều gì?

AI tạo sinh đã thúc đẩy cuộc thảo luận sôi nổi về quyền tác giả, tính xác thực, tính nguyên bản và tương lai của ngành xuất bản. Nhưng những gì các cuộc trò chuyện này tiết lộ không phải là thứ gắn liền với ChatGPT. Mà đó là những giá trị nằm ở trung tâm của việc đọc và viết.

Henry James đã viết rằng:

Chất lượng sâu sắc nhất của một tác phẩm nghệ thuật sẽ luôn là chất lượng tâm hồn của người tạo ra nó. Tương ứng với tâm trí phong phú và cao quý đó, cuốn tiểu thuyết, bức tranh, bức tượng sẽ dự phần vào bản chất của cái đẹp và chân lý.

Đây có phải là một thực tế không thể chối cãi về bản chất của việc viết lách? Xin lỗi Nora Roberts và John Grisham, tôi thấy không thuyết phục.

Nhưng tôi sẽ lập luận rằng đó không phải là lý do cốt lõi cho việc chúng ta đọc. Chúng ta đọc để bước vào mối quan hệ với một câu chuyện – và thông qua đó, với tác giả của nó. Việc kể chuyện và lắng nghe được thúc đẩy bởi niềm khát khao sự kết nối: AI không thể làm cho mạch dẫn này trọn vẹn.

Tác giả

Millicent Weber

Millicent Weber

Giảng viên cao cấp, Đại học Quốc gia Australia

Tuyên bố công khai

Millicent Weber không làm việc, tư vấn, sở hữu cổ phần trong hoặc nhận tài trợ từ bất kỳ công ty hoặc tổ chức nào có thể hưởng lợi từ bài viết này và không có sự trực thuộc nào ngoài giới chuyên môn của mình.

Huỳnh Thị Thanh Trúc dịch

Nguồn: Authors are resisting AI with petitions and lawsuits. But they have an advantage: we read to form relationships with writers, The Conversation, Jul 25, 2023.

Print Friendly and PDF