Sự kiện & Bình luận

Trò chơi tỷ đô trên lưng giới sáng tạo

Bùi Tùng Linh
Đời sống 11:12 | 18/07/2025
Tại Hoa Kỳ, hàng loạt vụ kiện bản quyền đang bùng nổ nhằm vào các công ty phát triển trí tuệ nhân tạo như Meta, OpenAI, Anthropic, với cáo buộc đã sử dụng trái phép hàng triệu tác phẩm có bản quyền để huấn luyện mô hình AI. Các phiên điều trần tại Thượng viện Mỹ gần đây cho thấy cuộc tranh cãi pháp lý không đơn thuần là chuyện giữa Big Tech và giới xuất bản, mà đang trở thành vấn đề có ảnh hưởng sâu rộng đến tương lai của sáng tạo văn hóa toàn cầu. Diễn biến này đặt ra nhiều câu hỏi đáng lưu tâm về quyền sở hữu trí tuệ, đạo đức công nghệ và vai trò của nhà sáng tạo trong thời đại AI.
aa

Từ thư viện lậu đến thuật toán tỷ đô


Ngày 16/7/2025, tại phiên điều trần do Thượng nghị sĩ Josh Hawley chủ trì thuộc Tiểu ban Tư pháp Thượng viện Hoa Kỳ, một cáo buộc nặng nề được đưa ra: các công ty công nghệ lớn, trong đó có Meta, Anthropic, OpenAI và nhiều đơn vị phát triển trí tuệ nhân tạo khác, đã cấu thành hành vi vi phạm bản quyền ở quy mô lớn nhất từng được ghi nhận trong lịch sử nước Mỹ. Theo Hawley, đây không còn là vấn đề kỹ thuật hay tranh cãi pháp lý, mà là “vụ trộm tài sản trí tuệ trong nước lớn nhất trong lịch sử Hoa Kỳ”.

Trò chơi tỷ đô trên lưng giới sáng tạo

Điều đáng lo ngại hơn: các công ty này không chỉ khai thác nội dung công khai trên Internet, mà còn chủ động tiếp cận, tải xuống và sử dụng trái phép hàng triệu tác phẩm có bản quyền để huấn luyện các mô hình AI tạo sinh, từ văn học, báo chí đến ca từ và mã nguồn. Những người tham gia điều trần, bao gồm nhà văn bestseller David Baldacci, các giáo sư luật và luật sư đại diện cho phía nguyên đơn, đều nhấn mạnh: nếu không có biện pháp kiểm soát kịp thời, nền công nghiệp AI sẽ nuốt chửng toàn bộ hệ sinh thái văn hóa và sáng tạo.


Các mô hình AI hiện nay - từ ChatGPT, Claude đến Llama hay Gemini - đều cần lượng dữ liệu khổng lồ để học và tạo ra văn bản. Theo tài liệu trình bày tại phiên điều trần, các công ty AI đã thu thập hơn 200 terabyte dữ liệu có bản quyền, tương đương hơn 22 Thư viện Quốc hội Mỹ, trong đó có hơn 7 triệu cuốn sách bị tải lậu từ các trang như LibGen hoặc PiLiMi. Không dừng lại ở việc tải xuống, một số công ty còn tải ngược lên các hệ thống chia sẻ, góp phần lan rộng hành vi vi phạm bản quyền với tổng dung lượng vượt 50 terabyte.

Luật sư Maxwell Pritt (hãng Boies Schiller Flexner LLP), đại diện nguyên đơn trong nhiều vụ kiện, khẳng định: “Các công ty AI xây dựng ngành công nghiệp tỷ đô mà không trả một xu cho những người đã tạo ra tri thức - nhà văn, nhà xuất bản, nhạc sĩ. Đó không phải là sự tiến bộ, mà là tội phạm công nghệ.”

Bằng chứng nội bộ và “sự đồng lõa tự biết”


Một phần gây rúng động của phiên điều trần là loạt tài liệu nội bộ từ Meta và Anthropic, cho thấy lãnh đạo và nhân viên các công ty này biết rõ hành vi của mình là vi phạm pháp luật, nhưng vẫn cố tình thực hiện. Một nhân viên Meta viết: “Vấn đề nằm ở nạn vi phạm bản quyền (và chúng tôi biết điều đó, cũng là đồng phạm)”, trong khi người khác cảnh báo rằng nếu bị phát hiện dùng dữ liệu từ LibGen, họ sẽ gặp bất lợi nghiêm trọng trong các cuộc đàm phán với cơ quan quản lý. Đặc biệt, Meta bị cáo buộc sử dụng giao thức BitTorrent để tải dữ liệu vi phạm bản quyền qua các máy chủ bên thứ ba, nhằm xóa dấu vết khỏi hệ thống công ty.

“Napster-style downloading” là chỉ hành vi tải xuống hàng loạt nội dung có bản quyền một cách trái phép, thường từ các nguồn chia sẻ lậu trên Internet. Cụm từ bắt nguồn từ Napster, một phần mềm chia sẻ nhạc nổi tiếng ra đời năm 1999, cho phép người dùng tự do trao đổi hàng triệu bản nhạc MP3 mà không xin phép tác giả hay nhà sản xuất.

Napster nhanh chóng trở thành tâm điểm tranh cãi vì đã gây tổn thất lớn cho ngành công nghiệp âm nhạc và bị kiện ra tòa bởi nhiều nghệ sĩ và công ty thu âm. Đến năm 2001, Napster buộc phải đóng cửa sau khi thua kiện vì vi phạm bản quyền.

Về phía Anthropic, nội dung email từ CEO Dario Amodei cho thấy công ty cố tình trì hoãn việc xin phép bản quyền, chấp nhận rủi ro pháp lý để nhanh chóng huấn luyện mô hình Claude, cạnh tranh với OpenAI và các đối thủ khác. Luật sư Pritt ví hành vi này với “Napster-style downloading”, một phép so sánh không thể đáng lo hơn trong lịch sử vi phạm bản quyền.

Trong vòng một tuần, hai phán quyết quan trọng được đưa ra từ cùng một tòa án liên bang tại California, nhưng lại thể hiện hai lập trường trái ngược. Thẩm phán William Alsup cho phép vụ kiện tập thể chống lại Anthropic được tiếp tục, khẳng định rằng dù huấn luyện mô hình trên sách có thể được xem là "sử dụng hợp lý", thì việc tải và lưu trữ sách lậu là hành vi vi phạm bản quyền. Ông nhấn mạnh rằng vụ việc có thể dẫn đến mức bồi thường hàng tỷ đô la. Ngược lại, Thẩm phán Vince Chhabria, trong vụ kiện chống lại Meta, lại bác bỏ đơn kiện của các tác giả như Sarah Silverman, với lý do nguyên đơn không chứng minh được thiệt hại trực tiếp đến thị trường của mình. Tuy vậy, ông cũng thẳng thắn chỉ trích việc AI “tái tạo” văn bản dễ dàng có thể gây ảnh hưởng nặng nề đến các tác giả trẻ, chưa nổi tiếng, vì “họ có thể bị nuốt chửng trước khi kịp được biết tới”.

AI: công cụ sáng tạo hay máy sao chép tinh vi?

Nghiên cứu độc lập cho thấy từ 8% đến 15% phản hồi của các chatbot AI hiện nay là trích nguyên văn từ dữ liệu huấn luyện, một số trường hợp có thể lên tới 100%. Các mô hình như Claude, GPT-4 hay Llama đều có khả năng “ghi nhớ” các đoạn văn dài, và có thể tái tạo cả chương sách nếu được dẫn dắt đúng “prompt”. Các công ty như OpenAI gọi đây là “lỗi hiếm gặp”, nhưng nhiều nhà nghiên cứu khẳng định đây là đặc điểm thiết kế mang tính cấu trúc, không phải tai nạn.

Mark Lemley, học giả luật nổi tiếng và từng tham gia nhóm biện hộ cho Meta, đã công khai từ chức sau khi chứng kiến các mô hình tái tạo gần nguyên văn Harry Potter1984. Ông tuyên bố: “Chúng ta không thể tiếp tục tin vào câu chuyện các công ty AI kể với tòa.” Một số chuyên gia cho rằng với các mô hình hiện tại, “bản sao số” của một cuốn sách có thể tồn tại ngay bên trong mô hình AI mà không ai phát hiện được, trừ khi có nghiên cứu độc lập rất tốn kém để chứng minh điều đó.

Khi tác giả không còn là chủ nhân của tri thức - Vấn đề không chỉ là bản quyền, mà là văn hóa nhân loại

Sự tràn lan của sách viết bằng AI trên các nền tảng như Amazon đã làm méo mó thị trường xuất bản. Nhiều tác phẩm gán tên tác giả thật, gây nhầm lẫn, đánh cắp doanh thu và uy tín. David Baldacci, phát biểu tại phiên điều trần, nói: “Mỗi cuốn sách là công trình cả đời. Vậy mà giờ đây, nó bị đánh cắp chỉ trong ba giây. Không một thế hệ sáng tạo nào có thể tồn tại trong môi trường như vậy.”

Viễn cảnh đáng sợ không chỉ là chuyện mất tiền bản quyền, mà là sự suy giảm của toàn bộ sinh thái sáng tạo: khi không ai còn muốn viết, còn có thể sống được bằng nghề viết, thì AI sẽ học gì để tạo ra “nội dung”?


Hai phán quyết vừa qua chỉ là bước khởi đầu trong chuỗi hơn 40 vụ kiện đang chờ phán xử tại Hoa Kỳ. Nhưng điều rõ ràng là: hệ thống pháp luật hiện nay chưa theo kịp tốc độ phát triển của AI, và những câu hỏi đạo đức – xã hội – văn hóa chưa từng phải đối mặt trước đây. Mục tiêu của luật bản quyền không chỉ là bảo vệ quyền lợi tác giả, mà là gìn giữ khả năng sáng tạo – nền tảng của mọi nền văn minh.

Nếu các mô hình AI được coi là “sử dụng hợp pháp” khi ăn cắp dữ liệu để huấn luyện, thì chúng ta sẽ dọn đường cho một thế giới nơi con người không còn là trung tâm của tri thức, mà chỉ là nguồn cấp dữ liệu miễn phí cho máy móc. Câu hỏi lớn đặt ra không chỉ là: “AI có được phép học từ sách không?”, mà là: “Chúng ta muốn sống trong nền văn hóa như thế nào?”

Triển lãm "Không có gì quý hơn độc lập tự do"

Triển lãm "Không có gì quý hơn độc lập tự do"

Baovannghe.vn - Nhân dịp kỷ niệm 80 năm Cách mạng Tháng Tám (19/8/1945 -19/8/2025) và Quốc khánh nước Cộng hòa Xã hội Chủ nghĩa Việt Nam (2/9/1945 - 2/9/2025), Trung tâm Lưu trữ quốc gia I tổ chức Triển lãm trực tuyến Không có gì quý hơn độc lập, tự do và ra mắt sách Phủ Toàn quyền Đông Dương xưa và Phủ Chủ tịch ngày nay.
Hội thi Tuyên truyền lưu động toàn quốc, tôn vinh những người làm công tác văn hóa

Hội thi Tuyên truyền lưu động toàn quốc, tôn vinh những người làm công tác văn hóa

Baovannghe.vn - Hội thi Tuyên truyền lưu động toàn quốc đã được tổ chức trên toàn quốc và lại dấu ấn sâu đậm trong lòng công chúng và những người làm công tác văn hoá.
Ra mắt hai tập sách ảnh về "Sức mạnh Việt Nam"

Ra mắt hai tập sách ảnh về "Sức mạnh Việt Nam"

Baovannghe.vn - Sáng 10/8, nhiếp ảnh gia Nguyễn Á ra mắt hai tập sách ảnh 50 năm - Sức mạnh Việt NamThành phố hòa bình - Thành phố của chúng ta tại Bảo tàng Phụ nữ Việt Nam.
Khai mạc Phiên họp thứ 48 của Ủy ban Thường vụ Quốc hội

Khai mạc Phiên họp thứ 48 của Ủy ban Thường vụ Quốc hội

Baovannghe.vn - Phiên họp thứ 48 của Ủy ban Thường vụ Quốc hội đã chính thức khai mạc sáng 11/8, tại Nhà Quốc hội, dưới sự chủ trì của Chủ tịch Quốc hội Trần Thanh Mẫn.
Chính phủ: Tăng tốc để đạt mục tiêu tăng trưởng năm 2025

Chính phủ: Tăng tốc để đạt mục tiêu tăng trưởng năm 2025

Baovannghe..vn - Chính phủ ban hành Nghị quyết số 230/NQ-CP phiên họp Chính phủ thường kỳ tháng 7 năm 2025 và Hội nghị trực tuyến Chính phủ với địa phương.