Chuyên đề

ChatGPT có khả năng vi phạm bản quyền nhiều tác phẩm văn học

Câu chuyện văn hoá 08:07 | 08/05/2023

Theo các nhà nghiên cứu từ Đại học California, ChatGPT đã sao chép và tổng hợp dữ liệu từ các cuốn sách như "Harry Potter", "Trò chơi vương quyền", "451 độ F"

Theo các nhà nghiên cứu từ Đại học California, ChatGPT đã sao chép và tổng hợp dữ liệu từ các cuốn sách như "Harry Potter", "Trò chơi vương quyền", "451 độ F"...

ChatGPT là chat bot được xây dựng trên nền tảng công nghệ mô hình ngôn ngữ lớn GPT-3.5. GPT-4 là mô hình ngôn ngữ cải tiến hơn mới ra mắt được OpenAI quảng cáo rầm rộ. Các mô hình ngôn ngữ lớn hiện nay đều tổng hợp một khối dữ liệu khổng lồ trên Internet. Vì vậy, trường hợp tài liệu vi phạm bản quyền được in vào trong bộ nhớ của AI có thể xảy ra. Khi con người đặt câu hỏi, chat bot tổng hợp dữ kiện bao gồm các kiến thức trong thế giới thông tin có sẵn của mô hình ngôn ngữ lớn để đưa ra câu trả lời.

Theo báo cáo mới nhất của New Scientist, PGS David Bamman phụ trách chuyên ngành học máy và khoa học xã hội máy tính trường Đại học California đã cùng các cộng sự tạo ra một thử nghiệm ngôn ngữ với ứng dụng ChatGPT. Kết quả cho thấy, ChatGPT và GPT-4 đã ghi nhớ rất nhiều tài liệu có bản quyền, đặc biệt là các ấn phẩm thuộc thể loại khoa học viễn tưởng và giả tưởng như Harry Potter, Trò chơi vương quyền, 451 độ F, Xứ Cát...

"Chúng tôi thấy rằng mô hình ngôn ngữ lớn (LLM) của OpenAI đã ghi nhớ một bộ sưu tập các tài liệu có bản quyền và mức độ ghi nhớ được gắn với tần suất các đoạn văn của những cuốn sách đó xuất hiện trên mạng. Không ai ngoài Open AI biết được ChatGPT đã sao chép được những gì”, đại diện nhóm nghiên cứu cho biết. PGS David Bamman nhấn mạnh rằng các tác phẩm sci-fi và fantasy được mô hình ngôn ngữ lớn tổng hợp nhiều bởi sự phổ biến của dòng văn học đó trên Internet.

Qua sự việc trên, nhà nghiên cứu AI Margaret Mitchell nhận định: "Đây là biểu hiện của việc yếu kém trong quản lý dữ liệu. Có một câu nói bất hủ trong lĩnh vực học máy rằng 'Đừng tin vào dữ liệu đào tạo bạn có'. Câu nói có hàm ý nhắc nhở về trách nhiệm kiểm duyệt đầu vào của thông tin với trí tuệ nhân tạo ngay cả khi khối lượng dữ liệu trở nên quá lớn".

Để làm rõ cho vấn đề trên, các nhà khoa học đến từ Berkley mong đợi phía OpenAI có thể công bố các dữ liệu đào tạo, tức dữ liệu đầu ra đã nạp vào AI. Tuy nhiên phía công ty này vẫn chưa có phản hồi cụ thể.

Sau khi nghiên cứu này được công bố, GS Tyler Ochoa, đến từ Khoa Luật của Đại học Santa Clara, nói rằng các vụ kiện chống lại LLM có khả năng xảy ra. "Nếu sản phẩm đầu ra của AI có mức độ tương đồng nhất định với đầu vào chắc chắn sẽ tạo nên cơ sở pháp lý của hành vi vi phạm bản quyền", GS Tyler Ochoa cho biết.

Đây không phải vụ lùm xùm về vấn đề bản quyền với trí tuệ nhân tạo đầu tiên xảy ra trong thời gian gần đây. Vào hồi tháng 1, một nhóm nghệ sĩ thị giác đã kiện các công ty trí tuệ nhân tạo Stability AI, Midjourney và DeviantArt vì vi phạm bản quyền. Theo bên tố cáo, các tác phẩm AI được tạo ra đã tổng hợp năm tỷ điểm hình ảnh từ các trang web Getty Images, Flickr, Shopify mà không cần giấy phép nào.

Hiện nay chưa có một bộ luật bản quyền nào đối với AI. Riêng tại Mỹ, luật bản quyền hiện hành đang bảo vệ quyền sáng tạo của con người. Các nhà chức trách chưa có động thái nào lên tiếng về tác phẩm do AI tạo ra. Trong khi đó, không chỉ OpenAI, mô hình ngôn ngữ lớn hiện nay đang là một công nghệ được các ông trùm công nghệ đua nhau khai thác. Cuộc chơi đã có sự góp mặt của NVIDIA, Microsoft, HuggingFace... Việc bảo vệ bản quyền cho các sáng tác và hành lang pháp lý, đạo đức học máy đối với AI là một điều cấp thiết.

Đức Huy

Nguồn Zing.vn

Bài liên quan

Tin mới

Lãng đãng hồ Bán Nguyệt

Sự thù ghét văn chương

Theo dấu xưa - cổ vật

Dừng chân ở "Trạm kí ức"

Hội ngộ văn chương Việt – Trung: Những tiếng nói từ Thượng Hải

Madame X: Bức chân dung đã làm rúng động Paris

Đọc nhiều

Tứ tuyệt mùa thu - Thơ Trương Anh Tú

Một thời bao cấp, một thời tập thể. Tùy bút của Hải Hà

Chùm truyện ngắn của nữ nhà văn Pháp Colette

Gươm thiêng Đại Việt. Truyện ngắn của Nguyễn Anh Tuấn

Hình tượng nước trong văn Nguyễn Ngọc Tư từ góc nhìn phê bình sinh thái

tin bài khác

Mơ hồ - Thơ Tô Thi Vân

Baovannghe.vn- Như còn ấm một vòng tay con gái/ Xao xuyến một dáng hình

Tưởng nhớ họa sĩ Lê Thiết Cương

Baovannghe.vn - Triển lãm Tưởng nhớ họa sĩ Lê Thiết Cương là dịp để người thân, bạn bè, đồng nghiệp cùng công chúng yêu mến nghệ thuật hội ngộ, tưởng nhớ và tri ân người họa sĩ tài hoa đã dành trọn cuộc đời cống hiến cho mỹ thuật đương đại Việt Nam.

Hội nghị tri ân người có công toàn quốc: Khắc ghi những hy sinh vì Tổ quốc

Baovannghe.vn - Hội nghị tri ân người có công với cách mạng toàn quốc năm 2026 không chỉ là dịp tôn vinh những cống hiến, hy sinh to lớn của các thế hệ đi trước mà còn phát động phong trào đẩy mạnh chăm lo người có công, tạo sức lan tỏa sâu rộng trong toàn xã hội hướng tới kỷ niệm 80 năm Ngày Thương binh - Liệt sĩ (27/7/1947-27/7/2027).

Chuyên đề

ChatGPT có khả năng vi phạm bản quyền nhiều tác phẩm văn học

Tin mới

Lãng đãng hồ Bán Nguyệt

Sự thù ghét văn chương

Theo dấu xưa - cổ vật

Dừng chân ở "Trạm kí ức"

Hội ngộ văn chương Việt – Trung: Những tiếng nói từ Thượng Hải

Madame X: Bức chân dung đã làm rúng động Paris

Đọc nhiều

Tứ tuyệt mùa thu - Thơ Trương Anh Tú

Một thời bao cấp, một thời tập thể. Tùy bút của Hải Hà

Chùm truyện ngắn của nữ nhà văn Pháp Colette

Gươm thiêng Đại Việt. Truyện ngắn của Nguyễn Anh Tuấn

Hình tượng nước trong văn Nguyễn Ngọc Tư từ góc nhìn phê bình sinh thái

tin bài khác

Mơ hồ - Thơ Tô Thi Vân

Tưởng nhớ họa sĩ Lê Thiết Cương

Hội nghị tri ân người có công toàn quốc: Khắc ghi những hy sinh vì Tổ quốc

Hoa thác dọc sông Đà

"Tháo gỡ điểm nghẽn - Khơi thông nguồn lực - Thúc đẩy tăng trưởng"

Đọc nhiều

Tứ tuyệt mùa thu - Thơ Trương Anh Tú

Một thời bao cấp, một thời tập thể. Tùy bút của Hải Hà

Chùm truyện ngắn của nữ nhà văn Pháp Colette

Gươm thiêng Đại Việt. Truyện ngắn của Nguyễn Anh Tuấn

Hình tượng nước trong văn Nguyễn Ngọc Tư từ góc nhìn phê bình sinh thái