Những nỗ lực tiên phong trong lĩnh vực này - mặc dù đối mặt với nhiều hoài nghi và rủi ro - vẫn được các nhà nghiên cứu kiên trì theo đuổi, mở đường cho một cuộc hội ngộ mới giữa nghệ thuật và công nghệ. Bước sang thế kỉ XXI, sự phát triển vượt bậc của kĩ thuật số đã đưa lĩnh vực này sang một giai đoạn bùng nổ: Các “thành tựu” nghệ thuật do công nghệ tạo ra xuất hiện với tốc độ chóng mặt, khiến giới chuyên môn lẫn công chúng không khỏi kinh ngạc. Đặc biệt trong những năm gần đây, trí tuệ nhân tạo (AI) nổi lên như một lực lượng sáng tạo đầy thách thức - không chỉ góp phần hỗ trợ mà còn tự thân kiến tạo các sản phẩm nghệ thuật với mức độ biểu cảm và tính sáng tạo ngày càng ấn tượng, buộc chúng ta phải nghiêm túc nhìn nhận lại bản chất của hành vi sáng tạo trong kỉ nguyên hậu kĩ thuật số.
Khảo sát sự tham gia của AI vào lĩnh vực nghệ thuật thị giác, dễ nhận thấy, đây là một quá trình tích lũy kéo dài hơn nửa thế kỉ. Những tác phẩm nghệ thuật máy tính đầu tiên không phải là tranh, mà là những đường sóng dao động trên màn hình ống tia điện tử. Những hình ảnh bất quy tắc, đôi khi do lỗi phần cứng gây ra, lại được lưu giữ và trưng bày với tên gọi “nghệ thuật lỗi” (glitch art), song cũng lại mở ra một trường thẩm mĩ mới. Năm 1963, tác phẩm Splatter Diagram đã giành giải nhất trong cuộc thi nghệ thuật máy tính đầu tiên (CAC), đánh dấu một cột mốc quan trọng trong lịch sử giao thoa giữa nghệ thuật và công nghệ. Năm 1973, nghệ sĩ Harold Cohen hợp tác cùng chương trình máy tính do chính ông phát triển - AARON. Ban đầu, sản phẩm được tạo ra chỉ là những hình vẽ đơn sắc, sau đó được Cohen tô màu hoàn thiện và được trưng bày tại Venice Biennale. Cuộc hợp tác này kéo dài hơn 40 năm, là minh chứng sớm nhất cho mô hình “đồng sáng tạo” giữa người và máy. Từ năm 2016, các nền tảng sáng tạo nghệ thuật sử dụng trí tuệ nhân tạo liên tiếp ra đời, mở rộng không gian biểu đạt và đặt lại câu hỏi về vai trò của chủ thể sáng tạo. Sean Tracey giới thiệu phần mềm Night Cafe; năm 2018, nhóm Obvious đào tạo thuật toán GAN dựa trên 15.000 bức chân dung cổ điển từ WikiArt để tạo nên bức Edmond de Belamy, sau đó được bán đấu giá tại Christie’s với giá 432.500 USD - sự kiện đánh dấu một bước ngoặt trong việc công nhận AI như một “tác giả” nghệ thuật. Năm 2022, tác phẩm Théâtre D’opéra Spatial do Jason Allen thực hiện bằng Midjourney giành giải nhất tại Cuộc thi Colorado State Fair Fine Arts Competition, gây tranh luận lớn về tính minh bạch và đạo đức của nghệ thuật AI.
Ở lĩnh vực âm nhạc, ngày 21/8/2017, nữ ca sĩ Taryn Southern phát hành album Break Free, đánh dấu một trong những sản phẩm âm nhạc đầu tiên hợp tác với AI. Năm 2019, tập đoàn Deutsche Telekom của Đức đã hoàn tất Bản giao hưởng số 10 của Beethoven - dự án tái hiện tác phẩm dang dở của nhà soạn nhạc thiên tài bằng cách sử dụng AI để tạo bản nháp, sau đó được các nhạc sĩ chỉnh sửa. Sang năm 2024, các nền tảng như Suno và Udio liên tiếp ra mắt, với khả năng biến bất kì cụm từ nào thành ca khúc hoàn chỉnh, trong khi mô hình Sky Music của Kunlun Wanwei mở rộng quy mô sáng tác nhạc tự động bằng AI lên tầm công nghiệp.
Trong điện ảnh, đầu năm 2024, phần mềm Vidu AI (còn gọi là Sora) do Đại học Thanh Hoa phát triển cho phép người dùng tạo video chất lượng cao từ vài dòng văn bản nhập liệu. Cũng trong thời điểm này, bộ phim Our T2 Remake ra đời, được sản xuất hoàn toàn bởi AI - từ kịch bản, nhạc nền, lồng tiếng cho đến biên tập - và chính thức ra mắt tại Los Angeles, đặt ra vấn đề về tương lai của lao động sáng tạo trong ngành công nghiệp điện ảnh.
Trong văn học, ngay từ năm 1959, Theo Lutz - nhà khoa học máy tính thuộc Đại học Stuttgart - đã sử dụng tiểu thuyết Lâu đài của Kafka làm dữ liệu huấn luyện, phát triển chương trình sản sinh thơ với cấu trúc định trước và từ ngữ ngẫu nhiên theo phong cách Dada. Ba năm sau, phần mềm sáng tác thơ đầu tiên có tên Auto - beatnik được ra đời tại Hoa Kì. Đến năm 1998, robot Brutus có thể viết một truyện ngắn hoàn chỉnh trong 15 giây. Tháng 3 năm 2006, nhóm nghiên cứu tại Đại học Hakodate Future (Nhật Bản) đoạt giải trong cuộc thi sáng tác với tiểu thuyết Ngày mà robot viết tiểu thuyết, phản ánh một góc nhìn châm biếm về việc thay thế con người trong lĩnh vực này. Năm 2007, nhóm nghiên cứu của Đại học Thanh Hoa cho ra mắt tập thơ Ánh sáng mất đi qua cửa sổ kính - được xem là tác phẩm đầu tiên của AI tại Trung Quốc được bảo hộ bản quyền. Năm 2024, nhóm từ Đại học Sư phạm Đông Trung Quốc phối hợp với hệ thống AI để viết tiểu thuyết võ hiệp Sứ giả của định mệnh dài hơn một triệu chữ. Bên cạnh đó, nền tảng Deep Seek vừa ra mắt cũng cho thấy khả năng xử lí và tạo lập văn bản ở nhiều thể loại, từ tiểu thuyết giả tưởng đến truyện ngắn hiện đại. Những thành tựu này chứng tỏ rằng không có thể loại văn học nào vượt khỏi tầm với của trí tuệ nhân tạo - từ thơ, truyện ngắn cho đến tiểu thuyết quy mô lớn - đồng thời đặt ra câu hỏi quan trọng về thẩm quyền và tính nhân bản trong lao động sáng tạo thời đại máy học.
Danh sách này còn có thể tiếp tục kéo dài, đặc biệt là trong thập kỉ thứ ba của thế kỉ XXI, những đột phá mới của AI đang xảy ra nhanh chóng và ấn tượng. Mặc dù những ví dụ trên chưa đầy đủ, nhưng chúng ta có thể nhận thấy rằng: Không có thể loại nghệ thuật nào có thể ngăn cản AI gia nhập, không có thể loại nghệ thuật nào quá phức tạp đến mức nó không thể tham gia sáng tạo. Chẳng hạn như khi nói về vũ đạo hoặc kịch sân khấu, những thể loại cần sự biểu diễn của con người: Vào năm 2024, tại Đại học Sân khấu Thượng Hải, vở kịch Thành phố khổng lồ đã được trình diễn, đây là vở kịch đầu tiên ở Trung Quốc mà robot là nhân vật chính, 40 máy chiếu tạo ra không gian trình chiếu toàn cảnh, trong đó vừa có diễn viên người thật vừa có diễn viên robot, người và máy cùng biểu diễn trên sân khấu.
Ở Việt Nam, mặc dù sự phát triển của lĩnh vực sáng tạo văn học và nghệ thuật bằng AI còn ở giai đoạn đầu, nhưng cũng đã đạt được một số thành tựu nhất định. Trong lĩnh vực sáng tạo văn học, FPT AI và các nhà khoa học thuộc Đại học Quốc gia Hà Nội đã có những thử nghiệm trên phương diện sáng tạo văn học bằng AI. FPT AI đã phát triển công cụ tạo thơ bằng AI dựa trên kho ngữ liệu tiếng Việt có tên “Poet Assistant”. Công cụ này có thể tạo thơ tiếng Việt dựa trên chủ đề hoặc từ khóa do người dùng nhập vào, đồng thời bắt chước phần nào nhịp điệu và phong cách của thơ truyền thống Việt Nam. Xuất phát từ ngôn ngữ tự nhiên (NLP) và mối quan hệ của nó với các sắc thái của ngôn ngữ, cảm xúc và phong cách, các tác giả Huỳnh Minh Triết, Lê Bảo Quân trong bài viết Tạo thơ tiếng Việt và triển vọng của việc dịch thơ giữa các ngôn ngữ đã đề xuất sử dụng các mô hình ngôn ngữ lớn để tạo ra các bài thơ tiếng Việt thuộc nhiều thể loại khác nhau từ các gợi ý ngôn ngữ tự nhiên, từ đó tạo ra một quá trình trực quan với khả năng kiểm soát nội dung nâng cao. Mô hình mà các tác giả cho là hiệu quả nhất - biến thể GPT-3 Babbage đạt được điểm đánh giá tùy chỉnh là 0.8, được tối ưu cho thể lục bát. Ngoài ra, các tác giả cũng đã khám phá ý tưởng chuyển thể thơ thành các gợi ý văn bản thông thường và đạt được điểm số khá cao là 0.781 trong thể loại thơ lục bát. Thí nghiệm này mở ra tiềm năng cho việc dịch thơ giữa các ngôn ngữ với những bài thơ đã dịch làm ngữ liệu đầu vào, đồng thời duy trì kiểm soát hoàn toàn đối với nội dung được tạo ra.
Trong lĩnh vực nghệ thuật thị giác, các nghệ sĩ và công ti công nghệ Việt Nam đang tích cực khám phá ứng dụng của AI trong việc tạo hình ảnh và thiết kế. Các nghệ sĩ đã sử dụng công nghệ mạng đối nghịch sinh (GAN) để tạo ra hàng loạt tác phẩm nghệ thuật số kết hợp các yếu tố văn hóa truyền thống Việt Nam. Ví dụ, tác phẩm Hanoi Dreamscape đã kết hợp kiến trúc truyền thống Hà Nội với phong cách nghệ thuật trừu tượng hiện đại, mang đến trải nghiệm thị giác độc đáo. Tác phẩm này được trưng bày tại Triển lãm Nghệ thuật Số Quốc tế Hà Nội năm 2022 và nhận được sự quan tâm rộng rãi. Tổ chức nghiên cứu AI hàng đầu tại Việt Nam - VinAI Research - cũng đã phát triển các mô hình AI có thể tạo ra các tác phẩm minh họa và thiết kế mang đậm nét văn hóa Việt Nam. Các dự án này sử dụng công nghệ AI, thực tế ảo (VR), thực tế tăng cường (AR) và các công cụ số khác để làm phong phú thêm trải nghiệm nghệ thuật, đồng thời mang đến một cái nhìn mới mẻ về cách nghệ thuật có thể phát triển trong thời đại công nghệ.
Trong lĩnh vực sáng tạo âm nhạc, nghiên cứu của Phạm Văn Toàn, Trần Ngô Quang Ngọc, Tạ Minh Thanh - Phương pháp Học sâu trong phân loại giọng hát ca sĩ cho nhạc trẻ Việt Nam - đã tiến hành phân loại giọng hát và nhận diện ca sĩ nhằm phục vụ cho việc truy xuất thông tin âm nhạc, lập chỉ mục các thuộc tính âm nhạc...Trong công trình này, các nhà nghiên cứu đã sử dụng việc phát hiện đoạn vocal và tách giọng hát như các bước tiền xử lí nhằm trích xuất giọng ca sĩ khỏi âm thanh hỗn hợp. Để xây dựng bộ phân loại ca sĩ, họ đề xuất một kiến trúc mạng nơ-ron hoạt động với Mel Frequency Cepstral Coefficient (MFCC) làm đặc trưng đầu vào được trích xuất từ giọng hát nói trên. Một ví dụ tiêu biểu cho sự tham gia ngày càng sâu của AI vào lĩnh vực nghệ thuật đại chúng là ca khúc Hoang tưởng trong đêm - bài hát chủ đề của bộ phim kinh dị Quỷ nhập tràng. Tác phẩm này được sáng tác và thể hiện hoàn toàn bởi hệ thống AI, từ phần phối khí đến giọng hát. Với giai điệu u tối, kết cấu âm thanh ám ảnh và ca từ giàu tính biểu tượng, ca khúc không chỉ làm nổi bật không khí liêu trai của bộ phim mà còn cho thấy khả năng của AI trong việc mô phỏng cảm xúc và thiết kế trải nghiệm nghệ thuật một cách trọn vẹn. Trường hợp Nguyễn Hoàng Bảo Đại với dự án Nhạc sĩ AI cũng cho thấy sự “xâm nhập” mạnh mẽ của AI trong lĩnh vực âm nhạc trên nền tảng xử lý ngôn ngữ tự nhiên (Natural language processing) và thị giác máy tính (Computer Vision).
Sự phát triển nhanh chóng của các ứng dụng AI trong sáng tạo nghệ thuật đang tạo ra những chuyển biến sâu sắc không chỉ trong lĩnh vực văn học, mà cả âm nhạc, hội họa, nhiếp ảnh và điện ảnh. Nhiều nghiên cứu gần đây chỉ ra rằng AI đang tạo ra một bước nhảy vọt ngoạn mục trong lịch sử nghệ thuật, không chỉ thúc đẩy quá trình sáng tạo mà còn định hình một kỉ nguyên thẩm mĩ mới, nơi ranh giới giữa sáng tác và mô phỏng trở nên mờ nhòe. Tuy nhiên, chính sự thay đổi mạnh mẽ này lại đặt ra một loạt câu hỏi hệ trọng về bản chất của nghệ thuật, vị thế của con người trong sáng tạo, và tương lai của cảm hứng nghệ thuật.
Từ góc nhìn truyền thông học, Marshall McLuhan từng khẳng định rằng mỗi thời đại đều được kiến tạo bởi đặc trưng truyền thông kí hiệu của chính nó. Theo ông, “văn hóa luôn thể hiện qua những kí hiệu đa dạng... và cái gọi là văn hóa, xét về bản chất, chính là sự sáng tạo, giao tiếp, hiểu biết và giải thích thông qua kí hiệu”. Trên nền tảng đó, sự nổi lên của các văn bản do AI tạo ra trong lĩnh vực nghệ thuật - từ thơ ca, truyện ngắn, đến âm nhạc, hội họa và phim ảnh - cho thấy một sự chuyển dịch nền tảng trong cấu trúc kí hiệu học của thời đại. Những văn bản này, tuy được tạo bởi thuật toán, lại có khả năng biểu đạt và kích thích cảm xúc không thua kém gì các sản phẩm sáng tạo của con người. Tuy nhiên, việc AI bước vào vai trò của một chủ thể sáng tạo lại dẫn đến một nghịch lí văn hóa: Một công cụ vốn được sinh ra từ tính toán và mô phỏng lại trở thành trung tâm của cảm hứng nghệ thuật. Theo Triệu Nghị Hành, “kí hiệu là cảm nhận được cho là mang ý nghĩa” và nghệ thuật là những hình thức kí hiệu mang ý nghĩa vượt ra ngoài sự tầm thường. Việc các tác phẩm do AI tạo ra được trưng bày trong bảo tàng, triển lãm nghệ thuật và được giới phê bình đón nhận, đặt ra yêu cầu cần phải xét lại tiêu chí xác lập giá trị nghệ thuật trong thời đại mới.
Một điều không thể phủ nhận là AI không được thiết kế ban đầu với mục tiêu sáng tạo nghệ thuật. Nó là sản phẩm phục vụ cho quân sự, y tế, tài chính và phân tích dữ liệu. Nhưng chính khả năng mô phỏng tư duy và tạo sinh ngôn ngữ khiến AI trở thành công cụ biểu đạt văn hóa đặc biệt, vượt trội so với các thành tựu khoa học khác như công nghệ sinh học, năng lượng tái tạo hay kĩ thuật nano. Điều khiến AI khác biệt là khả năng can thiệp vào hạ tầng biểu đạt - vùng lõi của kí hiệu học - nơi từng được xem là độc quyền của cảm hứng con người.
Trong không gian nghệ thuật, AI không còn đóng vai trò như chủ đề của các tác phẩm viễn tưởng, mà thực sự bước vào vị trí người sáng tạo. Không hiếm trường hợp, AI đã đảm nhận vai trò tác giả trọn vẹn trong sản xuất thơ, truyện, tranh vẽ, hay cả video và phim ngắn. Điều này đặt ra một loạt câu hỏi hệ trọng: Liệu nghệ thuật AI là một thể loại độc lập? Liệu nó có thể thay thế nghệ thuật nhân loại? Và nếu vậy, nghệ thuật hậu con người sẽ mang hình hài ra sao?
Thêm vào đó, xét một cách chặt chẽ, khái niệm “nghệ thuật trí tuệ nhân tạo” là một phép tu từ mâu thuẫn. Các hoạt động của trí tuệ nhân tạo mang tính mục đích cao và mang tính công dụng, trong khi sáng tạo nghệ thuật lại xuất phát từ động cơ không mang tính công dụng. Nghệ thuật sử dụng các yếu tố “ngoại lai hóa” để ngăn cản hiệu suất nhận thức, kì vọng người tiếp nhận sẽ dừng lại lâu hơn với cảm quan của văn bản. Hai yếu tố này có thể nói là có chức năng văn hóa hoàn toàn trái ngược. Ngay từ khi nghệ thuật “kĩ thuật số” mới xuất hiện, triết gia người Pháp Abraham A. Moles đã nhận định rằng nghệ thuật máy tính “không thể thay thế cảm hứng thuần túy, bởi nó xuất phát từ các phương trình chức năng chứ không phải từ sự giằng xé tâm lí của con người”. Tương tự, trong công trình Hoàn cảnh Hậu hiện đại, Jean François Lyotard cũng nêu rõ rằng máy tính không có khả năng tự đánh giá giá trị nghệ thuật của chính sản phẩm mà nó tạo ra. Nhà lí luận nghệ thuật Gustav Metzger thì cảnh báo: “Máy tính, giống như mọi công nghệ khác, luôn bị các hệ tư tưởng thống trị thao túng, và nghệ thuật do máy móc tạo ra không thể trung lập về mặt chính trị hay đạo đức”. Trong khi đó, nhà vật lí lí thuyết người Anh Roger Penrose đã trình bày một lập luận chi tiết trong cuốn Tâm trí của hoàng đế mới: Máy tính, trí óc và các định luật vật lí rằng ý thức và sáng tạo không thể được tái tạo thông qua các thuật toán, bởi lẽ “toàn bộ tư duy sáng tạo đều xuất phát từ các tiến trình không thể tính toán”.
Trong thực tế, cho đến gần đây, rất ít nhà tư tưởng biện hộ cho nghệ thuật AI như một chủ thể sáng tạo độc lập. Từ những thành tựu đã được liệt kê, có thể thấy rõ rằng AI vẫn chỉ đóng vai trò là công cụ - dù có thể là một công cụ cực kì mạnh mẽ và hiệu quả. Ba hình thức chính của sự kết hợp giữa người và máy trong nghệ thuật là: (1) “lựa chọn của con người” (human-selected), nghĩa là AI tạo ra khối lượng lớn văn bản, hình ảnh hay âm thanh, nhưng con người vẫn là người chọn lựa và định hình lại sản phẩm cuối cùng; (2) “hỗ trợ của con người” (human-assisted), trong đó AI chỉ cung cấp bản nháp và con người thực hiện chỉnh sửa; và (3) “sáng tạo do con người khởi xướng” (human-initiated), tức là con người vẫn là người khơi nguồn ý tưởng, viết prompt, chọn phong cách, và giám sát toàn bộ quá trình.
Có thể nói, cho đến nay, chưa có hệ thống nào có thể tự động phát sinh một tác phẩm nghệ thuật hoàn chỉnh, tự xác lập ngữ cảnh và tự đánh giá giá trị thẩm mĩ của sản phẩm mình tạo ra. Những sáng tác “tự động” mà ta đang chứng kiến thực chất vẫn nằm trong vòng kiểm soát và lựa chọn của con người. Bởi lẽ, bản thân vấn đề “lựa chọn” - yếu tố cốt lõi trong mọi sáng tạo nghệ thuật - vẫn là một năng lực không thể định lượng, không thể học được bằng thống kê dữ liệu đơn thuần. Thêm vào đó, sự khác biệt giữa nghệ thuật và sản phẩm văn hóa đại trà chính là khả năng định hình cá tính thẩm mĩ, khả năng “tháo khuôn” thay vì chỉ “tái tạo” hình thức. Nếu không có ý chí thẩm mĩ của con người, các sản phẩm AI dễ dàng rơi vào trạng thái dư thừa, rập khuôn và phi bản sắc. Như vậy, thay vì thay thế nghệ sĩ, AI đang buộc nghệ sĩ định nghĩa lại vai trò của mình trong một môi trường mới - nơi cảm hứng, lựa chọn và bản sắc cá nhân trở thành yếu tố then chốt hơn bao giờ hết.
Ngoài ra, những vấn đề pháp lí liên quan đến bản quyền cũng chỉ ra rằng: nếu không có tác giả con người đứng tên, thì các tác phẩm do AI tạo ra sẽ không được bảo hộ quyền sở hữu trí tuệ. Việc này một lần nữa khẳng định rằng AI chưa thể được xem là chủ thể sáng tạo. Tất cả các vụ kiện gần đây liên quan đến việc AI sử dụng dữ liệu có bản quyền trong huấn luyện đều buộc trách nhiệm về phía tổ chức phát triển hệ thống. Chẳng hạn, tổ chức Fairly Trained hiện đang theo dõi các trường hợp vi phạm tiềm tàng trong các hệ thống “text-to-image” và khẳng định rằng bất cứ hệ thống nào được huấn luyện trên dữ liệu có bản quyền mà không có giấy phép đều có thể bị kiện.
Từ đó, ta có thể rút ra một lập luận mang tính khái quát hơn: trong giai đoạn hiện nay, AI chưa thể là “nghệ sĩ”, mà mới chỉ là công cụ mở rộng năng lực biểu đạt của nghệ sĩ. Nhưng chính sự hiện diện của nó lại đặt nghệ thuật trước một ngưỡng tái định nghĩa sâu sắc - không phải vì nó phá hủy nghệ thuật, mà vì nó làm lộ rõ bản chất sáng tạo của con người qua sự đối sánh và đối thoại. Trong thế giới đang tiến nhanh đến hậu nhân loại, có lẽ điều cần thiết không phải là bác bỏ AI, mà là tìm cách giữ vững nhân tính trong mọi cuộc đối thoại thẩm mĩ với cái máy.
![]() |
| Ảnh minh họa |