![]() |
| Ảnh: Base.vn |
Tôi từng làm cho dự án của công ty công nghệ hàng đầu thế giới, từng là một trong những người Việt đầu tiên huấn luyện những mô hình siêu nhỏ để AI hiểu báo chí tiếng Việt. Khi Chat GPT còn chưa xuất hiện, tôi đã hướng dẫn AI hiểu bối cảnh của tin bài trong báo chí tiếng Việt.
Sau này, khi chuyển sang viết nội dung thương mại, tôi đem kinh nghiệm đó vào sản xuất. AI là công cụ tạo ưu thế cạnh tranh vượt trội. Tôi chỉ việc đẩy ý tưởng vào, tạo lệnh, chỉnh vài tham số, biên tập kỹ càng, là có thể dựng nên cả loạt bài: bài quảng cáo, bài giới thiệu sản phẩm, bài truyền thông nội bộ, bài PR, bài “chia sẻ đầy cảm hứng” cho một lãnh đạo nào đó… Năng suất tăng, chỉ số chuyển đổi tăng, đương nhiên, thu nhập, vị trí công việc cũng tăng. Với AI, mình tôi có thể làm việc ngang một phòng nội dung truyền thông 10 người làm theo lối truyền thống.
Nhưng càng dùng, tôi càng thấy mình có cảm giác khó chịu. Một thứ “mùi” lạ trong nhiều đoạn văn. Nó không phải lỗi chính tả, cũng không phải câu sai ngữ pháp. Nó giống như một lớp sơn phết lên câu từ, khiến chúng trơn đi, bóng lên, và bài nào cũng tròn trịa, nhờ nhờ. Chúng vẫn hiệu quả trong chuyển đổi từ bài viết thành đơn hàng hay các chỉ số mà doanh nghiệp cần. Nhưng ở góc độ người viết, tôi hiểu, AI đang bộc lộ mặt trái.
Để hiểu rõ cái “mùi” AI đang nồng nặc từ bài viết của tôi ngày xưa tới khắp các bài trên mạng xã hội, trên báo chí bây giờ, tôi đi tìm câu trả lời cho câu hỏi: AI đang vận hành như thế nào?
Các nhà nghiên cứu gọi cách AI (cụ thể là các mô hình AI lớn nhất bây giờ là Chat GPT, Gemini, Grok) vận hành bằng cụm từ: English-centric. Tức là toàn bộ không gian tư duy của mô hình được xây dựng với tiếng Anh làm trục. Dữ liệu huấn luyện nghiêng về tiếng Anh. Những ngôn ngữ khác, trong đó có tiếng Việt, chỉ là nhánh phụ. Và phải nhấn mạnh là AI có dùng ngôn ngữ tiếng Việt để huấn luyện mô hình, nhưng quá nhỏ trong cơ cấu dữ liệu tiếng Anh mà các hệ thống đang dùng. Nói ngắn lại, máy đang tư duy bài vở theo thiên kiến tiếng Anh.
Khi trả lời, hệ thống trả về tiếng Việt, chọn từ Việt để trình diễn biểu đạt. Kết quả là ta thấy một đoạn văn thuần Việt trên bề mặt. Nhưng bố cục logic, cách đi từ ý này sang ý khác, cách chia đoạn, cách kết luận, cách chọn hình ảnh, cấu trúc ngôn từ… mang tư duy thiên về ngôn ngữ tiếng Anh.
Cũng phải làm rõ, ở đây không có âm mưu thực dân ngôn ngữ nào. Thực tế, tiếng Anh đang là ngôn ngữ có lượng dữ liệu công khai lớn nhất, nhiều công trình khoa học nhất, nhiều báo cáo nhất, nhiều bài viết được số hoá nhất. AI được “nuôi” bằng những gì thế giới đã số hoá. Trong thế giới số hoá, ngôn ngữ tiếng Anh áp đảo. Kết quả hiển nhiên là tư duy AI có trục tiếng Anh là trung tâm.
Nếu để ý mặt chữ, ta sẽ thấy những hiện tượng lặp lại rất rõ. Những kiểu mở bài giống nhau đến mức có thể hoán đổi cho nhau giữa các đề tài. Những cụm từ “nghe quen lắm” trong thư chúc mừng, trong status tri ân, trong lời dẫn phóng sự.
Thử mở một hộp quà Tết của các công ty. Họ sẽ nói về hành trình, về nỗ lực, về “một năm nhiều thử thách và cơ hội”. Và thử tìm xem có câu nào có cấu trúc “không chỉ… mà còn” hay “có những… X là một trong số ấy” hay cấu trúc “mỗi… là một”. Tôi khá chắc ai cũng sẽ gặp một hoặc nhiều cấu trúc này ở thư cảm ơn, thiệp chúc Tết, hay bài phát biểu của lãnh đạo. AI cả đấy!
Người ta phân biệt AI hay người viết bằng dấu gạch ngang dài, bằng dấu ngoặc kép cong hay thẳng, có thống nhất không. Đó là thuở hồng hoang mà giờ người viết nào cũng ý thức để chỉnh. Bước tiếp sau là những cấu trúc câu đã nêu. Dù tiếng Việt vẫn có những cấu trúc ấy nhưng với AI, chúng lặp lại nhiều tới bất thường. Đó chính là thứ tạo ra “mùi” AI.
Cái “mùi” ấy bây giờ len vào mọi thứ: video quảng cáo một loại sữa, bài viết giới thiệu một khu đô thị, lời tri ân dành cho khách hàng trên fanpage. Và tệ hơn, chúng vào cả lời dẫn của những bản tin thời sự phát sóng giờ vàng, đập vào tai khán thính giả cả nước.
Trước thời AI, mỗi toà soạn, mỗi cây bút, mỗi đài truyền hình vẫn còn giữ được vài cá tính riêng. Các cây bút thường có những cấu trúc câu hay cụm từ lặp lại “bất thường” như thế. Nhưng đó là câu chuyện bản sắc cá nhân và khi ghép lại trên bình diện rộng như văn đàn, báo giới tạo tiếng nói đa thanh. Bây giờ, khi nhiều người cùng dựa vào cùng một loại mô hình, văn phong được “chuẩn hoá” lại. Ai cũng giống ai. Và ai cũng giống AI.
Ở góc độ hình ảnh, sự ảnh hưởng càng rõ. Kho liên tưởng mà các mô hình mang tới tiếng Việt rất giàu các ẩn dụ trong văn hoá phương Tây: rớt mặt nạ, người hùng không áo choàng, chiến binh thầm lặng, sang chấn tập thể… cũng xuất hiện dày đặc tới bất thường. Ngược lại, dù các bài viết Facebook từ mẹ bỉm sữa tới các bài báo chuyên gia ngày một dài nhưng thành ngữ, điển tích từ văn học, văn hóa Việt ngày một ít.
Đơn giản vì AI không làm được điều ấy!
Nó không thể giật một cái tít kiểu “Trump vẫn là Trump yêu muôn đời muôn kiếp” như một bài báo tôi từng rất thích. Bởi nó không đủ ngữ liệu đầu vào, không có ký ức về một bản tình ca, không có khiếu hài hước giễu nhại. Và tuyệt nhiên, nó không có khoái cảm với việc chơi chữ tiếng Việt.
Nhiều nhà văn chọn cách dứt khoát không đụng tới AI. Đó là cách an toàn nhất để giữ gìn tiếng Việt, hình ảnh văn hóa Việt trong nội dung. Nó cũng làm giàu thêm tiếng Việt trong ngữ liệu đầu vào tiếng Việt cho AI nếu cuốn sách, bài luận đó được số hóa. Và cũng chỉ có nhà văn và số ít nhà báo làm được như thế. Bởi các nhà văn không bị áp lực bài vở nhanh nhiều như báo chí mạng, càng không chịu áp lực KPI như sản xuất nội dung thương mại.
Trong những chiến dịch truyền thông, trong các dự án phải đối diện với bảng tính doanh số, câu chuyện bớt lãng mạn hơn. Ở đó, AI đã trở thành một phần của hạ tầng. Người sản xuất nội dung không toàn quyền lựa chọn. Họ bị kéo vào cuộc chơi của tốc độ, của chi phí, của năng suất. Ý niệm bỏ AI trong lĩnh vực này, nói thẳng là không ai dám bỏ. Và với các nền tảng số, chính những nội dung thương mại đang ảnh hưởng tới công chúng bậc nhất bởi quảng cáo, PR được trả tiền để đập vào mắt người dùng càng nhiều càng tốt.
Chúng ta buộc phải đối diện với bình thường mới. Vấn đề ở đây là trách nhiệm của người viết (bao gồm cả nội dung thương mại). Trách nhiệm ấy bắt đầu từ việc chấp nhận một sự thật rằng AI đã đến và sẽ ở lại. Dù chúng ta có thích hay không. Dù chúng ta có dùng hay không. Dù chúng ta có viết báo Tết ca ngợi hay cảnh báo nó.
Kế đó mới là ý thức trong bài viết của mình nếu phải dùng AI. Bởi hãy nhớ, xóa “mùi AI” không phải tránh để cấp trên, hay độc giả, khách hàng biết. Đó là trách nhiệm của mỗi người viết với tiếng mẹ đẻ.
Ta có quyền cắt bớt, thêm vào, thay đổi đến mức không còn nhận ra bản nháp ban đầu. Ta có quyền bỏ hẳn, viết lại từ đầu nếu nó “quá Tây”. Ta cũng có quyền giữ lại một vài câu, một vài đoạn, nếu cảm thấy chúng trùng với cách ta vẫn nghĩ, vẫn nói, và không phản bội lại tiếng Việt của mình.
Và cuối cùng, quan trọng hơn cả, thêm những câu chuyện, những trải nghiệm cá nhân, những cung bậc cảm xúc rất người thay vì chỉ sa vào một mớ khái niệm và thông tin. Những thứ đó, AI không tự sinh ra được. Nó chỉ có thể lặp lại nếu đã được ai đó đưa vào kho dữ liệu từ trước.
Tôi biết, nhiều doanh nghiệp công nghệ Việt đang nỗ lực dựng hệ thống AI Việt để có thể tư duy từ ngôn ngữ tiếng Việt. Nhưng điều này là hành trình rất dài, tốn công, tốn của và không thể có ngay. Trong khoảng “trễ” đó, các hội nghề nghiệp liên quan tới nghề viết nên có những bộ tiêu chuẩn hướng dẫn như khuôn vàng thước ngọc để sử dụng AI sao cho hiệu quả mà vẫn giữ được “tiếng Việt ân tình”. Chúng ta cần vạch ra những lằn ranh đỏ đạo đức không được phép vi phạm. Chúng ta cần vẽ đường cho hươu thay vì coi như nó là vùng xám hoặc chối bỏ sự tồn tại của AI cũng như tác động của nó tới tiếng Việt.
Bởi đơn giản, nếu để cho những bộ máy lấy tiếng Anh làm trục định hình dần dần ngôn ngữ của mình, thì đến một lúc nào đó, ngay cả khi ta vẫn nói, vẫn viết, vẫn in sách, vẫn đăng báo, ta sẽ không còn nhận ra tiếng Việt đã thay đổi thế nào trong câu chữ nữa.
Và tệ hơn, chúng ta đọc AI, nghe AI, dùng AI nhiều tới mức, khi tự viết, chúng ta tư duy và viết với văn phong như AI với ngôn từ và thiên kiến tiếng Anh.