Các công cụ kiểm tra nội dung do AI tạo ra (AI checker) nổi tiếng là thiếu chính xác. Chúng thường xuyên gắn cờ nhầm những đoạn văn do con người viết vì nhiều lý do như ngữ pháp, lựa chọn từ ngữ và phong cách. Điều này gây ra không ít rắc rối cho sinh viên, nhà văn và những người phụ thuộc vào con chữ. Vậy, nếu bài viết của bạn liên tục bị các công cụ phát hiện AI đánh dấu, đây là lý do và cách bạn có thể khắc phục.
Ngữ Pháp Quá Hoàn Hảo và Cấu Trúc Câu “An Toàn”
Một trong những cách các công cụ AI checker nhận diện nội dung do AI tạo ra là dựa vào mức độ hoàn hảo của ngữ pháp cũng như việc sử dụng các cấu trúc câu chuẩn, phổ biến. Theo lý thuyết, AI không mắc lỗi ngữ pháp, trong khi ngay cả những người viết giỏi nhất cũng có thể mắc lỗi nhỏ khi viết. Tương tự, nếu bài viết của bạn ít có rủi ro về phong cách, trở nên quá “sách vở” về ngữ pháp và thiếu đi dấu ấn cá nhân, điều này có thể kích hoạt cảnh báo từ các công cụ phát hiện AI.
Để minh họa, dưới đây là một đoạn văn do ChatGPT tạo ra dựa trên bài viết này và được dán vào GPTZero. Công cụ này đã gắn cờ với khả năng cao 100% được viết bởi AI.
GPTZero hiển thị đoạn văn bản được AI tạo ra 100% sau khi phân tích
Nếu tôi cố tình thêm một vài lỗi ngữ pháp nhỏ, như xóa một số dấu phẩy và thêm lỗi chính tả, cùng với một vài thay đổi nhỏ về văn phong, điểm số GPTZero giảm đáng kể xuống còn 81%.
Kết quả GPTZero giảm xuống 81% AI sau khi thêm lỗi ngữ pháp và chỉnh sửa văn phong
Sử Dụng Từ Ngữ Phổ Biến Mà AI Ưa Thích
Khi đọc một đoạn văn, nhiều người trong chúng ta có thể cảm nhận một cách trực giác liệu nó có phải do AI viết hay không, chẳng hạn như những đoạn văn dài dòng, sáo rỗng và các từ mà AI thường xuyên sử dụng, ví dụ như “delve” (nghiên cứu sâu), “highlight” (nổi bật), “underscore” (nhấn mạnh), “pose” (đặt ra), “the world of” (thế giới của), “strive” (phấn đấu) và vô số từ, cụm từ khác. Điều này thể hiện rõ qua sự gia tăng đột biến của từ “delve” trong các bài báo nghiên cứu khoa học vào năm 2023, trùng với thời điểm ChatGPT ra mắt.
Sử dụng cùng một văn bản như ví dụ trước, nếu tôi thực hiện một vài thay đổi nhỏ đối với các phân đoạn “cờ đỏ” lớn nhất của AI, điểm số GPTZero giảm thêm xuống còn 49% – một điểm số được coi là “do con người tạo ra”, mặc dù vẫn không thể thoát khỏi sự xem xét kỹ lưỡng trong môi trường học thuật. Rõ ràng, các công cụ kiểm tra AI có thể dễ dàng bị đánh lừa chỉ với một vài chỉnh sửa nhỏ, đây là một trong nhiều ví dụ làm nổi bật sự kém hiệu quả của chúng.
Báo cáo GPTZero cho thấy văn bản được xem là do con người viết với 49% khả năng AI sau khi thay đổi từ khóa phổ biến
Tôi đã dành nhiều thời gian làm gia sư viết lách và nhận thấy rằng các học viên nói tiếng Anh là ngôn ngữ thứ hai thường phàn nàn nhiều hơn về việc nhận các cảnh báo “false positive” (dương tính giả) từ các công cụ kiểm tra AI. Khi tạo các mô hình ngôn ngữ lớn, các công ty AI thường thuê ngoài việc chú thích dữ liệu ở những quốc gia mà tiếng Anh là ngôn ngữ thứ hai phổ biến. Do đó, một số từ ngữ mà chúng ta liên tưởng đến văn phong AI, chẳng hạn như “delve,” có thể là kết quả của việc chú thích dữ liệu được thực hiện bởi những người nói tiếng Anh là ngôn ngữ thứ hai, những người thường dùng các từ này trong vốn từ vựng của họ.
Điều này còn phức tạp hơn bởi nhiều người thành thạo tiếng Anh như ngôn ngữ thứ hai thường nắm vững và hiểu các quy tắc ngữ pháp tốt hơn những người bản xứ (thường tiếp cận ngôn ngữ một cách trực giác). Hậu quả là những người nói tiếng Anh là ngôn ngữ thứ hai có thể phải đối mặt với nguy cơ bị “false positive” kép trên các công cụ kiểm tra AI do ngữ pháp chuẩn và lựa chọn từ vựng của họ.
Lạm Dụng Công Cụ Hỗ Trợ Viết AI Có Thể Kích Hoạt Cảnh Báo
Cả hai vấn đề trên đều có thể xuất hiện ngay cả khi không sử dụng công cụ AI tạo sinh. Nếu bạn thực sự cố gắng viết nội dung gốc nhưng lại sử dụng quá nhiều các công cụ hỗ trợ viết như Grammarly, bài viết của bạn có nhiều khả năng bị gắn cờ là do AI viết. Đây là một vấn đề khá “vùng xám” trong giới học thuật, vì các công cụ này về cơ bản là trợ lý AI tạo sinh, và sinh viên thường dùng chúng để thay thế việc học thay vì coi như một công cụ bổ trợ hữu ích.
Theo kinh nghiệm gia sư của tôi, tôi thấy rằng những người quá phụ thuộc vào Grammarly để sửa chữa bài viết của họ thường là những người lo sợ nhất khi nộp bài viết cho các công cụ kiểm tra AI. Khi một tỷ lệ đáng kể văn bản của ai đó được viết lại theo gợi ý của trợ lý AI, một phần lớn bài viết của bạn thực sự đã được AI tạo ra. Do đó, khi sử dụng các công cụ như Grammarly, hãy cẩn thận nếu bạn quá phụ thuộc vào chúng, và hãy xem các gợi ý của Grammarly như cơ hội để học hỏi hơn là chấp nhận chúng một cách mù quáng.
Sao Chép Nguyên Văn Từ ChatGPT: Một “True Positive” Hiển Nhiên
Cuối cùng và rõ ràng nhất, nếu bạn thực sự sử dụng ChatGPT và không thực hiện bất kỳ chỉnh sửa nào đáng kể đối với kết quả đầu ra, các công cụ kiểm tra AI gần như chắc chắn sẽ gắn cờ bài viết của bạn; đây không phải là một “false positive” mà là một “true positive” (dương tính thật). Tuy nhiên, ngay cả khi bạn thực sự cố gắng viết một tác phẩm hoàn toàn gốc, không có sự trợ giúp, ngữ pháp hoàn hảo cùng với một số lựa chọn từ vựng và cách diễn đạt nhất định vẫn có thể khiến bạn bị gắn cờ nhầm.
Các công cụ phát hiện AI vẫn còn nhiều hạn chế và không thể thay thế được sự đánh giá của con người. Để đảm bảo nội dung của bạn được đánh giá công bằng và chính xác, hãy tập trung vào việc phát triển văn phong cá nhân, sử dụng từ ngữ đa dạng và chỉ xem các công cụ hỗ trợ viết như một phương tiện học hỏi chứ không phải là giải pháp thay thế. Bạn có những trải nghiệm tương tự với các công cụ AI checker không? Hãy chia sẻ ý kiến và kinh nghiệm của bạn trong phần bình luận bên dưới, hoặc tìm hiểu thêm các phân tích công nghệ chuyên sâu khác tại KhoaHocCongNghe.net!