Cách nhận biết bài viết có được viết bởi ChatGPT hay không?

Cách nhận biết bài viết có được viết bởi ChatGPT hay không

Bạn có thể nhận biết một bài viết do ChatGPT viết bằng cấu trúc đơn giản, lặp đi lặp lại và xu hướng mắc lỗi logic và thực tế. Một số công cụ có sẵn để tự động phát hiện văn bản do AI tạo ra, nhưng chúng dễ dẫn đến kết quả sai.

Công nghệ AI đang thay đổi những gì chúng ta thấy trực tuyến và cách chúng ta tương tác với thế giới. Từ bức ảnh giữa cuộc hành trình của Giáo hoàng trong chiếc áo khoác phao cho đến các mô hình học ngôn ngữ như ChatGPT, trí tuệ nhân tạo đang dần thâm nhập vào cuộc sống của chúng ta.

Những cách sử dụng công nghệ AI ngày càng nham hiểm hơn, chẳng hạn như một chiến dịch đưa thông tin sai lệch về chính trị nhằm tung ra các bài báo giả mạo, có nghĩa là chúng ta cần phải tự trang bị kiến ​​thức đủ để phát hiện ra hàng giả. Vậy làm thế nào bạn có thể biết liệu một bài viết có thực sự là văn bản do AI tạo ra hay không?

Làm thế nào để biết ChatGPT đã viết bài viết đó

Hiện có nhiều phương pháp và công cụ giúp xác định xem bài viết bạn đang đọc có phải do robot viết hay không. Không phải tất cả chúng đều đáng tin cậy 100% và chúng có thể cho kết quả dương tính giả, nhưng chúng đưa ra điểm khởi đầu.

Một dấu hiệu quan trọng của văn bản do con người viết, ít nhất là ở thời điểm hiện tại, là tính ngẫu nhiên. Mặc dù mọi người sẽ viết bằng các phong cách và tiếng lóng khác nhau và thường mắc lỗi chính tả, nhưng các mô hình ngôn ngữ AI rất hiếm khi mắc phải những lỗi đó. Theo MIT Technology Review , “văn bản do con người viết có nhiều lỗi chính tả và rất dễ thay đổi”, trong khi các mô hình văn bản do AI tạo ra như ChatGPT lại tốt hơn nhiều trong việc tạo văn bản ít lỗi chính tả. Tất nhiên, một trình soạn thảo bản sao tốt sẽ có tác dụng tương tự, vì vậy bạn phải chú ý nhiều hơn là chỉ đúng chính tả.

Một chỉ báo khác là các mẫu dấu chấm câu. Con người sẽ sử dụng dấu câu một cách ngẫu nhiên hơn mô hình AI. Văn bản do AI tạo ra cũng thường chứa nhiều từ kết nối hơn như “the,” “it” hoặc “is” thay vì những từ lớn hơn, hiếm khi được sử dụng hơn vì các mô hình ngôn ngữ lớn hoạt động bằng cách dự đoán từ nào sẽ có nhiều khả năng xuất hiện tiếp theo nhất, chứ không phải từ thứ gì đó nghe có vẻ hay ho theo cách mà con người có thể làm.

Điều này có thể thấy rõ trong câu trả lời của ChatGPT cho một trong những câu hỏi về chứng khoán trên trang web của OpenAI. Khi được hỏi “Bạn có thể giải thích điện toán lượng tử bằng những thuật ngữ đơn giản không”, bạn sẽ nhận được những câu như: “Điều khiến qubit trở nên đặc biệt là chúng có thể tồn tại ở nhiều trạng thái cùng một lúc, nhờ một đặc tính gọi là chồng chất. Nó giống như một qubit có thể cả số 0 và số 1 cùng một lúc.”

Trò chuyện GPT trả lời câu hỏi

Các từ kết nối ngắn, đơn giản thường được sử dụng, các câu đều có độ dài tương tự nhau và các đoạn văn đều có cấu trúc tương tự nhau. Kết quả cuối cùng là cách viết nghe có vẻ giống người máy.

Bạn có thể sử dụng AI để phát hiện văn bản do AI tạo không?

Bản thân các mô hình ngôn ngữ lớn có thể được đào tạo để phát hiện chữ viết do AI tạo ra. Huấn luyện hệ thống trên hai bộ văn bản — một bộ do AI viết và bộ kia do con người viết — về mặt lý thuyết có thể dạy mô hình nhận dạng và phát hiện văn bản AI như ChatGPT.

Các nhà nghiên cứu cũng đang nghiên cứu các phương pháp tạo hình mờ để phát hiện các bài viết và văn bản AI. Tom Goldstein, giảng viên khoa học máy tính tại Đại học Maryland, đang nghiên cứu cách xây dựng hình mờ thành mô hình ngôn ngữ AI với hy vọng nó có thể giúp phát hiện chữ viết do máy tạo ra ngay cả khi nó đủ tốt để bắt chước tính ngẫu nhiên của con người.

Không thể nhìn thấy bằng mắt thường, hình mờ sẽ có thể được phát hiện bằng thuật toán, thuật toán này sẽ cho biết đó là do con người hoặc AI tạo ra tùy thuộc vào tần suất nó tuân thủ hoặc vi phạm các quy tắc tạo hình chìm mờ. Thật không may, phương pháp này chưa được thử nghiệm tốt trên các mẫu ChatGPT sau này.

Công cụ kiểm tra xem bài viết có được viết bởi ChatGPT không

Bạn có thể tìm thấy nhiều công cụ sao chép và dán trực tuyến để giúp bạn kiểm tra xem một bài viết có phải do AI tạo ra hay không. Nhiều người trong số họ sử dụng mô hình ngôn ngữ để quét văn bản, bao gồm cả ChatGPT-4.

Ví dụ: AI không thể phát hiện được tự tiếp thị như một công cụ giúp cho văn bản AI của bạn không thể phân biệt được với văn bản của con người. Sao chép và dán văn bản vào cửa sổ của nó và chương trình sẽ kiểm tra văn bản đó với kết quả từ các công cụ phát hiện AI khác như GPTZero để gán cho nó điểm khả năng — về cơ bản, nó sẽ kiểm tra xem tám trình phát hiện AI khác có cho rằng văn bản của bạn được viết bởi robot hay không.

Hầu hết các công cụ này cung cấp cho bạn giá trị phần trăm, chẳng hạn như 96% con người và 4% AI, để xác định khả năng văn bản được viết bởi con người. Nếu điểm từ 40-50% AI trở lên thì có khả năng tác phẩm đó do AI tạo ra.

Mặc dù các nhà phát triển đang nỗ lực làm cho những công cụ này phát hiện văn bản do AI tạo ra tốt hơn, nhưng không có công cụ nào trong số chúng hoàn toàn chính xác và có thể gắn cờ sai nội dung của con người là do AI tạo ra. Cũng có lo ngại rằng vì các mô hình ngôn ngữ lớn như GPT-4 đang được cải thiện quá nhanh nên các mô hình phát hiện liên tục phải bắt kịp.

Rèn luyện trí não của bạn để bắt AI

Ngoài việc sử dụng các công cụ, bạn có thể rèn luyện bản thân để nắm bắt nội dung do AI tạo ra. Việc này cần thực hành nhưng theo thời gian bạn có thể tiến bộ hơn.

Daphne Ippolito, một nhà khoa học nghiên cứu cao cấp tại bộ phận AI của Google, Google Brain, đã tạo ra một trò chơi có tên Real Or Fake Text  (ROFT) có thể giúp bạn tách câu của con người khỏi câu của robot bằng cách dần dần huấn luyện bạn nhận thấy khi một câu trông có vẻ không ổn .

Hiện tại, đây là những phương pháp phát hiện tốt nhất mà chúng tôi có để nắm bắt văn bản do chương trình AI viết. Tuy nhiên, các mô hình ngôn ngữ đang trở nên tốt hơn với tốc độ khiến các phương pháp phát hiện hiện tại trở nên lỗi thời khá nhanh, tuy nhiên, khiến chúng ta phải tham gia, như Melissa Heikkilä viết cho MIT Technology Review, một cuộc chạy đua vũ trang.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *