如何判斷一篇文章是否由 ChatGPT 撰寫

已發表: 2023-05-14

您可以通過其簡單、重複的結構及其犯邏輯和事實錯誤的傾向來判斷一篇 ChatGPT 撰寫的文章。一些工具可用於自動檢測 AI 生成的文本，但它們容易出現誤報。

人工智能技術正在改變我們在網上看到的內容以及我們與世界互動的方式。從教皇身穿羽絨服的中途旅行照片到 ChatGPT 等語言學習模型，人工智能正在走進我們的生活。

人工智能技術的更險惡的用途，比如一場政治虛假信息運動，爆出虛假文章，意味著我們需要對自己進行足夠的教育，以發現假貨。那麼如何判斷一篇文章是否真的是人工智能生成的文本呢？

如何判斷那篇文章是否由 ChatGPT 撰寫

目前有多種方法和工具可以幫助確定您正在閱讀的文章是否由機器人撰寫。並非所有這些都是 100% 可靠的，並且它們可以提供誤報，但它們確實提供了一個起點。

至少就目前而言，人類書寫文本的一大標誌是隨機性。雖然人們會使用不同的風格和俚語寫作並且經常會出現拼寫錯誤，但 AI 語言模型很少會出現此類錯誤。根據《麻省理工學院技術評論》，“人類書寫的文本充滿了拼寫錯誤，而且變化莫測”，而像 ChatGPT 這樣的人工智能生成的文本模型更擅長創建無拼寫錯誤的文本。當然，一個好的文案編輯器也會有同樣的效果，所以你要注意的不僅僅是正確的拼寫。

另一個指標是標點符號模式。與 AI 模型相比，人類會更隨意地使用標點符號。 AI 生成的文本通常還包含更多的連接詞，如“the”、“it”或“is”，而不是更大、更不常用的詞，因為大型語言模型通過預測下一個最有可能出現的詞來運作，而不是想出聽起來像人類一樣好聽的東西。

這在 ChatGPT 對 OpenAI 網站上常見問題之一的回復中可見。當被問到“你能用簡單的術語解釋一下量子計算嗎”時，你會得到這樣的句子：“量子比特的特別之處在於它們可以同時存在於多個狀態，這要歸功於一種叫做疊加的特性。這就像一個量子位可以同時是 0 和 1。 ”

聊天 GPT 回答問題“你能用簡單的術語解釋量子計算嗎？”

經常使用短而簡單的連接詞，句子長度相似，段落結構相似。最終的結果是寫作聽起來和感覺有點機械化。

您可以使用 AI 檢測 AI 生成的文本嗎？

大型語言模型本身可以通過訓練來識別人工智能生成的文字。在兩組文本上訓練系統——一組由 AI 編寫，另一組由人編寫——理論上可以教會模型識別和檢測像 ChatGPT 這樣的 AI 文本。

研究人員還在研究用於檢測 AI 文章和文本的水印方法。在馬里蘭大學教授計算機科學的 Tom Goldstein 正在研究一種將水印構建到 AI 語言模型中的方法，希望它可以幫助檢測機器生成的文字，即使它足以模仿人類的隨機性。

水印是肉眼看不見的，但可以通過算法檢測到，根據水印遵守或違反水印規則的頻率，該算法將表明它是人類生成的還是人工智能生成的。不幸的是，這種方法在後來的 ChatGPT 模型上測試得不太好。

檢查文章是否由 ChatGPT 撰寫的工具

你可以在網上找到多種複制和粘貼工具來幫助你檢查一篇文章是否是人工智能生成的。他們中的許多人使用語言模型來掃描文本，包括 ChatGPT-4 本身。

例如，Undetectable AI 將自己定位為一種工具，可以讓您的 AI 寫作與人類的寫作無異。將文本複制並粘貼到其窗口中，程序會根據其他 AI 檢測工具（如 GPTZero）的結果對其進行檢查，以為其分配可能性分數——它基本上會檢查其他八個 AI 檢測器是否會認為您的文本是由機器人編寫的。

原創性是另一種工具，面向大型出版商和內容製作商。它聲稱比市場上的其他產品更準確，並使用 ChatGPT-4 來幫助檢測人工智能編寫的文本。其他流行的檢查工具包括：

GPT零
複製洩漏
作家

這些工具中的大多數都會為您提供一個百分比值，例如 96% 的人類和 4% 的人工智能，以確定文本由人類編寫的可能性有多大。如果分數是 40-50% AI 或更高，則該作品很可能是 AI 生成的。

雖然開發人員正在努力使這些工具更好地檢測 AI 生成的文本，但它們都不是完全準確的，並且可以錯誤地將人類內容標記為 AI 生成的。還有人擔心，由於像 GPT-4 這樣的大型語言模型改進得如此之快，檢測模型也在不斷追趕。

訓練你的大腦來捕捉人工智能

除了使用工具，您還可以訓練自己捕捉 AI 生成的內容。這需要練習，但隨著時間的推移，你會變得更好。

谷歌 AI 部門 Google Brain 的高級研究科學家 Daphne Ippolito 製作了一款名為 Real Or Fake Text (ROFT) 的遊戲，它可以通過逐漸訓練你注意句子看起來不太正確來幫助你將人類句子與機器人句子區分開來.

根據 Ippolito 的說法，AI 文本的一個常見標記是無意義的陳述，例如“煮一杯咖啡需要兩個小時”。 Ippolito 的遊戲主要側重於幫助人們發現這些類型的錯誤。事實上，已經有多個 AI 編寫程序完全自信地陳述不准確事實的實例——你可能也不應該要求它做你的數學作業，因為它似乎不能很好地處理數值計算。

現在，這些是我們用來捕捉人工智能程序編寫的文本的最佳檢測方法。語言模型變得越來越好，使當前的檢測方法很快就過時了，然而，正如 Melissa Heikkila 為麻省理工學院技術評論所寫的那樣，這讓我們陷入了一場軍備競賽。

相關：如何使用 Bing AI Chat 對 ChatGPT 進行事實檢查