如何判断一篇文章是否由 ChatGPT 撰写

已发表: 2023-05-14
聊天GPT加
汉娜史崔克 / How-To Geek
您可以通过其简单、重复的结构及其犯逻辑和事实错误的倾向来判断一篇 ChatGPT 撰写的文章。 一些工具可用于自动检测 AI 生成的文本,但它们容易出现误报。

人工智能技术正在改变我们在网上看到的内容以及我们与世界互动的方式。 从教皇身穿羽绒服的中途旅行照片到 ChatGPT 等语言学习模型,人工智能正在走进我们的生活。

人工智能技术的更险恶的用途,比如一场政治虚假信息运动,爆出虚假文章,意味着我们需要对自己进行足够的教育,以发现假货。 那么如何判断一篇文章是否真的是人工智能生成的文本呢?

如何判断那篇文章是否由 ChatGPT 撰写

目前有多种方法和工具可以帮助确定您正在阅读的文章是否由机器人撰写。 并非所有这些都是 100% 可靠的,并且它们可以提供误报,但它们确实提供了一个起点。

至少就目前而言,人类书写文本的一大标志是随机性。 虽然人们会使用不同的风格和俚语写作并且经常会出现拼写错误,但 AI 语言模型很少会出现此类错误。 根据《麻省理工学院技术评论》,“人类书写的文本充满了拼写错误,而且变化莫测”,而像 ChatGPT 这样的人工智能生成的文本模型更擅长创建无拼写错误的文本。 当然,一个好的文案编辑器也会有同样的效果,所以你要注意的不仅仅是正确的拼写。

另一个指标是标点符号模式。 与 AI 模型相比,人类会更随意地使用标点符号。 AI 生成的文本通常还包含更多的连接词,如“the”、“it”或“is”,而不是更大、更不常用的词,因为大型语言模型通过预测下一个最有可能出现的词来运作,而不是想出听起来像人类一样好听的东西。

这在 ChatGPT 对 OpenAI 网站上常见问题之一的回复中可见。 当被问到“你能用简单的术语解释一下量子计算吗”时,你会得到这样的句子:“量子比特的特别之处在于它们可以同时存在于多个状态,这要归功于一种叫做叠加的特性。 这就像一个量子位可以同时是 0 和 1。 ”

聊天 GPT 回答问题“你能用简单的术语解释量子计算吗?”

经常使用短而简单的连接词,句子长度相似,段落结构相似。 最终的结果是写作听起来和感觉有点机械化。

您可以使用 AI 检测 AI 生成的文本吗?

大型语言模型本身可以通过训练来识别人工智能生成的文字。 在两组文本上训练系统——一组由 AI 编写,另一组由人编写——理论上可以教会模型识别和检测像 ChatGPT 这样的 AI 文本。

研究人员还在研究用于检测 AI 文章和文本的水印方法。 在马里兰大学教授计算机科学的 Tom Goldstein 正在研究一种将水印构建到 AI 语言模型中的方法,希望它可以帮助检测机器生成的文字,即使它足以模仿人类的随机性。

水印是肉眼看不见的,但可以通过算法检测到,根据水印遵守或违反水印规则的频率,该算法将表明它是人类生成的还是人工智能生成的。 不幸的是,这种方法在后来的 ChatGPT 模型上测试得不太好。

检查文章是否由 ChatGPT 撰写的工具

你可以在网上找到多种复制和粘贴工具来帮助你检查一篇文章是否是人工智能生成的。 他们中的许多人使用语言模型来扫描文本,包括 ChatGPT-4 本身。

例如,Undetectable AI 将自己定位为一种工具,可以让您的 AI 写作与人类的写作无异。 将文本复制并粘贴到其窗口中,程序会根据其他 AI 检测工具(如 GPTZero)的结果对其进行检查,以为其分配可能性分数——它基本上会检查其他八个 AI 检测器是否会认为您的文本是由机器人编写的。

原创性是另一种工具,面向大型出版商和内容制作商。 它声称比市场上的其他产品更准确,并使用 ChatGPT-4 来帮助检测人工智能编写的文本。 其他流行的检查工具包括:

  • GPT零
  • 复制泄漏
  • 作家

这些工具中的大多数都会为您提供一个百分比值,例如 96% 的人类和 4% 的人工智能,以确定文本由人类编写的可能性有多大。 如果分数是 40-50% AI 或更高,则该作品很可能是 AI 生成的。

虽然开发人员正在努力使这些工具更好地检测 AI 生成的文本,但它们都不是完全准确的,并且可以错误地将人类内容标记为 AI 生成的。 还有人担心,由于像 GPT-4 这样的大型语言模型改进得如此之快,检测模型也在不断追赶。

训练你的大脑来捕捉人工智能

除了使用工具,您还可以训练自己捕捉 AI 生成的内容。 这需要练习,但随着时间的推移,你会变得更好。

谷歌 AI 部门 Google Brain 的高级研究科学家 Daphne Ippolito 制作了一款名为 Real Or Fake Text (ROFT) 的游戏,它可以通过逐渐训练你注意句子看起来不太正确来帮助你将人类句子与机器人句子区分开来.

根据 Ippolito 的说法,AI 文本的一个常见标记是无意义的陈述,例如“煮一杯咖啡需要两个小时”。 Ippolito 的游戏主要侧重于帮助人们发现这些类型的错误。 事实上,已经有多个 AI 编写程序完全自信地陈述不准确事实的实例——你可能也不应该要求它做你的数学作业,因为它似乎不能很好地处理数值计算。

现在,这些是我们用来捕捉人工智能程序编写的文本的最佳检测方法。 语言模型变得越来越好,使当前的检测方法很快就过时了,然而,正如 Melissa Heikkila 为麻省理工学院技术评论所写的那样,这让我们陷入了一场军备竞赛。

相关:如何使用 Bing AI Chat 对 ChatGPT 进行事实检查