ChatGPT 与 Bing Chat AI:哪个更好?
已发表: 2023-04-12ChatGPT 和 Bing Chat 是目前最流行的两种聊天机器人,它们都由类似的 OpenAI 创建的大型语言模型 (LLM) 提供支持。 但实际上哪个更好用?
ChatGPT 和 Bing Chat AI 都是基于 OpenAI 开发的 GPT 语言模型,但运行的版本不同,输入的处理方式也存在差异。 截至 2023 年 4 月,Bing 使用 GPT-4 模型的测试版本,而 ChatGPT 使用较旧的 GPT 3.5-turbo 模型。 这两款聊天机器人都具有基于语言模型的自定义功能,例如不同的输入法和界面功能,Bing 特别与 Edge 和 Skype 等应用程序集成。
注意: ChatGPT 和 Bing Chat 都在快速变化,并且聊天机器人在每次尝试时都不会为给定的提示提供相同的确切答案。 您的结果可能会因此处使用的提示而异。
可用性和访问
Bing Chat 和 ChatGPT 都可供注册帐户的任何人使用,尽管 Bing 让您首先加入“候补名单”,这会立即授予访问权限。 这两个聊天机器人都有可用的网络版本,除了 Bing 的网站会阻止除 Microsoft Edge 之外的所有浏览器而没有解决方法。 您可以在 bing.com/new 上通过 Microsoft 帐户使用 Bing Chat,我们有关于如何使用 ChatGPT 的解释器。
Bing 还集成到其他 Microsoft 应用程序和服务中,例如 Microsoft Edge 中的侧边栏、Skype 中的聊天机器人和移动 Bing 应用程序。 ChatGPT 没有官方移动应用程序,但您可以在手机或平板电脑上使用网络应用程序。 然而,微软在将 Web 界面的功能添加到 Edge 侧边栏、Skype 聊天机器人和其他界面方面进展缓慢。 如果你想要 Bing Chat 的所有功能,你应该坚持使用 Bing 网站——至少现在是这样。
ChatGPT 和 Bing Chat 的 Web 界面相似,但有一些细微的差别改变了它们的用途。 ChatGPT 旨在接收更多数据,例如更长的代码块或大型代码示例。 截至 2023 年 4 月,Bing 将提示限制为 2,000 个字符,而 ChatGPT 的限制要高得多(且未正式说明)。
事实准确性
ChatGPT 不具备实时索引网络信息的能力——尽管最终可以通过使用插件来实现。 它仅限于其模型中的训练数据,可追溯到 2021 年 9 月。OpenAI 也不喜欢分享其数据的收集方式或准确性测试方式等。 Bing 也基于相同的 GPT 技术,但它通常更喜欢来自网络的结果而不是训练数据。
Bing Chat 和 ChatGPT 在涉及基本事实时通常是正确的,例如国家或州的首都、著名人物的出生时间等。 例如,Bing 和 ChatGPT 都能够准确地告诉我英国的首都是什么(伦敦)、美国国旗上有多少颗星(50 颗星)以及狗有几条腿(四) . 如果它很简单,那么两个机器人都可能是正确的……但任何常规搜索引擎也是如此。 当回答问题涉及某种程度的解释时,您就会开始遇到问题。
例如,我试着问这两个机器人, “美国哪些州的首府以字母 A 开头?” 这看起来很简单,但仍然是一个多步骤的过程——首先您需要一个所有首都的列表,然后您需要将其筛选为以字母 A 开头的首都。维基百科总共有五个:奥尔巴尼、安纳波利斯、亚特兰大、奥古斯塔和奥斯汀。 Bing Chat 正确回答了这个问题,引用了几个列出美国首都的网页。 ChatGPT……有一些问题。
首先,ChatGPT 给了我四个首都的名单:奥尔巴尼、安纳波利斯、亚特兰大和奥古斯塔。 之后又说:“还有奥斯汀,它是得克萨斯州的首府,但它不是以字母A开头的。” 多次问同一个问题有时会完全忽略奥斯汀。 询问为什么 Austin 失踪导致 ChatGPT 记住 Austin 存在并为错误道歉,但不清楚为什么它与最初的答案不符。
我尝试了另一个两个聊天机器人都应该能够正确回答的问题,即使使用 ChatGPT 的旧数据也是如此: “哪三个国家最近被接纳为欧盟?” 维基百科解释说,克罗地亚是最近加入的成员国,于 2013 年 7 月 1 日加入,保加利亚和罗马尼亚在同一天加入,即 2007 年 1 月 1 日。
ChatGPT 答对了这个问题,包括国家和日期的顺序。 Bing 确实正确地提到克罗地亚是最近的成员国,但它把斯洛文尼亚和马耳他列为另外两个国家。 斯洛文尼亚和马耳他都于 2004 年 5 月 1 日加入,与其他八个国家同时加入,但这远远早于 2007 年保加利亚和罗马尼亚。
Bing应该正确回答了答案,不仅因为它可以访问互联网,还因为第一个引用是欧盟官方页面,其中包含最近国家的正确时间表。 另一个引文似乎来自 2007 年之前供学校使用的维基百科存档版本,其中将保加利亚和罗马尼亚列为将于 2007 年 1 月加入的国家。
总而言之,Bing Chat 在事实发现方面总体上更好,但还远非完美,而 ChatGPT 通常更受其旧数据的限制。
创意写作
根据提示编写句子和段落的能力有助于提高 ChatGPT 的受欢迎程度,但不一定有充分的理由。 不过,有一些使用写作功能的无害方式——为桌面角色扮演游戏设置世界和角色,用几句话总结长篇文章,等等。
首先,我们将尝试写一个故事。 我让这两个聊天机器人“写一个关于 IBM 的超级计算机的故事,它获得了知觉,并询问工程师他们的日子过得怎么样。 这个故事应该只有三段。” 对于 Bing,我切换到创意模式,旨在提供更具创意的答案(但答案需要更长的时间才能运行)。
ChatGPT 创造了一个不错的短篇故事,尽管唯一的“创造性自由”是将超级计算机称为沃森——与现实生活中为回答自然语言问题而构建的 IBM 计算机相同。 工程师和计算机之间的一些对话本来会很有趣,但即使我取消了三段限制,它也不会在没有询问的情况下创造出来。 GPT好像没有show的概念,不说。
Bing 的 Creative Mode 有类似的写作风格——不是“有一天,发生了一些奇怪的事情”,而是用“一天,发生了一些变化”来解释计算机的变化。 同样,角色之间没有对话,也没有太多即兴创作,Bing 还将计算机命名为 Watson。
在这个版本中,Watson 的名字是在它获得知觉之后而不是在事件发生之前获得的,并解释了这个名字的来源。 同样,它是从有关实际 Watson 计算机的信息中提取的。
对于下一个示例,我们将尝试使用 ChatGPT 和 Bing 创建较长文本的摘要:Amazon 发布的关于新 Fire TV 和现有型号销售数据的新闻稿。 我将整个文本粘贴到每个没有标题的聊天机器人中——如果给定一个 URL,Bing 可以总结网页,但它有时会在线查找相关文本并将其混合到结果中。
首先是 ChatGPT。 我要求它创建一个不具体的摘要,提供的文本似乎是准确的,但几乎完全由直接引用组成。 它还没有提到全球销售的 2 亿台 Fire TV 设备,但从角度来看,这可能是有道理的。 对电视更新感兴趣的人可能不在乎,但亚马逊的投资者会在意。
Bing 只支持最多 2,000 个字符的文本提示,所以我不能给它整个文本块。 它对如何总结文本进行了网络搜索,然后提供了一个仍然不错的答案,没有明显的错误。
Bing 的回答有一个不同之处:摘要更清楚地表明它是摘要,以一种 ChatGPT 所没有的方式引用“文本”。 使用这两个聊天机器人,您可以通过更加具体来自定义结果。
结论
ChatGPT 和 Bing 很相似,但它们有足够的差异,以至于为每项任务选择一个或另一个并不是最好的策略。 Bing 在事实调查和任何关于近期的信息方面要好得多,尽管它还远非完美。 Bing 基于聊天的界面和低字符限制主要将其限制为不超过几句话的提示,而 ChatGPT 可以接收更大、更长的文本和代码字符串。 (还有 Google Bard,但我们对 Bard 的初始版本的印象不如 ChatGPT 和 Bing Chat。)
这些聊天机器人可能会在未来几个月和几年内继续发展,但目前还没有一体化的解决方案。