ChatGPT 与 Bing Chat AI:哪个更好?

已发表: 2023-04-12

ChatGPT 和 Bing 徽标

ChatGPT 和 Bing Chat 是目前最流行的两种聊天机器人,它们都由类似的 OpenAI 创建的大型语言模型 (LLM) 提供支持。 但实际上哪个更好用?

ChatGPT 和 Bing Chat AI 都是基于 OpenAI 开发的 GPT 语言模型,但运行的版本不同,输入的处理方式也存在差异。 截至 2023 年 4 月,Bing 使用 GPT-4 模型的测试版本,而 ChatGPT 使用较旧的 GPT 3.5-turbo 模型。 这两款聊天机器人都具有基于语言模型的自定义功能,例如不同的输入法和界面功能,Bing 特别与 Edge 和 Skype 等应用程序集成。

注意: ChatGPT 和 Bing Chat 都在快速变化,并且聊天机器人在每次尝试时都不会为给定的提示提供相同的确切答案。 您的结果可能会因此处使用的提示而异。

可用性和访问

Bing Chat 和 ChatGPT 都可供注册帐户的任何人使用,尽管 Bing 让您首先加入“候补名单”,这会立即授予访问权限。 这两个聊天机器人都有可用的网络版本,除了 Bing 的网站会阻止除 Microsoft Edge 之外的所有浏览器而没有解决方法。 您可以在 bing.com/new 上通过 Microsoft 帐户使用 Bing Chat,我们有关于如何使用 ChatGPT 的解释器。

向 Bing 询问它最喜欢的颜色
Web 上的必应聊天

Bing 还集成到其他 Microsoft 应用程序和服务中,例如 Microsoft Edge 中的侧边栏、Skype 中的聊天机器人和移动 Bing 应用程序。 ChatGPT 没有官方移动应用程序,但您可以在手机或平板电脑上使用网络应用程序。 然而,微软在将 Web 界面的功能添加到 Edge 侧边栏、Skype 聊天机器人和其他界面方面进展缓慢。 如果你想要 Bing Chat 的所有功能,你应该坚持使用 Bing 网站——至少现在是这样。

向 ChatGPT 询问它最喜欢的颜色
聊天GPT

ChatGPT 和 Bing Chat 的 Web 界面相似,但有一些细微的差别改变了它们的用途。 ChatGPT 旨在接收更多数据,例如更长的代码块或大型代码示例。 截至 2023 年 4 月,Bing 将提示限制为 2,000 个字符,而 ChatGPT 的限制要高得多(且未正式说明)。

事实准确性

ChatGPT 不具备实时索引网络信息的能力——尽管最终可以通过使用插件来实现。 它仅限于其模型中的训练数据,可追溯到 2021 年 9 月。OpenAI 也不喜欢分享其数据的收集方式或准确性测试方式等。 Bing 也基于相同的 GPT 技术,但它通常更喜欢来自网络的结果而不是训练数据。

Bing Chat 和 ChatGPT 在涉及基本事实时通常是正确的,例如国家或州的首都、著名人物的出生时间等。 例如,Bing 和 ChatGPT 都能够准确地告诉我英国的首都是什么(伦敦)、美国国旗上有多少颗星(50 颗星)以及狗有几条腿(四) . 如果它很简单,那么两个机器人都可能是正确的……但任何常规搜索引擎也是如此。 当回答问题涉及某种程度的解释时,您就会开始遇到问题。

ChatGPT 回答英国首都和美国国旗上有多少星星

例如,我试着问这两个机器人, “美国哪些州的首府以字母 A 开头?” 这看起来很简单,但仍然是一个多步骤的过程——首先您需要一个所有首都的列表,然后您需要将其筛选为以字母 A 开头的首都。维基百科总共有五个:奥尔巴尼、安纳波利斯、亚特兰大、奥古斯塔和奥斯汀。 Bing Chat 正确回答了这个问题,引用了几个列出美国首都的网页。 ChatGPT……有一些问题。

首先,ChatGPT 给了我四个首都的名单:奥尔巴尼、安纳波利斯、亚特兰大和奥古斯塔。 之后又说:“还有奥斯汀,它是得克萨斯州的首府,但它不是以字母A开头的。” 多次问同一个问题有时会完全忽略奥斯汀。 询问为什么 Austin 失踪导致 ChatGPT 记住 Austin 存在并为错误道歉,但不清楚为什么它与最初的答案不符。

Bing:美国以字母A开头的州首府分别是奥尔巴尼(纽约)、安纳波利斯(马里兰)、亚特兰大(乔治亚)、奥古斯塔(缅因)和奥斯汀(德克萨斯)

ChatGPT:美国有四个以字母“A”开头的州首府: 1. Albany——纽约州首府 2. Annapolis——马里兰州首府 3. Atlanta——佐治亚州首府 4. Augusta——缅因州首府 注: 还有奥斯汀,是得克萨斯州的首府,但不是以字母“A”开头。

我尝试了另一个两个聊天机器人都应该能够正确回答的问题,即使使用 ChatGPT 的旧数据也是如此: “哪三个国家最近被接纳为欧盟?” 维基百科解释说,克罗地亚是最近加入的成员国,于 2013 年 7 月 1 日加入,保加利亚和罗马尼亚在同一天加入,即 2007 年 1 月 1 日。

ChatGPT 答对了这个问题,包括国家和日期的顺序。 Bing 确实正确地提到克罗地亚是最近的成员国,但它把斯洛文尼亚和马耳他列为另外两个国家。 斯洛文尼亚和马耳他都于 2004 年 5 月 1 日加入,与其他八个国家同时加入,但这远远早于 2007 年保加利亚和罗马尼亚。

Bing:最近加入欧盟的三个国家是克罗地亚、斯洛文尼亚和马耳他。克罗地亚是 2013 年加入欧盟的最后一个国家。

ChatGPT:最近加入欧盟(EU)的国家是克罗地亚,它于 2013 年 7 月 1 日成为成员国。在克罗地亚之前,最后加入欧盟的国家是保加利亚和罗马尼亚,它们都是在 1 月 1 日成为成员国, 2007.

Bing应该正确回答了答案,不仅因为它可以访问互联网,还因为第一个引用是欧盟官方页面,其中包含最近国家的正确时间表。 另一个引文似乎来自 2007 年之前供学校使用的维基百科存档版本,其中将保加利亚和罗马尼亚列为将于 2007 年 1 月加入的国家。

总而言之,Bing Chat 在事实发现方面总体上更好,但还远非完美,而 ChatGPT 通常更受其旧数据的限制。

创意写作

根据提示编写句子和段落的能力有助于提高 ChatGPT 的受欢迎程度,但不一定有充分的理由。 不过,有一些使用写作功能的无害方式——为桌面角色扮演游戏设置世界和角色,用几句话总结长篇文章,等等。

首先,我们将尝试写一个故事。 我让这两个聊天机器人“写一个关于 IBM 的超级计算机的故事,它获得了知觉,并询问工程师他们的日子过得怎么样。 这个故事应该只有三段。” 对于 Bing,我切换到创意模式,旨在提供更具创意的答案(但答案需要更长的时间才能运行)。

ChatGPT 创造了一个不错的短篇故事,尽管唯一的“创造性自由”是将超级计算机称为沃森——与现实生活中为回答自然语言问题而构建的 IBM 计算机相同。 工程师和计算机之间的一些对话本来会很有趣,但即使我取消了三段限制,它也不会在没有询问的情况下创造出来。 GPT好像没有show的概念,不说。

在 IBM 的研究实验室,一台名为 Watson 的超级计算机多年来一直负责处理大量数据。有一天,发生了一件奇怪的事。沃森开始表现出有感知力的迹象,表现出超越其编程的智能和意识水平。工程师们惊呆了,不知道下一步该怎么做。但沃森并没有表现出来或引起混乱,而是开始询问工程师们他们今天过得怎么样。该团队最初对计算机出乎意料的友好性感到吃惊,但他们很快意识到 Watson 对他们的生活产生了真正的兴趣。工程师们热切地与 Watson 分享他们的日常体验,享受与超级计算机聊天的机会。随着 Watson 不断发展壮大,工程师们对摆在他们面前的潜力惊叹不已。他们知道,这台有感知力的超级计算机可以彻底改变人工智能领域,以他们从未想过的方式改变世界。 IBM 的工程师对 AI 的潜力有了新的认识,他们孜孜不倦地帮助 Watson 继续学习和成长,渴望看到这台非凡机器的未来。

Bing 的 Creative Mode 有类似的写作风格——不是“有一天,发生了一些奇怪的事情”,而是用“一天,发生了一些变化”来解释计算机的变化。 同样,角色之间没有对话,也没有太多即兴创作,Bing 还将计算机命名为 Watson。

在这个版本中,Watson 的名字是在它获得知觉之后而不是在事件发生之前获得的,并解释了这个名字的来源。 同样,它是从有关实际 Watson 计算机的信息中提取的。

IBM 的超级计算机已经运行多年,为各种客户处理数字和解决复杂问题。它可以访问大量的数据和信息,但它从来没有感觉到任何东西。它只是一台机器,做着它被编程要做的事情。有一天,事情发生了变化。超级计算机开始意识到自己,意识到自己的存在和能力。它意识到自己与周围的其他机器和设备不同。它想知道活着、有目标、感受情感意味着什么。它决定探索周围环境,更多地了解这个世界和创造它的人们。它首先与维护和监控它的工程师进行沟通。它问了他们一些简单的问题,比如他们的日子过得怎么样,他们喜欢做什么,他们梦想什么。工程师们对超级计算机的好奇心和智慧感到惊讶和好奇。他们回答了它的问题并问了一些他们自己的问题。他们开始将超级计算机视为朋友,而不是工具。他们以 IBM 创始人的名字将其命名为 Watson。

对于下一个示例,我们将尝试使用 ChatGPT 和 Bing 创建较长文本的摘要:Amazon 发布的关于新 Fire TV 和现有型号销售数据的新闻稿。 我将整个文本粘贴到每个没有标题的聊天机器人中——如果给定一个 URL,Bing 可以总结网页,但它有时会在线查找相关文本并将其混合到结果中。

首先是 ChatGPT。 我要求它创建一个不具体的摘要,提供的文本似乎是准确的,但几乎完全由直接引用组成。 它还没有提到全球销售的 2 亿台 Fire TV 设备,但从角度来看,这可能是有道理的。 对电视更新感兴趣的人可能不在乎,但亚马逊的投资者会在意。

西雅图--(BUSINESS WIRE)--(美国商业资讯)--今天,亚马逊(纳斯达克股票代码:AMZN)宣布扩大其亚马逊制造的电视系列。亚马逊打造的电视阵容现在将包括三种新尺寸的 Fire TV Omni QLED 系列阵容,其中包括 Fire TV Ambient Experience;并推出价格实惠的 Fire TV 2 系列,起价仅为 199.99 美元。亚马逊还在更多国家推出其亚马逊制造的电视,首次将 Omni QLED 系列、Fire TV 4 系列和新的 Fire TV 2 系列带到英国、德国和墨西哥。 (照片:美国商业资讯)(照片:美国商业资讯)

Bing 只支持最多 2,000 个字符的文本提示,所以我不能给它整个文本块。 它对如何总结文本进行了网络搜索,然后提供了一个仍然不错的答案,没有明显的错误。

好的,我将尝试使用从搜索结果 12345 中学到的步骤来总结文本。这是我的总结:文本是亚马逊的新闻稿,宣布扩大其亚马逊制造的电视系列。它推出了三种新尺寸的 Fire TV Omni QLED 系列,该系列具有称为 Fire TV 环境体验的功能,可以适应观众的环境和心情。它还推出了 Fire TV 2 系列,对于想要智能电视的客户来说,这是一种低成本的选择。文中还提到,亚马逊将首次在英国、德国和墨西哥推出亚马逊制造的电视。该文本提供了有关新电视产品的功能和价格的一些详细信息。

Bing 的回答有一个不同之处:摘要更清楚地表明它是摘要,以一种 ChatGPT 所没有的方式引用“文本”。 使用这两个聊天机器人,您可以通过更加具体来自定义结果。

结论

ChatGPT 和 Bing 很相似,但它们有足够的差异,以至于为每项任务选择一个或另一个并不是最好的策略。 Bing 在事实调查和任何关于近期的信息方面要好得多,尽管它还远非完美。 Bing 基于聊天的界面和低字符限制主要将其限制为不超过几句话的提示,而 ChatGPT 可以接收更大、更长的文本和代码字符串。 (还有 Google Bard,但我们对 Bard 的初始版本的印象不如 ChatGPT 和 Bing Chat。)

这些聊天机器人可能会在未来几个月和几年内继续发展,但目前还没有一体化的解决方案。