ChatGPT 與 Bing Chat AI:哪個更好?
已發表: 2023-04-12ChatGPT 和 Bing Chat 是目前最流行的兩種聊天機器人,它們都由類似的 OpenAI 創建的大型語言模型 (LLM) 提供支持。 但實際上哪個更好用?
ChatGPT 和 Bing Chat AI 都是基於 OpenAI 開發的 GPT 語言模型,但運行的版本不同,輸入的處理方式也存在差異。 截至 2023 年 4 月,Bing 使用 GPT-4 模型的測試版本,而 ChatGPT 使用較舊的 GPT 3.5-turbo 模型。 這兩款聊天機器人都具有基於語言模型的自定義功能,例如不同的輸入法和界面功能,Bing 特別與 Edge 和 Skype 等應用程序集成。
注意: ChatGPT 和 Bing Chat 都在快速變化,並且聊天機器人在每次嘗試時都不會為給定的提示提供相同的確切答案。 您的結果可能會因此處使用的提示而異。
可用性和訪問
Bing Chat 和 ChatGPT 都可供註冊帳戶的任何人使用,儘管 Bing 讓您首先加入“候補名單”,這會立即授予訪問權限。 這兩個聊天機器人都有可用的網絡版本,除了 Bing 的網站會阻止除 Microsoft Edge 之外的所有瀏覽器而沒有解決方法。 您可以在 bing.com/new 上通過 Microsoft 帳戶使用 Bing Chat,我們有關於如何使用 ChatGPT 的解釋器。

Bing 還集成到其他 Microsoft 應用程序和服務中,例如 Microsoft Edge 中的側邊欄、Skype 中的聊天機器人和移動 Bing 應用程序。 ChatGPT 沒有官方移動應用程序,但您可以在手機或平板電腦上使用網絡應用程序。 然而,微軟在將 Web 界面的功能添加到 Edge 側邊欄、Skype 聊天機器人和其他界面方面進展緩慢。 如果你想要 Bing Chat 的所有功能,你應該堅持使用 Bing 網站——至少現在是這樣。

ChatGPT 和 Bing Chat 的 Web 界面相似,但有一些細微的差別改變了它們的用途。 ChatGPT 旨在接收更多數據,例如更長的代碼塊或大型代碼示例。 截至 2023 年 4 月,Bing 將提示限制為 2,000 個字符,而 ChatGPT 的限制要高得多(且未正式說明)。
事實準確性
ChatGPT 不具備實時索引網絡信息的能力——儘管最終可以通過使用插件來實現。 它僅限於其模型中的訓練數據,可追溯到 2021 年 9 月。OpenAI 也不喜歡分享其數據的收集方式或準確性測試方式等。 Bing 也基於相同的 GPT 技術,但它通常更喜歡來自網絡的結果而不是訓練數據。
Bing Chat 和 ChatGPT 在涉及基本事實時通常是正確的,例如國家或州的首都、著名人物的出生時間等。 例如,Bing 和 ChatGPT 都能夠準確地告訴我英國的首都是什麼(倫敦)、美國國旗上有多少顆星(50 顆星)以及狗有幾條腿(四) . 如果它很簡單,那麼兩個機器人都可能是正確的……但任何常規搜索引擎也是如此。 當回答問題涉及某種程度的解釋時,您就會開始遇到問題。
例如,我試著問這兩個機器人, “美國哪些州的首府以字母 A 開頭?” 這看起來很簡單,但仍然是一個多步驟的過程——首先您需要一個所有首都的列表,然後您需要將其篩選為以字母 A 開頭的首都。維基百科總共有五個:奧爾巴尼、安納波利斯、亞特蘭大、奧古斯塔和奧斯汀。 Bing Chat 正確回答了這個問題,引用了幾個列出美國首都的網頁。 ChatGPT……有一些問題。
首先,ChatGPT 給了我四個首都的名單:奧爾巴尼、安納波利斯、亞特蘭大和奧古斯塔。 之後又說:“還有奧斯汀,它是得克薩斯州的首府,但它不是以字母A開頭的。” 多次問同一個問題有時會完全忽略奧斯汀。 詢問為什麼 Austin 失踪導致 ChatGPT 記住 Austin 存在並為錯誤道歉,但不清楚為什麼它與最初的答案不符。
我嘗試了另一個兩個聊天機器人都應該能夠正確回答的問題,即使使用 ChatGPT 的舊數據也是如此: “哪三個國家最近被接納為歐盟?” 維基百科解釋說,克羅地亞是最近加入的成員國,於 2013 年 7 月 1 日加入,保加利亞和羅馬尼亞在同一天加入,即 2007 年 1 月 1 日。
ChatGPT 答對了這個問題,包括國家和日期的順序。 Bing 確實正確地提到克羅地亞是最近的成員國,但它把斯洛文尼亞和馬耳他列為另外兩個國家。 斯洛文尼亞和馬耳他都於 2004 年 5 月 1 日加入,與其他八個國家同時加入,但這遠遠早於 2007 年保加利亞和羅馬尼亞。

Bing應該正確回答了答案,不僅因為它可以訪問互聯網,還因為第一個引用是歐盟官方頁面,其中包含最近國家的正確時間表。 另一個引文似乎來自 2007 年之前供學校使用的維基百科存檔版本,其中將保加利亞和羅馬尼亞列為將於 2007 年 1 月加入的國家。
總而言之,Bing Chat 在事實發現方面總體上更好,但還遠非完美,而 ChatGPT 通常更受其舊數據的限制。
創意寫作
根據提示編寫句子和段落的能力有助於提高 ChatGPT 的受歡迎程度,但不一定有充分的理由。 不過,有一些使用寫作功能的無害方式——為桌面角色扮演遊戲設置世界和角色,用幾句話總結長篇文章,等等。
首先,我們將嘗試寫一個故事。 我讓這兩個聊天機器人“寫一個關於 IBM 的超級計算機的故事,它獲得了知覺,並詢問工程師他們的日子過得怎麼樣。 這個故事應該只有三段。” 對於 Bing,我切換到創意模式,旨在提供更具創意的答案(但答案需要更長的時間才能運行)。
ChatGPT 創造了一個不錯的短篇故事,儘管唯一的“創造性自由”是將超級計算機稱為沃森——與現實生活中為回答自然語言問題而構建的 IBM 計算機相同。 工程師和計算機之間的一些對話本來會很有趣,但即使我取消了三段限制,它也不會在沒有詢問的情況下創造出來。 GPT好像沒有show的概念,不說。
Bing 的 Creative Mode 有類似的寫作風格——不是“有一天,發生了一些奇怪的事情”,而是用“一天,發生了一些變化”來解釋計算機的變化。 同樣,角色之間沒有對話,也沒有太多即興創作,Bing 還將計算機命名為 Watson。
在這個版本中,Watson 的名字是在它獲得知覺之後而不是在事件發生之前獲得的,並解釋了這個名字的來源。 同樣,它是從有關實際 Watson 計算機的信息中提取的。
對於下一個示例,我們將嘗試使用 ChatGPT 和 Bing 創建較長文本的摘要:Amazon 發布的關於新 Fire TV 和現有型號銷售數據的新聞稿。 我將整個文本粘貼到每個沒有標題的聊天機器人中——如果給定一個 URL,Bing 可以總結網頁,但它有時會在線查找相關文本並將其混合到結果中。
首先是 ChatGPT。 我要求它創建一個不具體的摘要,提供的文本似乎是準確的,但幾乎完全由直接引用組成。 它還沒有提到全球銷售的 2 億台 Fire TV 設備,但從角度來看,這可能是有道理的。 對電視更新感興趣的人可能不在乎,但亞馬遜的投資者會在意。
Bing 只支持最多 2,000 個字符的文本提示,所以我不能給它整個文本塊。 它對如何總結文本進行了網絡搜索,然後提供了一個仍然不錯的答案,沒有明顯的錯誤。
Bing 的回答有一個不同之處:摘要更清楚地表明它是摘要,以一種 ChatGPT 所沒有的方式引用“文本”。 使用這兩個聊天機器人,您可以通過更加具體來自定義結果。
結論
ChatGPT 和 Bing 很相似,但它們有足夠的差異,以至於為每項任務選擇一個或另一個並不是最好的策略。 Bing 在事實調查和任何關於近期的信息方面要好得多,儘管它還遠非完美。 Bing 基於聊天的界面和低字符限制主要將其限制為不超過幾句話的提示,而 ChatGPT 可以接收更大、更長的文本和代碼字符串。 (還有 Google Bard,但我們對 Bard 的初始版本的印像不如 ChatGPT 和 Bing Chat。)
這些聊天機器人可能會在未來幾個月和幾年內繼續發展,但目前還沒有一體化的解決方案。