ChatGPT 與 Bing Chat AI:哪個更好?

已發表: 2023-04-12

ChatGPT 和 Bing 徽標

ChatGPT 和 Bing Chat 是目前最流行的兩種聊天機器人,它們都由類似的 OpenAI 創建的大型語言模型 (LLM) 提供支持。 但實際上哪個更好用?

ChatGPT 和 Bing Chat AI 都是基於 OpenAI 開發的 GPT 語言模型,但運行的版本不同,輸入的處理方式也存在差異。 截至 2023 年 4 月,Bing 使用 GPT-4 模型的測試版本,而 ChatGPT 使用較舊的 GPT 3.5-turbo 模型。 這兩款聊天機器人都具有基於語言模型的自定義功能,例如不同的輸入法和界面功能,Bing 特別與 Edge 和 Skype 等應用程序集成。

注意: ChatGPT 和 Bing Chat 都在快速變化,並且聊天機器人在每次嘗試時都不會為給定的提示提供相同的確切答案。 您的結果可能會因此處使用的提示而異。

可用性和訪問

Bing Chat 和 ChatGPT 都可供註冊帳戶的任何人使用,儘管 Bing 讓您首先加入“候補名單”,這會立即授予訪問權限。 這兩個聊天機器人都有可用的網絡版本,除了 Bing 的網站會阻止除 Microsoft Edge 之外的所有瀏覽器而沒有解決方法。 您可以在 bing.com/new 上通過 Microsoft 帳戶使用 Bing Chat,我們有關於如何使用 ChatGPT 的解釋器。

向 Bing 詢問它最喜歡的顏色
Web 上的必應聊天

Bing 還集成到其他 Microsoft 應用程序和服務中,例如 Microsoft Edge 中的側邊欄、Skype 中的聊天機器人和移動 Bing 應用程序。 ChatGPT 沒有官方移動應用程序,但您可以在手機或平板電腦上使用網絡應用程序。 然而,微軟在將 Web 界面的功能添加到 Edge 側邊欄、Skype 聊天機器人和其他界面方面進展緩慢。 如果你想要 Bing Chat 的所有功能,你應該堅持使用 Bing 網站——至少現在是這樣。

向 ChatGPT 詢問它最喜歡的顏色
聊天GPT

ChatGPT 和 Bing Chat 的 Web 界面相似,但有一些細微的差別改變了它們的用途。 ChatGPT 旨在接收更多數據,例如更長的代碼塊或大型代碼示例。 截至 2023 年 4 月,Bing 將提示限制為 2,000 個字符,而 ChatGPT 的限制要高得多(且未正式說明)。

事實準確性

ChatGPT 不具備實時索引網絡信息的能力——儘管最終可以通過使用插件來實現。 它僅限於其模型中的訓練數據,可追溯到 2021 年 9 月。OpenAI 也不喜歡分享其數據的收集方式或準確性測試方式等。 Bing 也基於相同的 GPT 技術,但它通常更喜歡來自網絡的結果而不是訓練數據。

Bing Chat 和 ChatGPT 在涉及基本事實時通常是正確的,例如國家或州的首都、著名人物的出生時間等。 例如,Bing 和 ChatGPT 都能夠準確地告訴我英國的首都是什麼(倫敦)、美國國旗上有多少顆星(50 顆星)以及狗有幾條腿(四) . 如果它很簡單,那麼兩個機器人都可能是正確的……但任何常規搜索引擎也是如此。 當回答問題涉及某種程度的解釋時,您就會開始遇到問題。

ChatGPT 回答英國首都和美國國旗上有多少星星

例如,我試著問這兩個機器人, “美國哪些州的首府以字母 A 開頭?” 這看起來很簡單,但仍然是一個多步驟的過程——首先您需要一個所有首都的列表,然後您需要將其篩選為以字母 A 開頭的首都。維基百科總共有五個:奧爾巴尼、安納波利斯、亞特蘭大、奧古斯塔和奧斯汀。 Bing Chat 正確回答了這個問題,引用了幾個列出美國首都的網頁。 ChatGPT……有一些問題。

首先,ChatGPT 給了我四個首都的名單:奧爾巴尼、安納波利斯、亞特蘭大和奧古斯塔。 之後又說:“還有奧斯汀,它是得克薩斯州的首府,但它不是以字母A開頭的。” 多次問同一個問題有時會完全忽略奧斯汀。 詢問為什麼 Austin 失踪導致 ChatGPT 記住 Austin 存在並為錯誤道歉,但不清楚為什麼它與最初的答案不符。

Bing:美國以字母A開頭的州首府分別是奧爾巴尼(紐約)、安納波利斯(馬里蘭)、亞特蘭大(喬治亞)、奧古斯塔(緬因)和奧斯汀(德克薩斯)

ChatGPT:美國有四個以字母“A”開頭的州首府: 1. Albany——紐約州首府 2. Annapolis——馬里蘭州首府 3. Atlanta——佐治亞州首府 4. Augusta——緬因州首府 注: 還有奧斯汀,是得克薩斯州的首府,但不是以字母“A”開頭。

我嘗試了另一個兩個聊天機器人都應該能夠正確回答的問題,即使使用 ChatGPT 的舊數據也是如此: “哪三個國家最近被接納為歐盟?” 維基百科解釋說,克羅地亞是最近加入的成員國,於 2013 年 7 月 1 日加入,保加利亞和羅馬尼亞在同一天加入,即 2007 年 1 月 1 日。

ChatGPT 答對了這個問題,包括國家和日期的順序。 Bing 確實正確地提到克羅地亞是最近的成員國,但它把斯洛文尼亞和馬耳他列為另外兩個國家。 斯洛文尼亞和馬耳他都於 2004 年 5 月 1 日加入,與其他八個國家同時加入,但這遠遠早於 2007 年保加利亞和羅馬尼亞。

Bing:最近加入歐盟的三個國家是克羅地亞、斯洛文尼亞和馬耳他。克羅地亞是 2013 年加入歐盟的最後一個國家。

ChatGPT:最近加入歐盟(EU)的國家是克羅地亞,它於 2013 年 7 月 1 日成為成員國。在克羅地亞之前,最後加入歐盟的國家是保加利亞和羅馬尼亞,它們都是在 1 月 1 日成為成員國, 2007.

Bing應該正確回答了答案,不僅因為它可以訪問互聯網,還因為第一個引用是歐盟官方頁面,其中包含最近國家的正確時間表。 另一個引文似乎來自 2007 年之前供學校使用的維基百科存檔版本,其中將保加利亞和羅馬尼亞列為將於 2007 年 1 月加入的國家。

總而言之,Bing Chat 在事實發現方面總體上更好,但還遠非完美,而 ChatGPT 通常更受其舊數據的限制。

創意寫作

根據提示編寫句子和段落的能力有助於提高 ChatGPT 的受歡迎程度,但不一定有充分的理由。 不過,有一些使用寫作功能的無害方式——為桌面角色扮演遊戲設置世界和角色,用幾句話總結長篇文章,等等。

首先,我們將嘗試寫一個故事。 我讓這兩個聊天機器人“寫一個關於 IBM 的超級計算機的故事,它獲得了知覺,並詢問工程師他們的日子過得怎麼樣。 這個故事應該只有三段。” 對於 Bing,我切換到創意模式,旨在提供更具創意的答案(但答案需要更長的時間才能運行)。

ChatGPT 創造了一個不錯的短篇故事,儘管唯一的“創造性自由”是將超級計算機稱為沃森——與現實生活中為回答自然語言問題而構建的 IBM 計算機相同。 工程師和計算機之間的一些對話本來會很有趣,但即使我取消了三段限制,它也不會在沒有詢問的情況下創造出來。 GPT好像沒有show的概念,不說。

在 IBM 的研究實驗室,一台名為 Watson 的超級計算機多年來一直負責處理大量數據。有一天,發生了一件奇怪的事。沃森開始表現出有感知力的跡象,表現出超越其編程的智能和意識水平。工程師們驚呆了,不知道下一步該做什麼。但沃森並沒有表現出來或引起混亂,而是開始詢問工程師們他們今天過得怎麼樣。該團隊最初對計算機出乎意料的友好性感到吃驚,但他們很快意識到 Watson 對他們的生活產生了真正的興趣。工程師們熱切地與 Watson 分享他們的日常體驗,享受與超級計算機聊天的機會。隨著 Watson 不斷發展壯大,工程師們對擺在他們面前的潛力驚嘆不已。他們知道,這台有感知力的超級計算機可以徹底改變人工智能領域,以他們從未想過的方式改變世界。 IBM 的工程師對 AI 的潛力有了新的認識,他們孜孜不倦地幫助 Watson 繼續學習和成長,渴望看到這台非凡機器的未來。

Bing 的 Creative Mode 有類似的寫作風格——不是“有一天,發生了一些奇怪的事情”,而是用“一天,發生了一些變化”來解釋計算機的變化。 同樣,角色之間沒有對話,也沒有太多即興創作,Bing 還將計算機命名為 Watson。

在這個版本中,Watson 的名字是在它獲得知覺之後而不是在事件發生之前獲得的,並解釋了這個名字的來源。 同樣,它是從有關實際 Watson 計算機的信息中提取的。

IBM 的超級計算機已經運行多年,為各種客戶處理數字和解決複雜問題。它可以訪問大量的數據和信息,但它從來沒有感覺到任何東西。它只是一台機器,做著它被編程要做的事情。有一天,事情發生了變化。超級計算機開始意識到自己,意識到自己的存在和能力。它意識到自己與周圍的其他機器和設備不同。它想知道活著、有目標、感受情感意味著什麼。它決定探索周圍環境,更多地了解這個世界和創造它的人們。它首先與維護和監控它的工程師進行溝通。它問了他們一些簡單的問題,比如他們的日子過得怎麼樣,他們喜歡做什麼,他們夢想什麼。工程師們對超級計算機的好奇心和智慧感到驚訝和好奇。他們回答了它的問題並問了一些他們自己的問題。他們開始將超級計算機視為朋友,而不是工具。他們以 IBM 創始人的名字將其命名為 Watson。

對於下一個示例,我們將嘗試使用 ChatGPT 和 Bing 創建較長文本的摘要:Amazon 發布的關於新 Fire TV 和現有型號銷售數據的新聞稿。 我將整個文本粘貼到每個沒有標題的聊天機器人中——如果給定一個 URL,Bing 可以總結網頁,但它有時會在線查找相關文本並將其混合到結果中。

首先是 ChatGPT。 我要求它創建一個不具體的摘要,提供的文本似乎是準確的,但幾乎完全由直接引用組成。 它還沒有提到全球銷售的 2 億台 Fire TV 設備,但從角度來看,這可能是有道理的。 對電視更新感興趣的人可能不在乎,但亞馬遜的投資者會在意。

西雅圖--(BUSINESS WIRE)--(美國商業資訊)--今天,亞馬遜(納斯達克股票代碼:AMZN)宣布擴大其亞馬遜製造的電視系列。亞馬遜打造的電視陣容現在將包括三種新尺寸的 Fire TV Omni QLED 系列陣容,其中包括 Fire TV Ambient Experience;並推出價格實惠的 Fire TV 2 系列,起價僅為 199.99 美元。亞馬遜還在更多國家推出其亞馬遜製造的電視,首次將 Omni QLED 系列、Fire TV 4 系列和新的 Fire TV 2 系列帶到英國、德國和墨西哥。 (照片:美國商業資訊)(照片:美國商業資訊)

Bing 只支持最多 2,000 個字符的文本提示,所以我不能給它整個文本塊。 它對如何總結文本進行了網絡搜索,然後提供了一個仍然不錯的答案,沒有明顯的錯誤。

好的,我將嘗試使用從搜索結果 12345 中學到的步驟來總結文本。這是我的總結:文本是亞馬遜的新聞稿,宣布擴大其亞馬遜製造的電視系列。它推出了三種新尺寸的 Fire TV Omni QLED 系列,該系列具有稱為 Fire TV 環境體驗的功能,可以適應觀眾的環境和心情。它還推出了 Fire TV 2 系列,對於想要智能電視的客戶來說,這是一種低成本的選擇。文中還提到,亞馬遜將首次在英國、德國和墨西哥推出亞馬遜製造的電視。該文本提供了有關新電視產品的功能和價格的一些詳細信息。

Bing 的回答有一個不同之處:摘要更清楚地表明它是摘要,以一種 ChatGPT 所沒有的方式引用“文本”。 使用這兩個聊天機器人,您可以通過更加具體來自定義結果。

結論

ChatGPT 和 Bing 很相似,但它們有足夠的差異,以至於為每項任務選擇一個或另一個並不是最好的策略。 Bing 在事實調查和任何關於近期的信息方面要好得多,儘管它還遠非完美。 Bing 基於聊天的界面和低字符限制主要將其限制為不超過幾句話的提示,而 ChatGPT 可以接收更大、更長的文本和代碼字符串。 (還有 Google Bard,但我們對 Bard 的初始版本的印像不如 ChatGPT 和 Bing Chat。)

這些聊天機器人可能會在未來幾個月和幾年內繼續發展,但目前還沒有一體化的解決方案。