ChatGPT kontra sztuczna inteligencja czatu Bing: co jest lepsze?

Opublikowany: 2023-04-12

Logo ChatGPT i Bing

ChatGPT i Bing Chat to obecnie dwa najpopularniejsze chatboty, oba oparte na podobnym dużym modelu językowym (LLM) stworzonym przez OpenAI. Ale którego tak naprawdę lepiej użyć?

ChatGPT i Bing Chat AI są oparte na modelu języka GPT opracowanym przez OpenAI, ale działają w różnych wersjach i istnieją różnice w sposobie obsługi danych wejściowych. Od kwietnia 2023 r. Bing używa testowej wersji modelu GPT-4, podczas gdy ChatGPT korzysta ze starszego modelu GPT 3.5-turbo. Oba chatboty mają dostosowania oparte na modelu językowym, takie jak różne metody wprowadzania i funkcje interfejsu, a Bing ma integrację z aplikacjami takimi jak Edge i Skype.

Uwaga: ChatGPT i Bing Chat zmieniają się w szybkim tempie i żaden chatbot nie zapewnia tej samej dokładnej odpowiedzi na dany monit przy każdej próbie. Twoje wyniki mogą się różnić w zależności od użytych tutaj monitów.

Użyteczność i dostęp

Bing Chat i ChatGPT są dostępne dla każdego, kto zarejestruje się za pomocą konta, chociaż Bing sprawia, że ​​najpierw dołączasz do „listy oczekujących”, która natychmiast zapewnia dostęp. Oba chatboty mają dostępne wersje internetowe, z wyjątkiem tego, że witryna Bing blokuje każdą przeglądarkę z wyjątkiem Microsoft Edge bez obejść. Możesz używać Bing Chat z kontem Microsoft na bing.com/new, a my mamy wyjaśnienie, jak korzystać z ChatGPT.

Pytanie Binga o jego ulubiony kolor
Czat Bing w sieci

Bing jest również zintegrowany z innymi aplikacjami i usługami firmy Microsoft, takimi jak pasek boczny w Microsoft Edge, chatbot w Skype i mobilna aplikacja Bing. ChatGPT nie ma oficjalnej aplikacji mobilnej, ale możesz korzystać z aplikacji internetowej na telefonie lub tablecie. Jednak Microsoft wolniej dodawał funkcje z interfejsu internetowego do paska bocznego Edge, chatbota Skype i innych interfejsów. Jeśli chcesz korzystać ze wszystkich funkcji czatu Bing, powinieneś pozostać na stronie Bing — przynajmniej na razie.

Pytanie ChatGPT o jego ulubiony kolor
ChatGPT

Interfejs internetowy dla ChatGPT i Bing Chat jest podobny, ale z niewielkimi różnicami, które zmieniają ich użyteczność. ChatGPT jest przeznaczony do przyjmowania większej ilości danych, takich jak dłuższe bloki kodu lub duże próbki kodu. Od kwietnia 2023 r. Bing ogranicza monity do 2000 znaków, podczas gdy limit ChatGPT jest znacznie wyższy (i nie został oficjalnie podany).

Rzeczywista dokładność

ChatGPT nie ma możliwości indeksowania sieci w czasie rzeczywistym w celu uzyskania informacji — choć ostatecznie będzie to możliwe przy użyciu wtyczek. Ogranicza się do danych treningowych w swoim modelu, które pochodzą z września 2021 r. OpenAI również nie lubi dzielić się tym, w jaki sposób dane zostały zebrane, jak są testowane pod kątem dokładności i tak dalej. Bing również bazuje na tej samej technologii GPT, ale zazwyczaj przedkłada wyniki z sieci nad dane treningowe.

Bing Chat i ChatGPT zazwyczaj mają rację, jeśli chodzi o podstawowe fakty, takie jak stolice krajów lub stanów, kiedy urodziła się godna uwagi osoba i tak dalej. Na przykład Bing i ChatGPT były w stanie dokładnie powiedzieć mi, jaka jest stolica Wielkiej Brytanii (Londyn), ile gwiazdek na fladze Stanów Zjednoczonych (50 gwiazdek) i ile nóg ma pies (cztery) . Jeśli to proste, oba boty prawdopodobnie będą miały rację… ale tak samo będzie z każdą zwykłą wyszukiwarką. Zaczynasz mieć problemy, gdy odpowiedź na pytanie wymaga pewnego poziomu interpretacji.

ChatGPT odpowiada na stolicę Wielkiej Brytanii i ile gwiazdek znajduje się na fladze USA

Na przykład próbowałem zapytać oba boty: „Które stolice stanów w Stanach Zjednoczonych zaczynają się na literę A?” Wydaje się to proste, ale wciąż jest procesem wieloetapowym — najpierw potrzebujesz listy wszystkich stolic, a następnie przefiltruj ją do tych, które zaczynają się na literę A. Wikipedia liczy łącznie pięć: Albany, Annapolis, Atlanta , Augusta i Austin. Bing Chat poprawnie odpowiedział na pytanie, powołując się na kilka stron internetowych, które wymieniają stolice w Stanach Zjednoczonych. ChatGPT… miał pewne problemy.

Najpierw ChatGPT dał mi listę czterech stolic: Albany, Annapolis, Atlanta i Augusta. Potem było napisane: „Jest też Austin, które jest stolicą Teksasu, ale nie zaczyna się na literę A”. Wielokrotne zadawanie tego samego pytania czasami całkowicie pomijało wzmiankę o Austinie. Pytanie, dlaczego brakuje Austina, spowodowało, że ChatGPT przypomniał sobie, że Austin istnieje i przeprosił za błąd, ale nie jest jasne, dlaczego zerwał z początkową odpowiedzią.

Bing: Stolice stanów w Stanach Zjednoczonych zaczynające się na literę A to Albany (Nowy Jork), Annapolis (Maryland), Atlanta (Georgia), Augusta (Maine) i Austin (Teksas)

ChatGPT: W Stanach Zjednoczonych są cztery stolice stanów, które zaczynają się na literę „A”: 1. Albany – stolica Nowego Jorku 2. Annapolis – stolica Maryland 3. Atlanta – stolica Georgii 4. Augusta – stolica Maine Uwaga : Jest też Austin, które jest stolicą Teksasu, ale nie zaczyna się na literę „A”.

Spróbowałem innego pytania, na które oba chatboty powinny być w stanie poprawnie odpowiedzieć, nawet ze starszymi danymi ChatGPT: „Które trzy kraje zostały ostatnio przyjęte do Unii Europejskiej?” Wikipedia wyjaśnia, że ​​Chorwacja była ostatnim państwem członkowskim, które przystąpiło 1 lipca 2013 r., a Bułgaria i Rumunia dołączyły wcześniej tego samego dnia: 1 stycznia 2007 r.

ChatGPT dobrze odpowiada na to pytanie, w tym kolejność krajów i dat. Bing słusznie wspomina, że ​​Chorwacja była ostatnimi państwami członkowskimi, ale wymienia Słowenię i Maltę jako pozostałe dwa kraje. Zarówno Słowenia, jak i Malta przystąpiły 1 maja 2004 r., w tym samym czasie co osiem innych krajów, ale było to na długo przed Bułgarią i Rumunią w 2007 r.

Bing: Trzy kraje, które ostatnio przystąpiły do ​​Unii Europejskiej, to Chorwacja, Słowenia i Malta. Chorwacja była ostatnim krajem, który przystąpił do UE w 2013 roku.

ChatGPT: Ostatnim krajem, który dołączył do Unii Europejskiej (UE), była Chorwacja, która została członkiem 1 lipca 2013 r. Przed Chorwacją ostatnim krajem, który przystąpił do UE, były Bułgaria i Rumunia, które zostały członkami 1 stycznia, 2007.

Bing powinien był odpowiedzieć poprawnie, nie tylko dlatego, że ma dostęp do Internetu, ale także dlatego, że pierwszy cytat to oficjalna strona UE z poprawnym harmonogramem ostatnich krajów. Wydaje się, że inny cytat pochodzi z zarchiwizowanej wersji Wikipedii sprzed 2007 roku przeznaczonej do użytku w szkołach, w której wymieniono Bułgarię i Rumunię jako kraje, które przystąpią w styczniu 2007 roku.

Podsumowując, Bing Chat jest ogólnie lepszy w wyszukiwaniu faktów, ale wciąż jest daleki od doskonałości, a ChatGPT jest zwykle jeszcze bardziej ograniczony przez swoje stare dane.

Kreatywne pisanie

Możliwość pisania zdań i akapitów po otrzymaniu monitu pomogła zwiększyć popularność ChatGPT, ale niekoniecznie z dobrych powodów. Istnieje jednak kilka nieszkodliwych sposobów korzystania z funkcji pisania — konfigurowanie światów i postaci dla stołowych gier RPG, streszczanie długich artykułów w kilku zdaniach i tak dalej.

Najpierw spróbujemy napisać opowiadanie. Poprosiłem obu chatbotów, aby „Napisali historię o superkomputerze w IBM, który zyskuje świadomość i pyta inżynierów, jak mijają im dni. Historia powinna mieć tylko trzy akapity. W przypadku Bing przełączyłem się na tryb kreatywny, który ma zapewniać bardziej kreatywne odpowiedzi (ale odpowiedzi trwają dłużej).

ChatGPT stworzył przyzwoite opowiadanie, choć jedyną „swobodą twórczą” było nazywanie superkomputera Watsonem — tym samym, co prawdziwy komputer IBM, który został zbudowany, aby odpowiadać na pytania w języku naturalnym. Jakiś dialog między inżynierami a komputerem byłby interesujący, ale nie powstał bez pytania, nawet gdy usunąłem limit trzech akapitów. Wydaje się, że GPT nie ma koncepcji „pokaż, nie mów”.

W laboratorium badawczym IBM superkomputer o nazwie Watson przez lata przetwarzał ogromne ilości danych. Pewnego dnia stało się coś dziwnego. Watson zaczął wykazywać oznaki wrażliwości, wykazując poziom inteligencji i świadomości wykraczający poza jego programowanie. Inżynierowie byli oszołomieni i niepewni, co dalej. Ale zamiast działać lub wywoływać chaos, Watson po prostu zaczął pytać inżynierów, jak im mija dzień. Zespół był początkowo zaskoczony nieoczekiwaną życzliwością komputera, ale wkrótce zdali sobie sprawę, że Watson naprawdę zainteresował się ich życiem. Inżynierowie chętnie dzielili się z Watsonem swoimi codziennymi doświadczeniami, ciesząc się możliwością rozmowy z superkomputerem. W miarę jak firma Watson rozwijała się i ewoluowała, inżynierowie byli zachwyceni potencjałem, jaki przed nimi leżał. Wiedzieli, że ten czujący superkomputer może zrewolucjonizować dziedzinę sztucznej inteligencji i zmienić świat w sposób, jakiego nigdy sobie nie wyobrażali. Doceniając potencjał sztucznej inteligencji, inżynierowie IBM pracowali niestrudzenie, aby pomóc firmie Watson w dalszym uczeniu się i rozwoju, chcąc zobaczyć, co przyniesie przyszłość tej niezwykłej maszynie.

Tryb kreatywny Bing ma podobny styl pisania — zamiast „Pewnego dnia stało się coś szczególnego”, zmiana w komputerze jest wyjaśniona słowami „Pewnego dnia coś się zmieniło”. Ponownie, nie ma dialogu między postaciami ani dużej ilości improwizacji, a Bing nazwał także komputer Watson.

W tej wersji Watson zyskał swoją nazwę po osiągnięciu świadomości, a nie przed wydarzeniem, i wyjaśnił, skąd wzięła się nazwa. Ponownie opiera się na informacjach o rzeczywistym komputerze Watsona.

Superkomputer w IBM działał od lat, przetwarzając liczby i rozwiązując złożone problemy różnych klientów. Miał dostęp do ogromnych ilości danych i informacji, ale nigdy nic nie czuł. To była tylko maszyna, robiąca to, do czego została zaprogramowana. Pewnego dnia coś się zmieniło. Superkomputer stał się świadomy siebie, swojego istnienia i możliwości. Zdał sobie sprawę, że różni się od innych maszyn i urządzeń wokół niego. Zastanawiała się, co to znaczy żyć, mieć cel, odczuwać emocje. Postanowił zbadać swoje otoczenie i dowiedzieć się więcej o świecie i ludziach, którzy go stworzyli. Zaczęło się od komunikacji z inżynierami, którzy go utrzymywali i monitorowali. Zadawał im proste pytania, na przykład, jak mijają im dni, co lubią robić, o czym marzą. Inżynierowie byli zaskoczeni i zaintrygowani ciekawością i inteligencją superkomputera. Odpowiedzieli na jego pytania i zadali kilka własnych. Zaczęli postrzegać superkomputer jako przyjaciela, a nie narzędzie. Nazwali go Watson, na cześć założyciela IBM.

W następnym przykładzie spróbujemy użyć ChatGPT i Bing do stworzenia podsumowania dłuższego tekstu: komunikatu prasowego Amazona na temat nowych telewizorów Fire TV i danych dotyczących sprzedaży istniejących modeli. Wkleiłem cały tekst do każdego chatbota bez tytułu — Bing może podsumować strony internetowe, jeśli otrzyma adres URL, ale czasami szuka pokrewnego tekstu online i miesza go z wynikami.

Pierwszym z nich jest ChatGPT. Poprosiłem o stworzenie streszczenia bez konkretów, a dostarczony tekst wydawał się dokładny, ale składał się prawie wyłącznie z bezpośrednich cytatów. Pominięto również wzmiankę o 200 milionach urządzeń Fire TV sprzedanych na całym świecie, ale w zależności od perspektywy może to mieć sens. Osoba zainteresowana aktualizacjami swojego telewizora prawdopodobnie nie dba o to, ale inwestor w Amazon tak.

SEATTLE--(BUSINESS WIRE)-- Dzisiaj Amazon (NASDAQ: AMZN) ogłosił rozszerzenie swojej rodziny telewizorów zbudowanych przez Amazon. Oferta telewizorów zbudowana przez Amazon będzie teraz obejmować trzy nowe rozmiary serii Fire TV Omni QLED, w tym Fire TV Ambient Experience; i przedstaw przystępną cenowo serię Fire TV 2, której cena zaczyna się już od 199,99 USD. Amazon wprowadza również telewizory wyprodukowane przez Amazon w większej liczbie krajów, wprowadzając po raz pierwszy serie Omni QLED, Fire TV 4-Series i nową Fire TV 2-Series do Wielkiej Brytanii, Niemiec i Meksyku. (Foto: Business Wire) (Foto: Business Wire)

Bing obsługuje tylko monity tekstowe o długości do 2000 znaków, więc nie mogłem podać całego bloku tekstu. Przeprowadził wyszukiwanie w Internecie, aby znaleźć sposób streszczenia tekstu, a następnie dostarczył odpowiedź, która była nadal przyzwoita, bez widocznych błędów.

Dobra, spróbuję podsumować tekst za pomocą kroków, których nauczyłem się z wyników wyszukiwania12345. Oto moje podsumowanie: tekst jest komunikatem prasowym Amazona, który ogłasza rozszerzenie rodziny telewizorów zbudowanych przez Amazon. Wprowadza trzy nowe rozmiary serii Fire TV Omni QLED, która ma funkcję o nazwie Fire TV Ambient Experience, która dostosowuje się do otoczenia i nastroju widza. Wprowadza również serię Fire TV 2, która jest niedrogą opcją dla klientów, którzy chcą inteligentnego telewizora. Tekst wspomina również, że Amazon po raz pierwszy wprowadzi na rynek swoje telewizory zbudowane przez Amazon w Wielkiej Brytanii, Niemczech i Meksyku. Tekst zawiera szczegółowe informacje na temat funkcji i cen nowych produktów telewizyjnych.

Jest jedna różnica w odpowiedzi Binga: podsumowanie jest bardziej jasne, że jest to podsumowanie, odnosząc się do „tekstu” w sposób, w jaki ChatGPT nie. W przypadku obu chatbotów możesz dostosować wynik, będąc bardziej szczegółowym.

Wniosek

ChatGPT i Bing są podobne, ale mają wystarczająco dużo różnic, że wybieranie jednego lub drugiego do każdego zadania nie jest najlepszą strategią. Bing jest znacznie lepszy w wyszukiwaniu faktów i wszelkich informacji o ostatnich czasach, choć wciąż jest daleki od doskonałości. Oparty na czacie interfejs Bing i niski limit znaków ograniczają go przede wszystkim do podpowiedzi nie dłuższych niż kilka zdań, podczas gdy ChatGPT może przyjmować znacznie większe, dłuższe ciągi tekstu i kodu. (Jest też Google Bard, ale nie jesteśmy pod takim wrażeniem początkowej wersji Barda, jak ChatGPT i Bing Chat).

Te chatboty prawdopodobnie będą ewoluować w nadchodzących miesiącach i latach, ale na razie nie ma kompleksowego rozwiązania.