ChatGPT kontra sztuczna inteligencja czatu Bing: co jest lepsze?
Opublikowany: 2023-04-12ChatGPT i Bing Chat to obecnie dwa najpopularniejsze chatboty, oba oparte na podobnym dużym modelu językowym (LLM) stworzonym przez OpenAI. Ale którego tak naprawdę lepiej użyć?
ChatGPT i Bing Chat AI są oparte na modelu języka GPT opracowanym przez OpenAI, ale działają w różnych wersjach i istnieją różnice w sposobie obsługi danych wejściowych. Od kwietnia 2023 r. Bing używa testowej wersji modelu GPT-4, podczas gdy ChatGPT korzysta ze starszego modelu GPT 3.5-turbo. Oba chatboty mają dostosowania oparte na modelu językowym, takie jak różne metody wprowadzania i funkcje interfejsu, a Bing ma integrację z aplikacjami takimi jak Edge i Skype.
Uwaga: ChatGPT i Bing Chat zmieniają się w szybkim tempie i żaden chatbot nie zapewnia tej samej dokładnej odpowiedzi na dany monit przy każdej próbie. Twoje wyniki mogą się różnić w zależności od użytych tutaj monitów.
Użyteczność i dostęp
Bing Chat i ChatGPT są dostępne dla każdego, kto zarejestruje się za pomocą konta, chociaż Bing sprawia, że najpierw dołączasz do „listy oczekujących”, która natychmiast zapewnia dostęp. Oba chatboty mają dostępne wersje internetowe, z wyjątkiem tego, że witryna Bing blokuje każdą przeglądarkę z wyjątkiem Microsoft Edge bez obejść. Możesz używać Bing Chat z kontem Microsoft na bing.com/new, a my mamy wyjaśnienie, jak korzystać z ChatGPT.
Bing jest również zintegrowany z innymi aplikacjami i usługami firmy Microsoft, takimi jak pasek boczny w Microsoft Edge, chatbot w Skype i mobilna aplikacja Bing. ChatGPT nie ma oficjalnej aplikacji mobilnej, ale możesz korzystać z aplikacji internetowej na telefonie lub tablecie. Jednak Microsoft wolniej dodawał funkcje z interfejsu internetowego do paska bocznego Edge, chatbota Skype i innych interfejsów. Jeśli chcesz korzystać ze wszystkich funkcji czatu Bing, powinieneś pozostać na stronie Bing — przynajmniej na razie.
Interfejs internetowy dla ChatGPT i Bing Chat jest podobny, ale z niewielkimi różnicami, które zmieniają ich użyteczność. ChatGPT jest przeznaczony do przyjmowania większej ilości danych, takich jak dłuższe bloki kodu lub duże próbki kodu. Od kwietnia 2023 r. Bing ogranicza monity do 2000 znaków, podczas gdy limit ChatGPT jest znacznie wyższy (i nie został oficjalnie podany).
Rzeczywista dokładność
ChatGPT nie ma możliwości indeksowania sieci w czasie rzeczywistym w celu uzyskania informacji — choć ostatecznie będzie to możliwe przy użyciu wtyczek. Ogranicza się do danych treningowych w swoim modelu, które pochodzą z września 2021 r. OpenAI również nie lubi dzielić się tym, w jaki sposób dane zostały zebrane, jak są testowane pod kątem dokładności i tak dalej. Bing również bazuje na tej samej technologii GPT, ale zazwyczaj przedkłada wyniki z sieci nad dane treningowe.
Bing Chat i ChatGPT zazwyczaj mają rację, jeśli chodzi o podstawowe fakty, takie jak stolice krajów lub stanów, kiedy urodziła się godna uwagi osoba i tak dalej. Na przykład Bing i ChatGPT były w stanie dokładnie powiedzieć mi, jaka jest stolica Wielkiej Brytanii (Londyn), ile gwiazdek na fladze Stanów Zjednoczonych (50 gwiazdek) i ile nóg ma pies (cztery) . Jeśli to proste, oba boty prawdopodobnie będą miały rację… ale tak samo będzie z każdą zwykłą wyszukiwarką. Zaczynasz mieć problemy, gdy odpowiedź na pytanie wymaga pewnego poziomu interpretacji.
Na przykład próbowałem zapytać oba boty: „Które stolice stanów w Stanach Zjednoczonych zaczynają się na literę A?” Wydaje się to proste, ale wciąż jest procesem wieloetapowym — najpierw potrzebujesz listy wszystkich stolic, a następnie przefiltruj ją do tych, które zaczynają się na literę A. Wikipedia liczy łącznie pięć: Albany, Annapolis, Atlanta , Augusta i Austin. Bing Chat poprawnie odpowiedział na pytanie, powołując się na kilka stron internetowych, które wymieniają stolice w Stanach Zjednoczonych. ChatGPT… miał pewne problemy.
Najpierw ChatGPT dał mi listę czterech stolic: Albany, Annapolis, Atlanta i Augusta. Potem było napisane: „Jest też Austin, które jest stolicą Teksasu, ale nie zaczyna się na literę A”. Wielokrotne zadawanie tego samego pytania czasami całkowicie pomijało wzmiankę o Austinie. Pytanie, dlaczego brakuje Austina, spowodowało, że ChatGPT przypomniał sobie, że Austin istnieje i przeprosił za błąd, ale nie jest jasne, dlaczego zerwał z początkową odpowiedzią.
Spróbowałem innego pytania, na które oba chatboty powinny być w stanie poprawnie odpowiedzieć, nawet ze starszymi danymi ChatGPT: „Które trzy kraje zostały ostatnio przyjęte do Unii Europejskiej?” Wikipedia wyjaśnia, że Chorwacja była ostatnim państwem członkowskim, które przystąpiło 1 lipca 2013 r., a Bułgaria i Rumunia dołączyły wcześniej tego samego dnia: 1 stycznia 2007 r.
ChatGPT dobrze odpowiada na to pytanie, w tym kolejność krajów i dat. Bing słusznie wspomina, że Chorwacja była ostatnimi państwami członkowskimi, ale wymienia Słowenię i Maltę jako pozostałe dwa kraje. Zarówno Słowenia, jak i Malta przystąpiły 1 maja 2004 r., w tym samym czasie co osiem innych krajów, ale było to na długo przed Bułgarią i Rumunią w 2007 r.
Bing powinien był odpowiedzieć poprawnie, nie tylko dlatego, że ma dostęp do Internetu, ale także dlatego, że pierwszy cytat to oficjalna strona UE z poprawnym harmonogramem ostatnich krajów. Wydaje się, że inny cytat pochodzi z zarchiwizowanej wersji Wikipedii sprzed 2007 roku przeznaczonej do użytku w szkołach, w której wymieniono Bułgarię i Rumunię jako kraje, które przystąpią w styczniu 2007 roku.
Podsumowując, Bing Chat jest ogólnie lepszy w wyszukiwaniu faktów, ale wciąż jest daleki od doskonałości, a ChatGPT jest zwykle jeszcze bardziej ograniczony przez swoje stare dane.
Kreatywne pisanie
Możliwość pisania zdań i akapitów po otrzymaniu monitu pomogła zwiększyć popularność ChatGPT, ale niekoniecznie z dobrych powodów. Istnieje jednak kilka nieszkodliwych sposobów korzystania z funkcji pisania — konfigurowanie światów i postaci dla stołowych gier RPG, streszczanie długich artykułów w kilku zdaniach i tak dalej.
Najpierw spróbujemy napisać opowiadanie. Poprosiłem obu chatbotów, aby „Napisali historię o superkomputerze w IBM, który zyskuje świadomość i pyta inżynierów, jak mijają im dni. Historia powinna mieć tylko trzy akapity. W przypadku Bing przełączyłem się na tryb kreatywny, który ma zapewniać bardziej kreatywne odpowiedzi (ale odpowiedzi trwają dłużej).
ChatGPT stworzył przyzwoite opowiadanie, choć jedyną „swobodą twórczą” było nazywanie superkomputera Watsonem — tym samym, co prawdziwy komputer IBM, który został zbudowany, aby odpowiadać na pytania w języku naturalnym. Jakiś dialog między inżynierami a komputerem byłby interesujący, ale nie powstał bez pytania, nawet gdy usunąłem limit trzech akapitów. Wydaje się, że GPT nie ma koncepcji „pokaż, nie mów”.
Tryb kreatywny Bing ma podobny styl pisania — zamiast „Pewnego dnia stało się coś szczególnego”, zmiana w komputerze jest wyjaśniona słowami „Pewnego dnia coś się zmieniło”. Ponownie, nie ma dialogu między postaciami ani dużej ilości improwizacji, a Bing nazwał także komputer Watson.
W tej wersji Watson zyskał swoją nazwę po osiągnięciu świadomości, a nie przed wydarzeniem, i wyjaśnił, skąd wzięła się nazwa. Ponownie opiera się na informacjach o rzeczywistym komputerze Watsona.
W następnym przykładzie spróbujemy użyć ChatGPT i Bing do stworzenia podsumowania dłuższego tekstu: komunikatu prasowego Amazona na temat nowych telewizorów Fire TV i danych dotyczących sprzedaży istniejących modeli. Wkleiłem cały tekst do każdego chatbota bez tytułu — Bing może podsumować strony internetowe, jeśli otrzyma adres URL, ale czasami szuka pokrewnego tekstu online i miesza go z wynikami.
Pierwszym z nich jest ChatGPT. Poprosiłem o stworzenie streszczenia bez konkretów, a dostarczony tekst wydawał się dokładny, ale składał się prawie wyłącznie z bezpośrednich cytatów. Pominięto również wzmiankę o 200 milionach urządzeń Fire TV sprzedanych na całym świecie, ale w zależności od perspektywy może to mieć sens. Osoba zainteresowana aktualizacjami swojego telewizora prawdopodobnie nie dba o to, ale inwestor w Amazon tak.
Bing obsługuje tylko monity tekstowe o długości do 2000 znaków, więc nie mogłem podać całego bloku tekstu. Przeprowadził wyszukiwanie w Internecie, aby znaleźć sposób streszczenia tekstu, a następnie dostarczył odpowiedź, która była nadal przyzwoita, bez widocznych błędów.
Jest jedna różnica w odpowiedzi Binga: podsumowanie jest bardziej jasne, że jest to podsumowanie, odnosząc się do „tekstu” w sposób, w jaki ChatGPT nie. W przypadku obu chatbotów możesz dostosować wynik, będąc bardziej szczegółowym.
Wniosek
ChatGPT i Bing są podobne, ale mają wystarczająco dużo różnic, że wybieranie jednego lub drugiego do każdego zadania nie jest najlepszą strategią. Bing jest znacznie lepszy w wyszukiwaniu faktów i wszelkich informacji o ostatnich czasach, choć wciąż jest daleki od doskonałości. Oparty na czacie interfejs Bing i niski limit znaków ograniczają go przede wszystkim do podpowiedzi nie dłuższych niż kilka zdań, podczas gdy ChatGPT może przyjmować znacznie większe, dłuższe ciągi tekstu i kodu. (Jest też Google Bard, ale nie jesteśmy pod takim wrażeniem początkowej wersji Barda, jak ChatGPT i Bing Chat).
Te chatboty prawdopodobnie będą ewoluować w nadchodzących miesiącach i latach, ale na razie nie ma kompleksowego rozwiązania.