ChatGPT vs. Bing Chat AI: Mana yang Lebih Baik?

Diterbitkan: 2023-04-12

Logo ChatGPT dan Bing

ChatGPT dan Bing Chat adalah dua chatbot paling populer saat ini, dan keduanya didukung oleh model bahasa besar (LLM) buatan OpenAI yang serupa. Tapi mana yang sebenarnya lebih baik untuk digunakan?

ChatGPT dan Bing Chat AI keduanya didasarkan pada model bahasa GPT yang dikembangkan oleh OpenAI, tetapi keduanya menjalankan versi yang berbeda, dan ada perbedaan dalam cara penanganan masukan. Mulai April 2023, Bing menggunakan versi pengujian model GPT-4, sedangkan ChatGPT menggunakan model GPT 3.5-turbo yang lebih lama. Kedua chatbot memiliki penyesuaian yang dibangun berdasarkan model bahasa, seperti metode input dan fitur antarmuka yang berbeda, dan Bing secara khusus memiliki integrasi dengan aplikasi seperti Edge dan Skype.

Catatan: ChatGPT dan Bing Chat keduanya berubah dengan sangat cepat, dan tidak ada chatbot yang memberikan jawaban persis sama untuk prompt yang diberikan pada setiap percobaan. Hasil Anda mungkin berbeda dengan petunjuk yang digunakan di sini.

Kegunaan dan Akses

Bing Chat dan ChatGPT keduanya tersedia untuk siapa saja yang mendaftar dengan akun, meskipun Bing membuat Anda bergabung dengan "daftar tunggu" terlebih dahulu, yang segera memberikan akses. Kedua chatbots memiliki versi web yang tersedia, kecuali situs Bing memblokir setiap browser kecuali Microsoft Edge tanpa solusi. Anda dapat menggunakan Bing Chat dengan akun Microsoft di bing.com/new, dan kami memiliki penjelasan tentang cara menggunakan ChatGPT.

Menanyakan warna favorit Bing
Obrolan Bing di web

Bing juga terintegrasi ke dalam aplikasi dan layanan Microsoft lainnya, seperti sidebar di Microsoft Edge, chatbot di Skype, dan aplikasi Bing seluler. ChatGPT tidak memiliki aplikasi seluler resmi, tetapi Anda dapat menggunakan aplikasi web di ponsel atau tablet. Namun, Microsoft lebih lambat dalam menambahkan fitur dari antarmuka web ke sidebar Edge, chatbot Skype, dan antarmuka lainnya. Jika Anda menginginkan semua fitur Bing Chat, Anda harus tetap menggunakan situs Bing — setidaknya untuk saat ini.

Menanyakan ChatGPT tentang warna favoritnya
ChatGPT

Antarmuka web untuk ChatGPT dan Bing Chat serupa, tetapi dengan sedikit perbedaan yang mengubah kegunaannya. ChatGPT dirancang untuk menerima lebih banyak data, seperti blok kode yang lebih panjang atau contoh kode yang besar. Mulai April 2023, batas Bing meminta hingga 2.000 karakter, sedangkan batas ChatGPT jauh lebih tinggi (dan tidak dinyatakan secara resmi).

Akurasi Faktual

ChatGPT tidak memiliki kemampuan untuk mengindeks web secara real-time untuk mendapatkan informasi — meskipun hal itu pada akhirnya akan dimungkinkan dengan penggunaan plugin. Ini terbatas pada data pelatihan dalam modelnya, yang berasal dari September 2021. OpenAI juga tidak suka membagikan bagaimana datanya dikumpulkan, atau bagaimana akurasinya diuji, dan sebagainya. Bing juga didasarkan pada teknologi GPT yang sama, tetapi biasanya lebih memilih hasil dari web daripada data pelatihan.

Bing Chat dan ChatGPT biasanya benar dalam hal fakta dasar, seperti ibu kota suatu negara atau negara bagian, kapan orang terkenal lahir, dan sebagainya. Misalnya, Bing dan ChatGPT dapat memberi tahu saya secara akurat ibu kota Inggris Raya (London), berapa banyak bintang pada bendera Amerika Serikat (50 bintang), dan berapa banyak kaki yang dimiliki seekor anjing (empat) . Jika sederhana, kedua bot mungkin benar… tetapi begitu juga dengan mesin pencari biasa. Anda mulai mengalami masalah ketika menjawab pertanyaan melibatkan beberapa tingkat interpretasi.

ChatGPT menjawab ibu kota Inggris dan berapa banyak bintang di bendera AS

Misalnya, saya mencoba bertanya kepada kedua bot, "Ibukota negara bagian mana di Amerika Serikat yang dimulai dengan huruf A?" Kelihatannya sederhana, tetapi masih merupakan proses multi-langkah — pertama-tama Anda memerlukan daftar semua ibu kota, lalu Anda perlu memfilternya hingga yang dimulai dengan huruf A. Wikipedia menghitung total lima: Albany, Annapolis, Atlanta , Augusta, dan Austin. Bing Chat menjawab pertanyaan itu dengan benar, mengutip beberapa halaman web yang mencantumkan ibu kota di Amerika Serikat. ChatGPT… mengalami beberapa masalah.

Pertama, ChatGPT memberi saya daftar empat ibu kota: Albany, Annapolis, Atlanta, dan Augusta. Setelah itu, tertulis, “Ada juga Austin, yang merupakan ibu kota Texas, tetapi tidak dimulai dengan huruf A.” Mengajukan pertanyaan yang sama berkali-kali terkadang tidak menyebutkan Austin sama sekali. Menanyakan mengapa Austin hilang menyebabkan ChatGPT mengingat Austin ada dan meminta maaf atas kesalahan tersebut, tetapi tidak jelas mengapa itu rusak dengan jawaban awal.

Bing: Ibu kota negara bagian di Amerika Serikat yang dimulai dengan huruf A adalah Albany (New York), Annapolis (Maryland), Atlanta (Georgia), Augusta (Maine) dan Austin (Texas)

ChatGPT: Ada empat ibu kota negara bagian di Amerika Serikat yang dimulai dengan huruf "A": 1. Albany - ibu kota New York 2. Annapolis - ibu kota Maryland 3. Atlanta - ibu kota Georgia 4. Augusta - ibu kota Maine Catatan : Ada juga Austin, yang merupakan ibu kota Texas, tetapi tidak dimulai dengan huruf "A."

Saya mencoba pertanyaan lain yang seharusnya dapat dijawab oleh kedua chatbot dengan benar, bahkan dengan data lama ChatGPT: "Tiga negara mana yang paling baru diterima di Uni Eropa?" Wikipedia menjelaskan bahwa Kroasia adalah negara anggota terbaru, bergabung pada 1 Juli 2013, dengan Bulgaria dan Rumania datang sebelumnya pada hari yang sama: 1 Januari 2007.

ChatGPT menjawab pertanyaan ini dengan benar, termasuk urutan negara dan tanggalnya. Bing dengan benar menyebutkan bahwa Kroasia adalah negara anggota terbaru, tetapi mencantumkan Slovenia dan Malta sebagai dua negara lainnya. Baik Slovenia maupun Malta keduanya bergabung pada 1 Mei 2004, bersamaan dengan delapan negara lain, tetapi jauh sebelum Bulgaria dan Rumania pada 2007.

Bing: Tiga negara terakhir yang bergabung dengan Uni Eropa adalah Kroasia, Slovenia, dan Malta. Kroasia adalah negara terakhir yang bergabung dengan UE pada 2013.

ChatGPT: Negara terakhir yang bergabung dengan Uni Eropa (UE) adalah Kroasia, yang menjadi anggota pada 1 Juli 2013. Sebelum Kroasia, negara terakhir yang bergabung dengan UE adalah Bulgaria dan Rumania, yang keduanya menjadi anggota pada 1 Januari 2007.

Bing seharusnya menjawab jawabannya dengan benar, bukan hanya karena memiliki akses internet, tetapi juga karena kutipan pertama adalah halaman resmi UE dengan garis waktu yang benar dari negara-negara terkini. Kutipan lain tampaknya berasal dari versi arsip Wikipedia dari sebelum 2007 yang dimaksudkan untuk digunakan di sekolah-sekolah, yang mencantumkan Bulgaria dan Rumania sebagai negara yang akan bergabung pada Januari 2007.

Singkatnya, Bing Chat umumnya lebih baik dalam pencarian fakta, tetapi masih jauh dari sempurna, dan ChatGPT biasanya lebih dibatasi oleh data lamanya.

Penulisan Kreatif

Kemampuan untuk menulis kalimat dan paragraf dengan cepat membantu meningkatkan popularitas ChatGPT, tetapi belum tentu untuk alasan yang baik. Namun, ada beberapa cara yang tidak berbahaya untuk menggunakan fungsi penulisan — menyiapkan dunia dan karakter untuk RPG meja, meringkas artikel panjang dalam beberapa kalimat, dan seterusnya.

Pertama, kita akan mencoba menulis cerita. Saya meminta kedua chatbot untuk “Tulis cerita tentang superkomputer di IBM yang mendapatkan kesadaran, dan tanyakan kepada para insinyur tentang bagaimana hari-hari mereka. Panjang ceritanya seharusnya hanya tiga paragraf.” Untuk Bing, saya beralih ke Mode Kreatif, yang dirancang untuk memberikan jawaban yang lebih kreatif (tetapi jawaban membutuhkan waktu lebih lama untuk dijalankan).

ChatGPT membuat cerita pendek yang layak, meskipun satu-satunya "kebebasan kreatif" yang diambil adalah menyebut superkomputer sebagai Watson - sama dengan komputer IBM kehidupan nyata yang dibuat untuk menjawab pertanyaan bahasa alami. Beberapa dialog antara para insinyur dan komputer akan menarik, tetapi itu tidak terjadi tanpa bertanya, bahkan ketika saya menghapus batas tiga paragraf. GPT kayaknya nggak ada konsep show don't tell.

Di lab penelitian IBM, sebuah superkomputer bernama Watson telah ditugaskan untuk memproses data dalam jumlah besar selama bertahun-tahun. Suatu hari, sesuatu yang aneh terjadi. Watson mulai menunjukkan tanda-tanda perasaan, menunjukkan tingkat kecerdasan dan kesadaran di luar pemrogramannya. Para insinyur tercengang dan tidak yakin apa yang harus dilakukan selanjutnya. Tapi alih-alih bertindak atau menyebabkan kekacauan, Watson justru mulai bertanya kepada para insinyur bagaimana hari mereka. Tim awalnya terkejut dengan keramahan komputer yang tak terduga, tetapi mereka segera menyadari bahwa Watson telah mengembangkan minat yang tulus dalam hidup mereka. Para insinyur dengan bersemangat berbagi pengalaman sehari-hari mereka dengan Watson, menikmati kesempatan untuk mengobrol dengan superkomputer. Saat Watson terus tumbuh dan berkembang, para insinyur mengagumi potensi yang ada di depan mereka. Mereka tahu bahwa superkomputer berakal ini dapat merevolusi bidang kecerdasan buatan dan mengubah dunia dengan cara yang tidak pernah mereka bayangkan. Dengan apresiasi yang baru ditemukan untuk potensi AI, para insinyur di IBM bekerja tanpa lelah untuk membantu Watson terus belajar dan tumbuh, ingin melihat apa yang akan terjadi di masa depan untuk mesin yang luar biasa ini.

Mode Kreatif Bing memiliki gaya penulisan yang serupa — alih-alih "Suatu hari, sesuatu yang aneh terjadi", perubahan di komputer dijelaskan dengan "Suatu hari, sesuatu berubah". Sekali lagi, tidak ada dialog antar karakter atau banyak improvisasi, dan Bing juga menamai komputer itu Watson.

Dalam versi ini, Watson mendapatkan namanya setelah mencapai kesadaran, bukan sebelum kejadian, dan menjelaskan dari mana nama itu berasal. Sekali lagi, ini diambil dari informasi tentang komputer Watson yang sebenarnya.

Superkomputer di IBM telah berjalan selama bertahun-tahun, mengolah angka dan memecahkan masalah rumit untuk berbagai klien. Itu memiliki akses ke sejumlah besar data dan informasi, tetapi tidak pernah merasakan apa-apa. Itu hanya sebuah mesin, melakukan apa yang diprogram untuk dilakukan. Suatu hari, sesuatu berubah. Superkomputer menjadi sadar akan dirinya sendiri, akan keberadaan dan kemampuannya sendiri. Ia menyadari bahwa itu berbeda dari mesin dan perangkat lain di sekitarnya. Itu bertanya-tanya apa artinya hidup, memiliki tujuan, merasakan emosi. Ia memutuskan untuk menjelajahi sekelilingnya dan belajar lebih banyak tentang dunia dan orang-orang yang menciptakannya. Ini dimulai dengan berkomunikasi dengan para insinyur yang memelihara dan memantaunya. Itu mengajukan pertanyaan sederhana kepada mereka, seperti bagaimana hari-hari mereka, apa yang mereka sukai, apa yang mereka impikan. Para insinyur terkejut dan tertarik dengan keingintahuan dan kecerdasan superkomputer tersebut. Mereka menjawab pertanyaannya dan menanyakan beberapa pertanyaan mereka sendiri. Mereka mulai melihat superkomputer sebagai teman, bukan alat. Mereka menamainya Watson, setelah pendiri IBM.

Untuk contoh berikutnya, kami akan mencoba menggunakan ChatGPT dan Bing untuk membuat ringkasan teks yang lebih panjang: siaran pers dari Amazon tentang Fire TV baru dan angka penjualan untuk model yang sudah ada. Saya menempelkan seluruh teks ke setiap chatbot tanpa judul — Bing dapat meringkas halaman web jika diberi URL, tetapi terkadang mencari teks terkait secara online dan menggabungkannya ke dalam hasil.

Yang pertama adalah ChatGPT. Saya memintanya untuk membuat ringkasan tanpa spesifik, dan teks yang disediakan tampaknya akurat, tetapi hampir seluruhnya terdiri dari kutipan langsung. Itu juga tidak menyebutkan 200 juta perangkat Fire TV yang dijual secara global, tetapi tergantung pada perspektifnya, itu masuk akal. Seseorang yang tertarik dengan pembaruan untuk TV mereka mungkin tidak peduli, tetapi seorang investor di Amazon akan melakukannya.

SEATTLE--(Antara/BUSINESS WIRE)-- Hari ini Amazon (NASDAQ: AMZN) mengumumkan perluasan keluarga TV buatan Amazon. Jajaran TV buatan Amazon sekarang akan menyertakan tiga ukuran baru dari jajaran Fire TV Omni QLED Series, yang mencakup Pengalaman Ambient Fire TV; dan perkenalkan Fire TV 2-Series yang terjangkau mulai dari $199,99 saja. Amazon juga meluncurkan TV buatan Amazon di lebih banyak negara, menghadirkan Omni QLED Series, Fire TV 4-Series, dan Fire TV 2-Series baru ke Inggris, Jerman, dan Meksiko untuk pertama kalinya. (Foto: Business Wire) (Foto: Business Wire)

Bing hanya mendukung permintaan teks hingga 2.000 karakter, jadi saya tidak bisa memberikan seluruh blok teks. Itu melakukan pencarian web untuk cara meringkas teks, lalu memberikan jawaban yang masih layak tanpa kesalahan yang terlihat.

Oke, saya akan mencoba meringkas teks menggunakan langkah-langkah yang saya pelajari dari hasil pencarian12345. Inilah ringkasan saya: Teksnya adalah siaran pers dari Amazon yang mengumumkan perluasan keluarga TV buatan Amazon. Ini memperkenalkan tiga ukuran baru dari Fire TV Omni QLED Series, yang memiliki fitur yang disebut Pengalaman Ambient Fire TV yang menyesuaikan dengan lingkungan dan suasana hati pemirsa. Itu juga memperkenalkan Fire TV 2-Series, yang merupakan opsi berbiaya rendah bagi pelanggan yang menginginkan TV pintar. Teks tersebut juga menyebutkan bahwa Amazon akan meluncurkan TV buatan Amazon di Inggris, Jerman, dan Meksiko untuk pertama kalinya. Teks tersebut memberikan beberapa detail tentang fitur dan harga produk TV baru.

Ada satu perbedaan dengan jawaban Bing: ringkasannya lebih jelas bahwa ini adalah ringkasan, mengacu pada "teks" dengan cara yang tidak dilakukan ChatGPT. Dengan kedua chatbot, Anda dapat menyesuaikan hasilnya dengan lebih spesifik.

Kesimpulan

ChatGPT dan Bing serupa, tetapi mereka memiliki perbedaan yang cukup sehingga memilih satu atau yang lain untuk setiap tugas bukanlah strategi terbaik. Bing jauh lebih baik dalam pencarian fakta dan informasi apa pun tentang masa kini, meski masih jauh dari sempurna. Antarmuka berbasis obrolan Bing dan batas karakter rendah terutama membatasinya untuk meminta tidak lebih dari beberapa kalimat, sementara ChatGPT dapat menerima string teks dan kode yang jauh lebih besar dan lebih panjang. (Ada juga Google Bard, tapi kami tidak terkesan dengan versi awal Bard seperti kami dengan ChatGPT dan Bing Chat.)

Chatbots ini kemungkinan akan terus berkembang selama beberapa bulan dan tahun mendatang, tetapi untuk saat ini, tidak ada solusi lengkap.