ChatGPT vs. Bing Chat AI: Mana yang Lebih Baik?
Diterbitkan: 2023-04-12ChatGPT dan Bing Chat adalah dua chatbot paling populer saat ini, dan keduanya didukung oleh model bahasa besar (LLM) buatan OpenAI yang serupa. Tapi mana yang sebenarnya lebih baik untuk digunakan?
ChatGPT dan Bing Chat AI keduanya didasarkan pada model bahasa GPT yang dikembangkan oleh OpenAI, tetapi keduanya menjalankan versi yang berbeda, dan ada perbedaan dalam cara penanganan masukan. Mulai April 2023, Bing menggunakan versi pengujian model GPT-4, sedangkan ChatGPT menggunakan model GPT 3.5-turbo yang lebih lama. Kedua chatbot memiliki penyesuaian yang dibangun berdasarkan model bahasa, seperti metode input dan fitur antarmuka yang berbeda, dan Bing secara khusus memiliki integrasi dengan aplikasi seperti Edge dan Skype.
Catatan: ChatGPT dan Bing Chat keduanya berubah dengan sangat cepat, dan tidak ada chatbot yang memberikan jawaban persis sama untuk prompt yang diberikan pada setiap percobaan. Hasil Anda mungkin berbeda dengan petunjuk yang digunakan di sini.
Kegunaan dan Akses
Bing Chat dan ChatGPT keduanya tersedia untuk siapa saja yang mendaftar dengan akun, meskipun Bing membuat Anda bergabung dengan "daftar tunggu" terlebih dahulu, yang segera memberikan akses. Kedua chatbots memiliki versi web yang tersedia, kecuali situs Bing memblokir setiap browser kecuali Microsoft Edge tanpa solusi. Anda dapat menggunakan Bing Chat dengan akun Microsoft di bing.com/new, dan kami memiliki penjelasan tentang cara menggunakan ChatGPT.
Bing juga terintegrasi ke dalam aplikasi dan layanan Microsoft lainnya, seperti sidebar di Microsoft Edge, chatbot di Skype, dan aplikasi Bing seluler. ChatGPT tidak memiliki aplikasi seluler resmi, tetapi Anda dapat menggunakan aplikasi web di ponsel atau tablet. Namun, Microsoft lebih lambat dalam menambahkan fitur dari antarmuka web ke sidebar Edge, chatbot Skype, dan antarmuka lainnya. Jika Anda menginginkan semua fitur Bing Chat, Anda harus tetap menggunakan situs Bing — setidaknya untuk saat ini.
Antarmuka web untuk ChatGPT dan Bing Chat serupa, tetapi dengan sedikit perbedaan yang mengubah kegunaannya. ChatGPT dirancang untuk menerima lebih banyak data, seperti blok kode yang lebih panjang atau contoh kode yang besar. Mulai April 2023, batas Bing meminta hingga 2.000 karakter, sedangkan batas ChatGPT jauh lebih tinggi (dan tidak dinyatakan secara resmi).
Akurasi Faktual
ChatGPT tidak memiliki kemampuan untuk mengindeks web secara real-time untuk mendapatkan informasi — meskipun hal itu pada akhirnya akan dimungkinkan dengan penggunaan plugin. Ini terbatas pada data pelatihan dalam modelnya, yang berasal dari September 2021. OpenAI juga tidak suka membagikan bagaimana datanya dikumpulkan, atau bagaimana akurasinya diuji, dan sebagainya. Bing juga didasarkan pada teknologi GPT yang sama, tetapi biasanya lebih memilih hasil dari web daripada data pelatihan.
Bing Chat dan ChatGPT biasanya benar dalam hal fakta dasar, seperti ibu kota suatu negara atau negara bagian, kapan orang terkenal lahir, dan sebagainya. Misalnya, Bing dan ChatGPT dapat memberi tahu saya secara akurat ibu kota Inggris Raya (London), berapa banyak bintang pada bendera Amerika Serikat (50 bintang), dan berapa banyak kaki yang dimiliki seekor anjing (empat) . Jika sederhana, kedua bot mungkin benar… tetapi begitu juga dengan mesin pencari biasa. Anda mulai mengalami masalah ketika menjawab pertanyaan melibatkan beberapa tingkat interpretasi.
Misalnya, saya mencoba bertanya kepada kedua bot, "Ibukota negara bagian mana di Amerika Serikat yang dimulai dengan huruf A?" Kelihatannya sederhana, tetapi masih merupakan proses multi-langkah — pertama-tama Anda memerlukan daftar semua ibu kota, lalu Anda perlu memfilternya hingga yang dimulai dengan huruf A. Wikipedia menghitung total lima: Albany, Annapolis, Atlanta , Augusta, dan Austin. Bing Chat menjawab pertanyaan itu dengan benar, mengutip beberapa halaman web yang mencantumkan ibu kota di Amerika Serikat. ChatGPT… mengalami beberapa masalah.
Pertama, ChatGPT memberi saya daftar empat ibu kota: Albany, Annapolis, Atlanta, dan Augusta. Setelah itu, tertulis, “Ada juga Austin, yang merupakan ibu kota Texas, tetapi tidak dimulai dengan huruf A.” Mengajukan pertanyaan yang sama berkali-kali terkadang tidak menyebutkan Austin sama sekali. Menanyakan mengapa Austin hilang menyebabkan ChatGPT mengingat Austin ada dan meminta maaf atas kesalahan tersebut, tetapi tidak jelas mengapa itu rusak dengan jawaban awal.
Saya mencoba pertanyaan lain yang seharusnya dapat dijawab oleh kedua chatbot dengan benar, bahkan dengan data lama ChatGPT: "Tiga negara mana yang paling baru diterima di Uni Eropa?" Wikipedia menjelaskan bahwa Kroasia adalah negara anggota terbaru, bergabung pada 1 Juli 2013, dengan Bulgaria dan Rumania datang sebelumnya pada hari yang sama: 1 Januari 2007.
ChatGPT menjawab pertanyaan ini dengan benar, termasuk urutan negara dan tanggalnya. Bing dengan benar menyebutkan bahwa Kroasia adalah negara anggota terbaru, tetapi mencantumkan Slovenia dan Malta sebagai dua negara lainnya. Baik Slovenia maupun Malta keduanya bergabung pada 1 Mei 2004, bersamaan dengan delapan negara lain, tetapi jauh sebelum Bulgaria dan Rumania pada 2007.
Bing seharusnya menjawab jawabannya dengan benar, bukan hanya karena memiliki akses internet, tetapi juga karena kutipan pertama adalah halaman resmi UE dengan garis waktu yang benar dari negara-negara terkini. Kutipan lain tampaknya berasal dari versi arsip Wikipedia dari sebelum 2007 yang dimaksudkan untuk digunakan di sekolah-sekolah, yang mencantumkan Bulgaria dan Rumania sebagai negara yang akan bergabung pada Januari 2007.
Singkatnya, Bing Chat umumnya lebih baik dalam pencarian fakta, tetapi masih jauh dari sempurna, dan ChatGPT biasanya lebih dibatasi oleh data lamanya.
Penulisan Kreatif
Kemampuan untuk menulis kalimat dan paragraf dengan cepat membantu meningkatkan popularitas ChatGPT, tetapi belum tentu untuk alasan yang baik. Namun, ada beberapa cara yang tidak berbahaya untuk menggunakan fungsi penulisan — menyiapkan dunia dan karakter untuk RPG meja, meringkas artikel panjang dalam beberapa kalimat, dan seterusnya.
Pertama, kita akan mencoba menulis cerita. Saya meminta kedua chatbot untuk “Tulis cerita tentang superkomputer di IBM yang mendapatkan kesadaran, dan tanyakan kepada para insinyur tentang bagaimana hari-hari mereka. Panjang ceritanya seharusnya hanya tiga paragraf.” Untuk Bing, saya beralih ke Mode Kreatif, yang dirancang untuk memberikan jawaban yang lebih kreatif (tetapi jawaban membutuhkan waktu lebih lama untuk dijalankan).
ChatGPT membuat cerita pendek yang layak, meskipun satu-satunya "kebebasan kreatif" yang diambil adalah menyebut superkomputer sebagai Watson - sama dengan komputer IBM kehidupan nyata yang dibuat untuk menjawab pertanyaan bahasa alami. Beberapa dialog antara para insinyur dan komputer akan menarik, tetapi itu tidak terjadi tanpa bertanya, bahkan ketika saya menghapus batas tiga paragraf. GPT kayaknya nggak ada konsep show don't tell.
Mode Kreatif Bing memiliki gaya penulisan yang serupa — alih-alih "Suatu hari, sesuatu yang aneh terjadi", perubahan di komputer dijelaskan dengan "Suatu hari, sesuatu berubah". Sekali lagi, tidak ada dialog antar karakter atau banyak improvisasi, dan Bing juga menamai komputer itu Watson.
Dalam versi ini, Watson mendapatkan namanya setelah mencapai kesadaran, bukan sebelum kejadian, dan menjelaskan dari mana nama itu berasal. Sekali lagi, ini diambil dari informasi tentang komputer Watson yang sebenarnya.
Untuk contoh berikutnya, kami akan mencoba menggunakan ChatGPT dan Bing untuk membuat ringkasan teks yang lebih panjang: siaran pers dari Amazon tentang Fire TV baru dan angka penjualan untuk model yang sudah ada. Saya menempelkan seluruh teks ke setiap chatbot tanpa judul — Bing dapat meringkas halaman web jika diberi URL, tetapi terkadang mencari teks terkait secara online dan menggabungkannya ke dalam hasil.
Yang pertama adalah ChatGPT. Saya memintanya untuk membuat ringkasan tanpa spesifik, dan teks yang disediakan tampaknya akurat, tetapi hampir seluruhnya terdiri dari kutipan langsung. Itu juga tidak menyebutkan 200 juta perangkat Fire TV yang dijual secara global, tetapi tergantung pada perspektifnya, itu masuk akal. Seseorang yang tertarik dengan pembaruan untuk TV mereka mungkin tidak peduli, tetapi seorang investor di Amazon akan melakukannya.
Bing hanya mendukung permintaan teks hingga 2.000 karakter, jadi saya tidak bisa memberikan seluruh blok teks. Itu melakukan pencarian web untuk cara meringkas teks, lalu memberikan jawaban yang masih layak tanpa kesalahan yang terlihat.
Ada satu perbedaan dengan jawaban Bing: ringkasannya lebih jelas bahwa ini adalah ringkasan, mengacu pada "teks" dengan cara yang tidak dilakukan ChatGPT. Dengan kedua chatbot, Anda dapat menyesuaikan hasilnya dengan lebih spesifik.
Kesimpulan
ChatGPT dan Bing serupa, tetapi mereka memiliki perbedaan yang cukup sehingga memilih satu atau yang lain untuk setiap tugas bukanlah strategi terbaik. Bing jauh lebih baik dalam pencarian fakta dan informasi apa pun tentang masa kini, meski masih jauh dari sempurna. Antarmuka berbasis obrolan Bing dan batas karakter rendah terutama membatasinya untuk meminta tidak lebih dari beberapa kalimat, sementara ChatGPT dapat menerima string teks dan kode yang jauh lebih besar dan lebih panjang. (Ada juga Google Bard, tapi kami tidak terkesan dengan versi awal Bard seperti kami dengan ChatGPT dan Bing Chat.)
Chatbots ini kemungkinan akan terus berkembang selama beberapa bulan dan tahun mendatang, tetapi untuk saat ini, tidak ada solusi lengkap.