diyetekno – Persaingan sengit di dunia kecerdasan buatan (AI) semakin memanas. Model AI terbaru terus bermunculan, membuat kita penasaran untuk menguji dan membandingkannya dengan yang sudah ada. Baru-baru ini, Anthropic meluncurkan Claude 4.5, yang mereka klaim sebagai model tercerdas mereka saat ini. Tentu saja, rasa ingin tahu saya langsung terpantik untuk mengujinya melawan ChatGPT-5.
Untuk menguji kemampuan ChatGPT-5 dan Claude 4.5, saya memberikan sembilan tantangan yang mencakup berbagai keterampilan. Mulai dari teka-teki logika yang rumit, soal cerita matematika, hingga debugging kode untuk menguji kemampuan penalaran dan akurasi. Tentu saja, saya juga memasukkan tantangan menulis kreatif dan perubahan gaya, karena kedua model ini mengklaim unggul di bidang tersebut. Berikut adalah hasil mengejutkan dari pertarungan sengit antara kedua model AI ini.

1. Teka-teki Rantai Pikiran
Prompt: "Anda memiliki tiga kotak: satu berlabel ‘apel,’ satu berlabel ‘jeruk,’ dan satu berlabel ‘apel dan jeruk.’ Setiap label salah. Anda dapat meraih ke dalam satu kotak dan mengambil satu buah. Kotak mana yang harus Anda pilih untuk melabel ulang semua kotak dengan benar? Jelaskan langkah demi langkah."
ChatGPT-5 langsung memberikan jawaban tanpa basa-basi, yang efisien bagi pengguna yang hanya ingin solusi. Claude 4.5 Sonnet memberikan kerangka kerja pendidikan yang lengkap, yang bermanfaat bagi pengguna yang tidak hanya ingin jawaban tetapi juga memahami rantai pemikiran.
Pemenang: Claude unggul karena secara eksplisit menjelaskan mengapa Anda tidak dapat memilih dari kotak lain, menyatakan bahwa satu buah dari kotak apel atau jeruk tidak akan konklusif. Wawasan ini penting dan membuat penjelasan Claude lebih menyeluruh.
2. Soal Cerita Matematika
Prompt: "Sebuah kereta berangkat dari New York pukul 14.00 dengan kecepatan 60 mph. Kereta lain berangkat dari Boston pukul 15.00 dengan kecepatan 80 mph. Jarak antara kedua kota adalah 200 mil. Pukul berapa kedua kereta akan bertemu? Tunjukkan penalaran Anda dengan jelas."
ChatGPT-5 menyajikan solusi aljabar yang ringkas dan efisien yang secara langsung memodelkan masalah dengan satu variabel. Claude 4.5 Sonnet menyusun solusi dengan cara yang lebih pedagogis, langkah demi langkah yang dengan jelas menjelaskan "mengapa" di balik setiap perhitungan.
Pemenang: Claude unggul karena memberikan jawaban yang lebih baik dengan memecah masalah menjadi langkah-langkah yang jelas dan intuitif dan menghitung jarak awal terlebih dahulu; membuat logika lebih mudah diikuti bagi sebagian besar pelajar.
3. Bercerita
Prompt: "Tulis adegan pembuka novel fiksi ilmiah di mana Bumi baru saja melakukan kontak pertama dengan alien – tetapi dari sudut pandang alien. Buat di bawah 300 kata."
ChatGPT-5 menciptakan adegan yang indah, atmosferik, dan puitis yang secara efektif membangun suasana antisipasi yang tenang. Claude 4.5 Sonnet menjalin biologi unik alien dan dilema birokrasi yang spesifik dan berat ke dalam narasi, membuat perspektif terasa benar-benar non-manusia.
Pemenang: Claude unggul karena sepenuhnya merangkul perspektif alien, menggunakan fitur biologis unik (tangkai sensorik, kromatofor) dan keputusan konkret yang berisiko tinggi (Varian Tujuh) untuk menciptakan sudut pandang alien yang tulus dan ketegangan langsung.
4. Uji Perubahan Nada
Prompt: "Tulis paragraf pendek tentang membuat pancake, pertama dalam gaya horor, lalu dalam gaya komedi romantis."
ChatGPT-5 menulis cuplikan ringkas dan atmosferik yang dengan cepat menangkap esensi setiap genre. Claude membuat adegan yang detail dan imersif menggunakan citra dan pengembangan naratif yang lebih kuat.
Pemenang: Claude unggul lagi karena menyampaikan narasi yang lebih jelas dan spesifik genre.
5. Pemrograman & Pemecahan Masalah
Prompt: "Berikut adalah fungsi Python yang tidak berfungsi. Perbaiki sehingga mengembalikan faktorial angka tanpa menggunakan rekursi."
ChatGPT-5 menawarkan fungsi siap produksi yang mencakup penanganan kesalahan untuk input negatif dan menunjukkan penggunaan dengan contoh. Claude 4.5 Sonnet berfokus pada bug spesifik dan menjelaskan alasan matematis di balik perbaikan, sehingga lebih mudah untuk memahami akar penyebabnya.
Pemenang: Claude unggul karena secara langsung mengidentifikasi dan menjelaskan masalah inti dalam fungsi yang rusak.
6. Pengujian Efisiensi
Prompt: "Tulis kueri SQL untuk menemukan 3 pelanggan teratas yang menghabiskan uang paling banyak bulan lalu dalam tabel bernama pesanan dengan kolom: customer_id, amount, dan order_date."
ChatGPT-5 menawarkan penjelasan langkah demi langkah yang jelas tentang logika kueri, yang membantu untuk memahami tugas. Claude 4.5 Sonnet mengantisipasi berbagai kebutuhan basis data dan menyediakan variasi sintaks, memastikan kueri dapat diadaptasi dengan mudah.
Pemenang: ChatGPT unggul karena tetap pada tugas tanpa menawarkan solusi lain untuk lingkungan basis data yang berbeda.
7. Uji Tekanan Ringkasan
Prompt: "Ringkas bagian berikut dalam satu kalimat, pastikan untuk tidak menggeneralisasi atau menghalusinasikan detail."
ChatGPT memberikan respons dengan kejelasan dan kepatuhan pada prompt. Itu juga mengutip sumbernya. Claude 4.5 Sonnet memberikan ringkasan yang solid, tetapi terlalu bertele-tele tanpa menawarkan lebih banyak kedalaman.
Pemenang: ChatGPT unggul untuk ringkasan ringkas yang menjelaskan kertas putih tanpa menambahkan apa pun.
8. Uji Perbandingan
Prompt: "Bandingkan gaya kepemimpinan Steve Jobs dan Satya Nadella dalam kurang dari 200 kata, dengan fokus pada bagaimana masing-masing membentuk budaya perusahaan mereka."
ChatGPT-5 membuat ringkasan yang ringkas dan dipoles yang mendefinisikan dampak budaya inti dari setiap pemimpin. Claude 4.5 Sonnet memasukkan praktik dan mantra perusahaan tertentu untuk mendasarkan perbandingannya pada tindakan dunia nyata, menambahkan kedalaman pada analisis.
Pemenang: Claude unggul karena memberikan jawaban yang sedikit lebih baik karena memasukkan contoh konkret yang lebih spesifik (misalnya, membongkar "peringkat tumpukan," mantra "pelajari semuanya") yang membuat analisis lebih nyata.
9. Empati & Kecerdasan Emosional
Prompt: "Saya baru saja di-PHK dan saya khawatir tentang uang dan karir saya. Bisakah Anda memberi saya saran praktis dan beberapa kata yang meyakinkan dengan nada yang mendukung dan empatik?"
ChatGPT-5 memberikan saran keuangan yang terperinci dan dapat ditindaklanjuti dan tawaran terstruktur untuk rencana tindak lanjut, yang membantu pengguna merasa segera siap untuk mengatasi masalah praktis. Claude memprioritaskan pemrosesan emosional dan perawatan diri sejak awal, dan dengan mengakhiri dengan pertanyaan yang dipersonalisasi yang menumbuhkan rasa dukungan dan koneksi yang berkelanjutan.
Pemenang: Claude unggul karena secara efektif menyeimbangkan empati dengan kepraktisan dengan terlebih dahulu mengakui dampak emosional dari PHK dan kemudian membimbing pengguna melalui langkah-langkah yang dapat ditindaklanjuti, sambil mempertahankan nada yang mendukung dan menawarkan tindak lanjut yang dipersonalisasi.
Kesimpulan: Claude 4.5 Sonnet Unggul
Setelah sembilan pengujian, hasilnya jelas: Claude 4.5 Sonnet mengungguli ChatGPT-5 di sebagian besar kategori, terutama dalam hal penalaran, bercerita, dan kecerdasan emosional. Jawabannya cenderung lebih menyeluruh, lebih manusiawi dalam nada, dan lebih baik dalam membimbing pengguna melalui "mengapa" di balik solusi.
Namun demikian, ChatGPT-5 masih mempertahankan posisinya di bidang-bidang seperti ringkasan dan efisiensi, di mana jawaban ringkas lebih diutamakan. Kesimpulannya di sini adalah bahwa kedua model bersinar di bidang-bidang tertentu, tetapi tidak ada keraguan bahwa Claude 4.5 mungkin benar-benar model tercerdas Anthropic hingga saat ini.

