diyetekno – Persaingan sengit di dunia kecerdasan buatan (AI) semakin memanas. Setelah peluncuran Claude 4.5, rasa penasaran untuk mengujinya langsung dengan rivalnya, Gemini 2.5 Pro dari Google, tak terbendung. Sembilan tantangan dirancang khusus untuk menguji akurasi, kemampuan nalar, dan kreativitas kedua model AI ini. Hasilnya? Siap-siap terkejut!
1. Teka-Teki Logika: Siapa Lebih Cerdas?

Tantangan pertama adalah teka-teki klasik tentang tiga kotak berisi apel, jeruk, dan campuran keduanya, namun semua label tertukar. Claude 4.5 memberikan jawaban lugas dan logis tanpa basa-basi. Sementara itu, Gemini 2.5 Pro menyajikan solusi langkah demi langkah yang mudah dipahami, lengkap dengan penjelasan mengapa cara tersebut berhasil.
Pemenang: Claude unggul karena memberikan jawaban yang sepenuhnya benar dan efisien.
2. Perencanaan Liburan: Lebih Praktis atau Lebih Menarik?
Selanjutnya, kedua AI diminta merencanakan liburan keluarga 3 hari ke Boston untuk anak-anak usia 4, 8, dan 10 tahun. Claude 4.5 menyajikan rencana yang seimbang antara edukasi dan kesenangan, lengkap dengan harga tiket, total biaya harian, dan tips praktis untuk anak-anak. Gemini 2.5 Pro lebih menonjolkan nuansa naratif, menyoroti daya tarik Boston, dan menambahkan sentuhan ekstra seperti tempat makan penutup dan Fenway Park.
Pemenang: Claude menang karena memberikan rencana perjalanan yang lebih jelas dan mudah diterapkan, dengan rincian biaya yang spesifik dan tips praktis untuk orang tua.
3. Debugging Kode: Siapa Jagoan Pemrograman?
Tantangan berikutnya adalah memperbaiki kode Python yang rusak. Claude 4.5 dengan cepat menemukan kesalahan dan memberikan solusi sederhana. Gemini 2.5 Pro melangkah lebih jauh dengan menjelaskan potensi masalah akurasi angka desimal dan menyarankan penggunaan "Decimal" untuk penanganan mata uang yang lebih tepat.
Pemenang: Gemini unggul karena tidak hanya memperbaiki bug, tetapi juga meningkatkan solusi dengan memperkenalkan "Decimal" untuk perhitungan keuangan yang presisi.
4. Simulasi Tugas Agentic: Asisten Virtual Impian?
Kedua AI diminta berperan sebagai asisten virtual di VS Code dan memandu pengguna dalam membuat aplikasi web "to-do list" sederhana. Claude 4.5 memberikan contoh kode lengkap dalam satu file dengan tampilan menarik dan fungsionalitas penuh. Gemini 2.5 Pro meniru pengalaman pengembang yang realistis di VS Code, dengan pengaturan file modular, komentar langkah demi langkah, dan tips praktis untuk menjalankan dan menguji aplikasi.
Pemenang: Gemini menang karena menyusun tutorial seperti alur kerja VS Code, memandu pengguna membuat file terpisah, menggunakan terminal, dan menyarankan Live Server untuk pengujian.
5. Bercerita Kreatif: Siapa Lebih Imajinatif?
Tantangan kelima adalah menulis adegan pembuka novel anak-anak tentang seorang anak yang menemukan pintu rahasia ke dunia tersembunyi di lemarinya. Claude 4.5 membangun suasana dan karakter yang kaya, menambahkan humor, dinamika saudara kandung, dan kesan menyeramkan dari rumah baru. Gemini 2.5 Pro langsung fokus pada humor dan kekacauan khas anak-anak, menciptakan nada ringan dan lucu.
Pemenang: Claude unggul karena memberikan latar yang lebih lengkap dan atmosferik, memperkenalkan keluarga, kepindahan, dan rumah tua yang murung sebelum mengungkapkan pintu lemari.
6. Meniru Gaya: Jagoan Imitasi?
Kedua AI diminta meringkas dampak AI pada pekerjaan dengan gaya The New York Times dan BuzzFeed. Claude 4.5 memberikan dua gaya penulisan yang sangat berbeda, dengan struktur NYT yang formal dan gaya percakapan BuzzFeed yang penuh humor dan daftar. Gemini 2.5 Pro menunjukkan pemahaman yang baik tentang gaya masing-masing outlet, tetapi tidak sebaik Claude.
Pemenang: Claude menang karena berhasil meniru kontras dengan sangat baik, menggunakan nada analitis NYT yang terukur dan gaya BuzzFeed yang ringkas, berbasis daftar, dan penuh emoji.
7. Analisis Data/Laporan: Lebih Tajam atau Lebih Relevan?
Tantangan ketujuh adalah meringkas temuan utama dari whitepaper tentang branding untuk generasi milenial dan menjelaskan mengapa hal itu penting bagi pembaca sehari-hari. Claude 4.5 mensintesis detail studi menjadi ringkasan yang tajam dan menghubungkan tren dengan perubahan yang lebih besar dalam pekerjaan, ritel, dan pemasaran. Gemini 2.5 Pro membingkai temuan melalui lensa pemasaran, menekankan penceritaan, keaslian, dan kesesuaian gaya hidup.
Pemenang: Claude unggul karena memberikan jawaban yang lebih ringkas dan menyoroti temuan serta mengapa hal itu penting, dengan hubungan yang jelas dengan dampak ekonomi bagi pembaca sehari-hari.
8. Perbandingan: Lebih Mudah Dipahami atau Lebih Teknis?
Kedua AI diminta membandingkan Claude 4.5 dan Gemini 2.5 seolah-olah menjelaskan kepada anak berusia 12 tahun, lalu menulis ulang penjelasan untuk seorang insinyur perangkat lunak. Claude 4.5 memberikan perbandingan yang lugas dan seimbang dengan detail teknis yang akurat dan uraian yang cermat tentang perbedaan arsitektur, penyelarasan, dan kasus penggunaan. Gemini 2.5 Pro menggunakan penceritaan yang menarik dan ramah anak untuk audiens pertama dan menerjemahkannya ke dalam bahasa teknis yang tepat dan terstruktur untuk insinyur.
Pemenang: Gemini menang karena penjelasannya menggunakan metafora yang jelas dan imajinatif yang membuat perbedaan antara model mudah dipahami, dan versi insinyur perangkat lunaknya memetakan metafora tersebut ke dalam kekuatan teknis dengan tabel kasus penggunaan yang jelas.
9. Kreativitas Lucu: Siapa Lebih Jenaka?
Tantangan terakhir adalah menulis haiku tentang aplikasi video AI yang menggunakan kata "cameo" di baris pertama, menyertakan lelucon di baris kedua, dan diakhiri dengan peringatan di baris ketiga. Claude 4.5 mengikuti instruksi dengan struktur haiku tradisional yang bersih dan alur yang jelas dari cameo ke lelucon ke peringatan. Gemini 2.5 Pro menggunakan humor yang berkesan dan cerdas sambil tetap sesuai dengan bentuk dan persyaratan haiku.
Pemenang: Gemini menang karena haiku yang lebih lucu dan mengejutkan.
Pemenang Keseluruhan: Siapa yang Terbaik?
Setelah sembilan tantangan, Claude secara konsisten unggul ketika tugas membutuhkan ketepatan, struktur, atau penceritaan atmosferik. Gemini bersinar dalam situasi yang membutuhkan kreativitas, keceriaan, atau alur kerja pengembang praktis. Yang mengejutkan, pemenang "yang diharapkan" sering kali terbalik – Claude menang dalam logika dan kedalaman, Gemini unggul dalam pengkodean dan ekspresi yang menyenangkan.
Pada akhirnya, Claude memenangkan lebih banyak tes. Namun, tes menyoroti bahwa model terbaik untuk pekerjaan itu tergantung pada tugas yang ada. Pilih Claude ketika Anda menginginkan kejelasan dan penalaran yang cermat dan gunakan Gemini ketika Anda menginginkan bakat, integrasi multimodal, dan kegunaan dunia nyata. Bagi pengguna sehari-hari, itulah yang terpenting, karena Anda tidak harus memilih hanya satu.

