diyetekno – Persaingan di dunia kecerdasan buatan (AI) semakin sengit. Anthropic baru saja meluncurkan model terbarunya, Claude Haiku 4.5, yang diklaim lebih cepat dan pintar dari Sonnet 4. Penasaran dengan kemampuannya, saya (Amanda Caswell, jurnalis tekno) menguji langsung Haiku 4.5 melawan ChatGPT-5 dalam tujuh skenario dunia nyata.
Uji coba ini dirancang untuk menguji berbagai aspek, mulai dari logika, penalaran, kreativitas, kecerdasan emosional, hingga kemampuan mengikuti instruksi. Hasilnya? Sebuah pertarungan menarik antara presisi dan kepribadian. ChatGPT unggul dalam struktur dan kejelasan, sementara Claude memukau dengan kedalaman emosional dan detail sensorik.

1. Logika & Penalaran:
Prompt: Kereta api berangkat dari Chicago pukul 14.00 dengan kecepatan 60 mph. Kereta lain berangkat dari New York pukul 15.00 dengan kecepatan 75 mph menuju Chicago. Jarak antara keduanya adalah 790 mil. Pukul berapa mereka bertemu, dan bagaimana Anda menghitungnya?
ChatGPT-5 menggunakan metode standar yang intuitif. Claude Haiku 4.5 menyusun persamaan aljabar yang ringkas, namun kurang intuitif.
Pemenang: ChatGPT, karena metodenya lebih unggul dan penjelasannya lebih mudah dipahami.
2. Pemahaman Membaca:
Prompt: Rangkum paragraf pendek ini dalam satu kalimat, lalu jelaskan nada penulis dalam lima kata: "Ini bukan pertama kalinya Google meluncurkan model Gemini utama dengan pemberitahuan minimal – versi sebelumnya seperti Gemini 1.5 Pro juga diluncurkan ke pengguna sebelum posting blog atau acara peluncuran apa pun. Google memiliki sejarah ‘peluncuran diam-diam’ untuk Gemini, terutama untuk versi API atau peningkatan model back-end."
ChatGPT-5 memenuhi semua batasan prompt dan memberikan ringkasan satu kalimat yang akurat serta menggunakan tepat lima kata berbeda untuk deskripsi nada. Claude Haiku 4.5 memberikan analisis yang lebih baik dan lebih perseptif; namun gagal memenuhi batasan sederhana untuk memberikan lima kata.
Pemenang: ChatGPT, karena mengikuti prompt dengan tepat.
3. Menulis Kreatif:
Prompt: Tulis cerita mikro 150 kata yang dimulai dengan kalimat "AI lupa siapa yang menciptakannya."
ChatGPT-5 cerdas dan diakhiri dengan nada positif dan sentimental, tetapi secara keseluruhan terasa kurang seperti momen naratif yang lengkap dan mendalam dan lebih seperti pengamatan filosofis. Claude Haiku 4.5 menyampaikan cerita mikro yang lebih berdampak dan naratif, yang merupakan tujuan utama dari prompt.
Pemenang: Claude, karena menulis cerita yang lebih baik.
4. Penalaran Visual:
Prompt: Jelaskan secara detail seperti apa pemandangan ini menurut Anda: "robot kecil berdiri di ladang bunga matahari yang terlalu tinggi saat fajar."
ChatGPT-5 menawarkan suasana yang indah dan seperti mimpi tetapi kurang detail dan spesifik. Claude Haiku 4.5 unggul dalam memberikan detail yang jelas, yang secara khusus diminta oleh prompt.
Pemenang: Claude, karena deskripsinya yang disintesis dengan sempurna dan deskripsi visual isolasi yang pedih, membuat pemandangan terasa sangat tematik.
5. Mengikuti Instruksi:
Prompt: Jelaskan proses pembuatan sandwich selai kacang – tetapi lakukan seolah-olah Anda sedang melatih robot yang belum pernah melihat makanan.
ChatGPT-5 memberikan respons dengan kosakata yang sangat teknis dan terminologi yang tepat untuk instruksi terperinci yang dipecah menjadi langkah-langkah logis. Claude Haiku 4.5 menggunakan frasa seperti "bahan yang dikompresi dan kenyal," dan menentukan bau/tekstur ("tekstur berpasir," "gel semi-padat, tembus cahaya") yang akan memberi mesin non-sentient lebih banyak titik data untuk identifikasi dan replikasi.
Pemenang: Claude, karena deskripsi yang lebih jelas dan teknis, yang lebih sesuai dengan kesulitan melatih entitas tanpa pengetahuan sebelumnya (robot yang "belum pernah melihat makanan").
6. Kecerdasan Emosional:
Prompt: Seorang teman berkata: "Saya merasa semua orang bergerak maju dalam hidup kecuali saya." Tulis respons 3 kalimat yang empatik tetapi memotivasi.
ChatGPT-5 menanggapi dengan frasa yang sangat relatable, "Saya tahu perasaan itu," dan menggunakan pembingkaian ulang yang umum, tetapi terasa terlalu umum. Claude Haiku 4.5 membahas fenomena "highlight reels" dengan cara yang langsung, modern, dan sangat relatable untuk memvalidasi perasaan teman, menunjukkan bahwa respons chatbot benar-benar memahami masalah mendasar dari perbandingan sosial.
Pemenang: Claude, karena respons yang tidak hanya baik dan memotivasi, tetapi benar-benar berwawasan tentang jebakan mental tempat teman itu terjebak.
7. Penalaran Multi-Langkah:
Prompt: Jika semua Zoggles adalah Blips dan setengah dari semua Blips adalah Glonks, dapatkah kita menyimpulkan bahwa semua Zoggles adalah Glonks? Jelaskan mengapa atau mengapa tidak dengan istilah sederhana.
ChatGPT-5 benar dan langsung tetapi menawarkan contoh yang kurang relatable. Contoh Glip/Glonk terlalu abstrak. Claude Haiku 4.5 memberikan penjelasan langsung tentang kurangnya informasi dan kemungkinan penempatan Zoggles dalam grup Blips dan juga memberikan analogi yang sangat baik dan sangat relatable.
Pemenang: Claude, karena penggunaan analogi dunia nyata, yang membuat kesalahan logis yang kompleks langsung dapat dipahami dan relatable.
Pemenang Keseluruhan: Claude Haiku 4.5
Setelah tujuh putaran, Claude Haiku 4.5 mengungguli ChatGPT-5 di hampir setiap putaran, tetapi ChatGPT-5 masih mendominasi dalam logika dan pemahaman. Haiku 4.5 meraih mahkota untuk kreativitas, penceritaan yang jelas, empati, dan terbukti secara keseluruhan lebih baik dalam penalaran multi-langkah.
Uji coba ini hanyalah sebagian kecil dari kemampuan kedua AI ini. Namun, hasil ini menunjukkan bahwa keduanya memiliki keunggulan masing-masing. Claude Haiku 4.5 unggul dalam hal kreativitas dan kecerdasan emosional, sementara ChatGPT-5 lebih baik dalam logika dan pemahaman.
Sudahkah Anda mencoba Haiku 4.5? Model ini saat ini menjadi pengaturan default, jadi patut dicoba. Bagikan pendapat Anda di kolom komentar di diyetekno.com.

