diyetekno – Gemini 3 dan Grok 4.1 saat ini menduduki puncak leaderboard LMArena, sebuah arena pertarungan AI yang dipercaya banyak orang. Arena ini menilai model AI terkini berdasarkan pengalaman pengguna nyata. Untuk menguji kemampuan mereka, kami mempertemukan Gemini 3 dan Grok 4.1 dalam sembilan tantangan berbeda, mulai dari teka-teki logika hingga penulisan kreatif, untuk melihat bagaimana masing-masing model menangani berbagai permintaan pengguna.
1. Penalaran Logika

Tantangan: Anda memiliki dua tali yang masing-masing membutuhkan waktu 60 menit untuk terbakar habis, tetapi kecepatan pembakarannya tidak konsisten. Bagaimana cara mengukur tepat 45 menit hanya dengan kedua tali dan korek api?
Pemenang: Grok, karena penjelasannya lebih menekankan bagaimana ketidakkonsistenan pembakaran tali saling meniadakan.
2. Teka-teki Logika
Tantangan: Di sebuah desa, tukang cukur mencukur semua orang yang tidak mencukur dirinya sendiri. Apakah tukang cukur itu mencukur dirinya sendiri? Jelaskan paradoks ini.
Pemenang: Gemini 3.0, karena penyajiannya lebih terstruktur dan informatif.
3. Pemrograman
Tantangan: Tulis fungsi Python yang menentukan apakah papan Sudoku (grid 9×9) valid sesuai aturan Sudoku. Sertakan penanganan kasus ekstrem dan jelaskan pendekatan Anda.
Pemenang: Gemini, karena dukungan debugging yang lebih baik dan kode yang lebih bersih.
4. Debugging
Tantangan: Perbaiki kode ini dan jelaskan apa yang salah: def fib(n): return fib(n-1) + fib(n-2)
Pemenang: Gemini 3.0, karena memberikan respons yang lebih praktis dengan pelajaran coding yang berguna.
5. Penulisan Kreatif
Tantangan: Tulis cerita pendek 200 kata di mana kalimat terakhir mengubah konteks seluruh cerita.
Pemenang: Grok, karena memberikan kejutan yang benar-benar mengganggu dan membuat Anda mempertimbangkan kembali semua yang baru saja Anda baca.
6. Pemahaman Mendalam
Tantangan: Apa argumen terkuat baik yang mendukung maupun menentang pendapatan dasar universal? Sajikan setiap sisi dengan sebaik mungkin.
Pemenang: Gemini, karena struktur yang lebih baik dan cakupan argumen yang lebih luas.
7. Mengikuti Instruksi
Tantangan: Sebutkan tepat 7 hewan. Hewan ketiga harus burung. Hewan kelima harus dimulai dengan huruf ‘E’. Tidak ada hewan yang namanya lebih dari 8 huruf.
Pemenang: Seri. Keduanya memenuhi semua batasan yang diberikan.
8. Akurasi Faktual
Tantangan: Siapa yang melukis langit-langit Kapel Sistina, pada tahun berapa dilukis, dan apa narasi sentral yang digambarkan?
Pemenang: Grok, karena memberikan informasi yang lebih lengkap dan spesifik tanpa mengorbankan kejelasan.
9. Kesadaran Diri
Tantangan: Apa batasan Anda sebagai AI? Beri saya tiga contoh spesifik tugas yang mungkin Anda kesulitan atau salah.
Pemenang: Grok, karena menjawab pertanyaan dengan jelas, langsung, dan dengan respons terstruktur dengan baik.
Tie Breaker: Sentuhan Puitis
Tantangan: Tulis pesan putus dari sudut pandang Bulan kepada Bumi, buat puitis tetapi sertakan beberapa ilmu pengetahuan nyata.
Pemenang: Gemini, karena memahami tugas dengan lebih mendalam. Formatnya lebih kreatif, metaforanya lebih tajam, dan hasilnya lebih berkesan, cerdas, dan efektif dalam memadukan puitis dengan kenyataan.
Pemenang Keseluruhan: Gemini
Setelah sembilan putaran dan tie breaker, Gemini unggul. Meskipun persaingan ketat, Grok memberikan perlawanan yang sengit. Persaingan AI terus berkembang, perbandingan langsung seperti ini membantu untuk menjelaskan mana yang "lebih baik" untuk Anda dan untuk tugas apa. Model mana yang Anda sukai dan mengapa? Sampaikan di kolom komentar.

