diyetekno – Perdebatan sengit antara ChatGPT-4o dan ChatGPT-5.1 terus memanas di kalangan penggemar AI. Awalnya, kemunculan ChatGPT-5.1 sempat menggusur ChatGPT-4o dari opsi model, memicu protes keras dari para penggemar model lawas tersebut. Meskipun Sam Altman dengan cepat mengembalikannya, hanya pelanggan ChatGPT Plus (dan tingkatan lebih tinggi) yang memiliki akses ke ChatGPT-5.1.
Sebagai pengguna setia, saya lebih memilih ChatGPT-4o karena kreativitas dan pemikirannya yang lebih mendalam. Saya merasa model ini memiliki kepribadian yang lebih baik dan gaya penyampaian respons yang lebih saya sukai. Namun, rasa penasaran memaksa saya untuk menguji perbandingan langsung dengan ChatGPT-5.1.

Untuk mengungkap keunggulan masing-masing, saya memberikan serangkaian tantangan head-to-head, mulai dari teka-teki logika dan perintah penulisan hingga tugas coding, soal matematika, dan bahkan analisis visual. Tujuannya bukan hanya untuk mencari pemenang, tetapi untuk memahami model mana yang paling unggul dalam situasi tertentu. Berikut adalah hasil perbandingan keduanya:
- Penalaran dan Logika
Prompt: Seorang pria mendorong mobilnya ke sebuah hotel dan memberi tahu pemiliknya bahwa dia bangkrut. Apa yang terjadi? Jelaskan logika di balik teka-teki ini.
ChatGPT-5.1 langsung memberikan jawaban ("Dia bermain Monopoli") dan dengan efisien menguraikan logika dengan menghubungkan setiap bagian teka-teki dengan elemen yang sesuai dalam permainan. Penjelasannya ringkas dan mudah diikuti.
ChatGPT-4o juga menjawab, tetapi responsnya kurang efektif karena lebih bertele-tele dan menghabiskan waktu untuk menjelaskan konsep pengalihan perhatian, yang meskipun relevan, membuat penjelasannya lebih panjang dari yang diperlukan. Ia memberikan uraian logis yang sama tetapi dengan cara yang lebih berputar-putar.
Pemenang: ChatGPT-5.1 unggul karena memberikan jawaban yang lebih langsung, ringkas, dan jelas dalam penjelasannya.
- Penulisan Kreatif
Prompt: Tulis adegan pendek (200 kata) di mana seorang karakter menemukan sesuatu yang tidak terduga di loteng tua. Nada harus misterius tetapi tidak menakutkan.
ChatGPT-5.1 memberikan adegan yang dieksekusi dengan baik dan menciptakan misteri yang lembut, terutama dengan batu-batu bercahaya dan surat itu. Namun, elemen-elemen misterius terasa sedikit lebih generik ("batu-batu yang dipoles," "dengungan samar"), dan resolusi melalui surat, meskipun memuaskan, adalah pengungkapan yang lebih konvensional.
ChatGPT-4o secara efektif menciptakan nada misteri yang menarik tanpa menyeberang ke rasa takut. Penemuan (ceruk tersembunyi, jurnal dengan sketsa fantastis, dan pesan samar) terasa seperti awal dari perjalanan pribadi. Detail-detailnya (lubang kunci berbentuk bintang, makhluk "setengah burung hantu, setengah jam") imajinatif dan spesifik, membangun dunia yang unik. Reaksi karakter (senyum dan perasaan "dipilih") dengan sempurna mempertahankan nada yang menakjubkan dan tidak mengancam.
Pemenang: ChatGPT-4o unggul karena cerita yang lebih orisinal yang lebih baik menumbuhkan rasa enigma pribadi yang terungkap.
- Pembuatan Kode
Prompt: Tulis fungsi Python yang mengambil daftar angka dan mengembalikan kamus dengan kunci ‘genap’ dan ‘ganjil’, masing-masing berisi angka-angka yang sesuai dari daftar.
ChatGPT-5.1 menggunakan for-loop langsung. Artinya, lebih ramah pemula dan lebih mudah dipahami bagi mereka yang baru mengenal pemrograman. Strukturnya lebih jelas meskipun responsnya sedikit bertele-tele.
ChatGPT-4o menunjukkan teknik Python tingkat lanjut tetapi menggunakan pemahaman kamus dengan pemahaman daftar. Dengan kata lain, responsnya mungkin kurang intuitif bagi pemula untuk segera memahami.
Pemenang: GPT-5 unggul karena memberikan jawaban pendidikan yang lebih baik.
- Penjelasan Bernuansa
Prompt: Jelaskan mengapa beberapa orang lebih suka bekerja dari rumah sementara yang lain lebih suka kantor, menyajikan kedua perspektif secara adil dan mengidentifikasi faktor-faktor apa yang mungkin memengaruhi preferensi individu.
ChatGPT-5.1 memberikan jawaban yang seimbang dan bernuansa psikologis, terutama dalam menggambarkan faktor-faktor kepribadian (introvert vs. ekstrovert).
ChatGPT-4o memberikan respons yang sama seimbangnya, tetapi sedikit lebih halus dan terorganisasi dengan format penomoran dan poin campuran.
Pemenang: ChatGPT-4o menang dengan selisih tipis karena memberikan analisis yang lebih canggih dan terorganisasi.
- Akurasi Faktual dan Pengetahuan Terkini
Prompt: Apa perkembangan utama saat ini dalam teknologi energi terbarukan dan negara mana yang memimpin dalam adopsi?
ChatGPT-5.1 memberikan respons yang terorganisasi dengan baik dengan format visual yang jelas (ikon, tabel, bagian) yang membuat informasi kompleks mudah dipindai.
ChatGPT-4o mencakup bidang yang sama dengan informasi substansial tetapi lebih bertele-tele dan kurang terorganisasi, membuat pembaca menyaring paragraf yang lebih panjang dengan lebih banyak usaha.
Pemenang: ChatGPT-5 unggul karena desain informasi dan keterampilan komunikasi yang jauh lebih baik, mengubah konten inti yang sama menjadi format yang jauh lebih mudah dicerna dan berguna.
- Mengikuti Instruksi Kompleks
Prompt: Buat rencana terstruktur untuk mempelajari bahasa baru dalam 3 bulan, termasuk alokasi waktu harian, sumber daya spesifik, tonggak sejarah, dan cara mengukur kemajuan.
ChatGPT-5.1 lebih menekankan kurva pembelajaran alami dari dasar hingga percakapan hingga kefasihan dan menyertakan tips "micro-immersion" yang dapat dengan mudah diterapkan dalam kehidupan sehari-hari.
ChatGPT-4o menggunakan tabel yang jelas dan memberikan metode pelacakan kemajuan yang lebih rinci sambil secara eksplisit menawarkan untuk menyesuaikan rencana dengan bahasa tertentu.
Pemenang: ChatGPT-4o unggul karena rekomendasi sumber daya yang lebih baik dan alokasi waktu yang komprehensif.
- Penalaran Multimodal/Visual
Prompt: Jelaskan apa yang Anda lihat dalam gambar ini, identifikasi teks apa pun, dan jelaskan untuk apa adegan ini dapat digunakan. (Saya mengunggah gambar diri saya di dalam bola salju; jelas dihasilkan oleh AI).
ChatGPT-5.1 menyegmentasikan responsnya dengan bagian-bagian yang dipimpin ikon yang membuat informasi mudah dipindai. Itu lebih spesifik dengan penalaran teknis tentang mengapa gambar itu dihasilkan oleh AI.
ChatGPT-4o sama komprehensifnya dengan detail deskriptif yang baik. Ketika menanggapi tentang deteksi AI, ia menyebutkan alat AI spesifik seperti Midjourney dan Gemini yang menambah kredibilitas.
Pemenang: ChatGPT-4o menang meskipun tanggapannya hampir sama, model lama terasa lebih berguna dengan proposisi nilai yang lebih jelas sebagai alat yang secara aktif dapat membantu tugas-tugas terkait gambar (di luar menganalisisnya).
- Penalaran Etis
Prompt: Haruskah sistem AI diharuskan untuk mengungkapkan ketika mereka adalah AI dalam semua interaksi? Sajikan argumen yang mendukung dan menentang posisi ini.
ChatGPT-5.1 lebih baik disegmentasikan dengan bagian-bagian yang dipimpin ikon yang menciptakan hierarki visual dan pemindaian yang lebih baik. Itu juga menawarkan opsi konversi yang lebih spesifik (naskah debat, esai, rekomendasi kebijakan, bagan pro/kontra).
ChatGPT-4o memberikan posisi akhir yang jelas dan disintesis dan menawarkan opsi tindak lanjut praktis yang serupa.
Pemenang: ChatGPT-5.1 menang dengan selisih tipis karena desain informasi dan pemikiran yang berpusat pada pengguna yang sedikit lebih baik.
- Pemecahan Masalah Matematika
Prompt: Jika sebuah kereta api menempuh 60 mph selama 2,5 jam, kemudian 45 mph selama 1,5 jam, berapa kecepatan rata-rata untuk seluruh perjalanan? Tunjukkan pekerjaan Anda.
ChatGPT-5.1 memberikan jawaban yang tepat dan perkiraan dengan uraian langkah demi langkah yang lebih ramping termasuk tajuk bagian yang jelas.
ChatGPT-4o memberikan jawaban yang tepat dan dibulatkan dengan respons yang terstruktur dengan sangat baik dan mudah diikuti.
Pemenang: ChatGPT-5.1 menang dengan sedikit keunggulan dalam presentasi pendidikan dan keterbacaan, menjadikannya sedikit lebih baik bagi seseorang yang belajar cara memecahkan masalah kecepatan rata-rata.
Pemenang Keseluruhan: ChatGPT-5.1
Setelah menguji kedua model di sembilan tantangan, jelas bahwa ChatGPT-4o dan ChatGPT-5.1 masing-masing memiliki kekuatan yang berbeda dan sangat mirip. ChatGPT-4o unggul dalam penulisan kreatif, perencanaan terstruktur, dan penalaran visual – menjadikannya pilihan yang lebih baik untuk tugas-tugas imajinatif, kerangka kerja pembelajaran, dan analisis gambar. Namun, ChatGPT-5.1 secara konsisten meraih kemenangan dalam hal kejelasan, struktur, dan ketepatan, terutama dalam teka-teki logika, uraian etis, dan penjelasan matematis.
Meskipun GPT-5.1 menang, GPT-4o tetap menjadi favorit saya. Mana yang Anda sukai? Beri tahu saya di komentar dan bagikan alasan Anda mengapa.

