OpenAI resmi meluncurkan GPT-5, model kecerdasan buatan (AI) terbaru yang akan menjadi otak ChatGPT. GPT-5 disebut sebagai model AI 'terpadu' pertama OpenAI, yang menggabungkan kemampuan penalaran model seri-o dengan kecepatan respons seri GPT.
Model AI generasi terbaru ini menandai era baru bagi ChatGPT dan OpenAI, hal ini menunjukkan ambisi OpenAI yang lebih luas untuk mengembangkan sistem AI yang lebih mirip agen daripada chatbot.
Salah satu terobosan GPT-5 adalah real-time router yang secara otomatis memilih cara terbaik menjawab cepat untuk pertanyaan ringan, atau berpikir lebih lama untuk masalah kompleks. GPT-5 juga membawa penurunan signifikan pada tingkat hallucination (informasi salah), menjadi hanya 4,8% dibanding GPT-4o yang 20,6%.
"Memiliki sesuatu seperti GPT-5 hampir tidak terbayangkan sebelumnya dalam sejarah," kata Sam Altman, CEO OpenAI, mengutip TechCrunch.
GPT-5 diklaim menjadi yang tercanggih di beberapa domain, sedikit mengungguli model kecerdasan buatan terkemuka dari Anthropic, Google DeepMind, dan xAI Elon Musk pada tolak ukur pertama.
OpenAI menyatakan GPT-5 menawarkan kinerja tingkat tinggi di bidang pengkodean. Altman mengatakan bahwa model ini khususnya unggul dalam menjalankan seluruh aplikasi peranti lunak sesuai permintaan, yang dikenal sebagai "vibe coding".
Pada uji coding SWE-bench, GPT-5 mendapatkan skor 74,9% pada pengujian pertamanya. Angka GPT-5 mengungguli model Claude Opus 4.1 dari Anthropic yang mendapatkan skor 74,5%, dan Gemini 2.5 Pro dari Google DeepMind yang mendapatkan skor 59,6%.
Kemudian, pada tes performa model AI di bidang matematika, humaniora, dan ilmu pengetahuan alam, GPT-5 dengan penalaran lanjutan (GPT-5 Pro) memperoleh skor 42%. Angka ini sedikit lebih rendah dibandingkan dengan xAI dan Grok 4 Heavy yang memperoleh skor 44,4%.
Dalam ujian pertanyaan sains tingkat PhD via GPQA Diamond, GPT-5 pro memperoleh skor 89,4% pada percobaan pertamanya. Angkanya mengungguli Claude Opus 4.1 yang memperoleh skor 80,9% dan Grok 4 Heavy yang memperoleh skor 88,9%.
"GPT-5 benar-benar merupakan pertama kalinya saya merasa salah satu model utama kami terasa seperti Anda dapat bertanya kepada pakar yang sah, pakar tingkat PhD, apa pun," ujar Altman.
OpenAI juga menguji kemampuan menjawab pertanyaan seputar kesehatan melalui HealthBench Hard Hallucinations. Hasilnya, tingkat informasi salah GPT-5 hanya berkisar 1,6%, jauh lebih rendah daripada GPT-4o (12,9%).
Alex Beutel, pemimpin penelitian keamanan di OpenAI, mengatakan bahwa dalam hal mengurangi penipuan tidak hanya meningkatkan keamanan GPT-5, tetapi juga pengalaman pengguna, menciptakan model yang lebih transparan dan jujur sehingga dapat dipercaya oleh pengguna.