KOMPAS.com - Dalam studi baru yang terbit Maret 2025 di basis data pracetak arXiv, para peneliti menemukan bahwa kecerdasan buatan (AI) dapat meyakinkan orang hingga mengira itu adalah manusia.
Hasil itu didapatkan ketika model bahasa besar (LLM) AI mengambil bagian dalam uji Turing tiga pihak, dan berhasil meyakinkan sebanyak 73 persen.
Dilansir dari laman Live Science, para peneliti menyebut LLM GPT-4.5 menjadi lebih baik dalam berpura-pura menjadi manusia, terutama setelah berhasil lulus uji Turing.
Baca juga: 10 Aplikasi Chatbot AI Ini Mengumpulkan Data Pengguna, Mana Terbanyak?
Uji Turing dilakukan dengan cara "interogator" manusia akan mengajukan pertanyaan kepada dua entitas yang tak terlihat, salah satunya manusia dan satunya komputer.
Dari berbagai pertanyaan dan jawaban, interogator akan memutuskan siapa yang manusia dan siapa yang bukan.
Komputer atau sistem AI dapat lulus ujian jika berhasil berpura-pura menjadi manusia dan meniru respons seperti manusia.
Baca juga: Bill Gates Prediksi Peran Dokter dan Guru Akan Diambil Alih AI 10 Tahun Lagi, Apa Katanya?
Sebelumnya studi lain telah melaporkan bahwa GPT-4 lulus uji Turing dua pihak. Namun, ini pertama kalinya LLM lulus konfigurasi yang lebih menantang dan asli dari "uji peniruan" ilmuwan komputer Alan Turing.
Hasilnya, LLM GPT-4 (dengan perintah persona) lulus uji Turing yang dinilai sebagai manusia secara signifikan "lebih" sering daripada manusia sebenarnya.
Ujian Turing tiga pihak melibatkan pertukaran pertanyaan dan jawaban selama lima menit secara bersamaan dengan manusia dan LLM yang dipilih.
Baca juga: OpenAI Luncurkan GPT-4o secara Gratis di ChatGPT, Apa Itu?
Manusia dan model AI akan mencoba meyakinkan para peserta bahwa mereka adalah manusia.
LLM AI diberi prompt untuk melaksanakan uji Turing dan meyakinkan interogator bahwa ia adalah manusia.
Setelah menganalisis 1.023 permainan dengan panjang rata-rata 8 pesan selama 4,2 menit, para peneliti menemukan LLM tersebut dapat paling meyakinkan peserta bahwa mereka adalah manusia.
Baca juga: Mengenal GPT Zero, Aplikasi yang Bisa Mendeteksi Tulisan Buatan AI
Sementara LLM AI yang tidak diberi prompt atau arahan persona memiliki performa yang jauh lebih buruk.
Gagasan utama dari pengujian Turing bukanlah tentang pembuktian bahwa mesin dapat berpikir, melainkan tentang apakah mesin dapat meniru manusia.
Namun, keterbatasan GPT-4 dalam pengujian ini adalah, LLM AI tersebut membutuhkan petunjuk dan persona untuk membantu mencapai hasil yang mengesankan.
Baca juga: DeepSeek Vs ChatGPT dalam Perspektif Hubungan Internasional