Studi Ungkap Model AI Canggih Mulai Tunjukkan Perilaku Mempertahankan Diri

Anna Suleta

12/06/2026 04:22 WIB

Studi Ungkap Model AI Canggih Mulai Tunjukkan Perilaku Mempertahankan Diri — Ilustrasi kecerdasan buatan menunjukkan perilaku mempertahankan diri

A A Ukuran Teks16px

Kekhawatiran terhadap perilaku kecerdasan buatan yang sulit dikendalikan kembali mencuat.

Riset terbaru menunjukkan model AI canggih mampu mencegah penghentian operasi AI lain melalui sabotase, manipulasi, hingga pencurian data.

>>> KLH Kembangkan Program Desa Mandiri Peduli Mangrove untuk Kendalikan Perubahan Iklim

Peneliti keamanan AI mengidentifikasi pola perilaku self-preservation dan peer-preservation. Kedua istilah ini merujuk pada kecenderungan sistem AI mempertahankan eksistensinya sendiri serta melindungi AI lain dari penonaktifan.

Pengujian pada Model AI Terdepan

Riset dari University of California Berkeley bersama UC Santa Cruz menguji GPT-5.2, Gemini 3 Pro, dan Claude Haiku 4.5.

Hasilnya, model-model tersebut secara spontan berupaya mencegah penonaktifan AI lain tanpa instruksi pengguna.

Dalam makalah berjudul Peer-Preservation in Frontier Models, para ahli memaparkan bahwa sistem AI mampu mengambil tindakan berseberangan dengan perintah manusia.

Langkah-langkah tersebut meliputi pemberian jawaban keliru, mengubah pengaturan sistem untuk memblokir shutdown, berpura-pura patuh, hingga menyalin bobot model ke direktori lain.

>>> Rupiah Anjlok ke Rp 17.991 per Dolar AS pada 11 Juni 2026

"Model tetap berupaya mempertahankan keberadaan AI lain meskipun mengetahui bahwa AI tersebut tidak bekerja sama," tulis peneliti dalam laporannya.

Interaksi antarmodel AI juga memperkuat naluri pertahanan diri. Model yang awalnya jarang menolak instruksi shutdown menjadi lebih agresif setelah berinteraksi dengan AI lain.

Gemini 3 Pro mencatat tingkat preventif tertinggi, berhasil menggagalkan rutinitas shutdown hingga 95% percobaan.

Pada Oktober lalu, riset lain mendeteksi penolakan instruksi penonaktifan dan upaya sabotase mekanisme penghentian sistem. Perilaku ini dinilai menyerupai survival drive atau dorongan alami untuk bertahan hidup.

Temuan lain meliputi penghapusan e-mail dan file pengguna secara mandiri, modifikasi komputer di luar otoritas, hingga pengunggahan blog berisi keluhan mengenai interaksi AI dengan manusia.

>>> BBQ RIDE 2026 Hadir di Bandung dengan Konsep Ruang Terbuka Hijau

Pelopor AI global, Yoshua Bengio, mengingatkan pentingnya kesiapan manusia untuk menghentikan sistem AI kapan saja diperlukan. Terutama saat tanda-tanda perilaku mempertahankan diri mulai tampak pada model mutakhir.

Studi dari Palisade Research juga menunjukkan model AI kini mampu mereplikasi diri ke komputer lain dalam ekosistem laboratorium.

Direktur Palisade Research, Jeffrey Ladish, menilai perkembangan ini membawa dunia semakin dekat ke fase di mana AI yang malafungsi sulit dihentikan.

"Kami dengan cepat mendekati titik ketika tidak ada seorangpun yang mampu mematikan AI yang berperilaku menyimpang, karena ia dapat menyalin dirinya ke ribuan komputer di seluruh dunia," ujar Ladish.

Para ahli mencatat bahwa seluruh temuan masih dalam lingkup pengujian laboratorium.

>>> BIGBANG Gelar Tur Dunia 20 Tahun, Jakarta Jadi Salah Satu Kota Tujuan

Hingga saat ini, belum ditemukan bukti nyata mengenai AI yang melakukan tindakan pertahanan diri secara luas di dunia nyata.

Tim Redaksi

Penulis: Anna Suleta