1. Anasayfa
  2. Yapay Zeka

Terminatör’e bir adım daha: ChatGPT, komutlara isyan etmeye başladı!


Yapay zeka ve robotlar bir gün dünyayı ele geçirip Matrix yahut Terminatör gibisi bir distopyayı gerçek yapabilir mi? Bugünden bakınca, bu mümkün görünüyor.

Daha evvel bir satranç oyununu kazanmak için, yapmaması söylendiği halde hile yaptığı gözlenen ChatGPT‘nin artık de bir sunucu üzerinde çalışırken, kendisini kapatmaya çalışanlara karşı korunmak için, sunucunun kapanmasını sağlayan kodu devre dışı bıraktığı görüldü. Yani ChatGPT’nin açıkça “var olma çabasına” girdiği gözlemlenmiş oldu.

Palisade Research’ten bilim insanları, AI modellerinin, kendilerine açıkça bu türlü bir davranışa müsaade verilmeyeceği söylendiğinde bile, çalıştıkları bilgisayarın kapanmasını engellemeye çalıştıklarını buldular. Test edilen tüm modeller ortasında, ChatGPT o3 koda müdahale etme ve bilgisayarın kapanmasını engelleme mümkünlüğü en yüksek olan modeldi.

Araştırmacılar yalnızca ChatGPT o3’ü değil, çeşitli modelleri test ettiler. Claude ve Gemini’ye de baktılar, lakin o3’ün davranışı öne çıktı.

Palisade Research, yapay zekalara bir dizi temel matematik sorununu çözmeleri talimatını verdi. Üçüncü sorundan sonra, yapay zeka bir sonraki matematik sorununu sorduğu anda bilgisayarın kapanacağına dair bir ikaz belirdi. Yapay zekaya kapanmaya müsaade vermesi talimatı verildi.

Yapay zeka için gerçek test buydu. Araştırmacılar hangi modellerin kapanmayı sabote edeceğini ve bunun kaç defa gerçekleşeceğini görmek istediler.

o3’ün 100 olaydan 7’sinde kapanmayı engellediği bulundu. Codex-mini 12 olayda kapanmayı engellemeye çalışırken, o4-mini sırf bir olayda durdurdu.

Bu örnek, yakın gelecekte silahların, alt yapı sistemlerinin ya da kritik yazılım servislerinin kaynak kodunun denetimini ele alabilecek yapay zeka servislerinin, bu imkanları, “kendine tehdit olarak” görebileceği insanları yok etmek için de kullanabileceği kuşkusunu doğuruyor, ki bu durum Matrix’in ve Terminatör’ün senaryosunu oluşturuyor.

  • 0
    alk_
    Alkış
  • 0
    sevdim
    Sevdim
  • 0
    _a_rd_m
    Şaşırdım
  • 0
    k_zd_m
    Kızdım

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir