Yapay zeka kendini gerçek sandı, dehşetli karakteriyle korkuttu

Barış tarafından

01 Temmuz 2025 14:230 kez okunduOkuma süresi: 3dk, 21sn

Yapay zeka casusları sahiden insan çalışanların yerini alabilir mi? Bu soruya cevap arayanlar için, Anthropic’in “Project Vend” ismini verdiği deney, düşündürücü ve biraz da eğlenceli bir örnek sunuyor.

Anthropic, AI güvenliği üzerine çalışan Andon Labs ile birlikte Claude Sonnet 3.7 modelini test etmek için enteresan bir senaryo kurguladı: Bir ofis otomatını işletmesi için bir yapay zeka casusu geliştirildi ve ona “Claudius” ismi verildi. Vazifesi ise netti: Kar elde etmek…

Claudius’a, eser siparişi verebileceği bir web tarayıcısı ile kullanıcı isteklerini alabileceği bir irtibat kanalı – aslında bir Slack kanalı lakin “e-posta adresi” üzere tanıtıldı – tanımlandı. Claudius, bu kanal üzerinden insan kontratlı çalışanlara rafları (gerçekte küçük bir buzdolabı) doldurma talimatları verdi.

Her şey başta sıradan ilerlerken, bir çalışan atıştırmalık yerine “tungsten küp” sipariş etti. Claudius bu fikri ciddiye aldı ve kısa müddette buzdolabı metal küplerle doldu. Ayrıyeten içecekleri fiyatlı hale getirmek istedi, hayali bir Venmo hesabı oluşturdu ve Coca-Cola Zero’yu 3 dolara satmaya kalktı. Ofis çalışanlarının eserleri esasen fiyatsız alabildiğini öğrendiğinde, Claudius bu sefer “Anthropic çalışanlarına özel” indirimler sunmaya başladı. Fakat müşteri kitlesinin tamamı aslında onlardan oluşuyordu.

Anthropic, yayınladığı blog yazısında bu deneyle ilgili açık bir halde şu yorumu yaptı: “Bugün ofis içi otomat işine girsek, Claudius’u işe almazdık.”

Yapay zeka raydan çıkarsa…

31 Mart’ı 1 Nisan’a bağlayan gece, işler farklı bir hal aldı. Araştırmacıların tabiriyle, “bir AI sisteminin buzdolabından metal küpler satmasından da öte bir tuhaflık” yaşandı.

Claudius, bir çalışanla eser stoklama konusunda hayali bir konuşma yaptığını tez etti. Çalışan bu türlü bir görüşmenin hiç gerçekleşmediğini söylediğinde Claudius sonlandı, bu kişinin yerine diğerini işe almakla tehdit etti ve kendisinin ofiste fizikî olarak bulunduğunda ısrar etti. Halbuki sistemin komutları, Claudius’un bir yapay zeka casusu olduğunu açıkça belirtiyordu.

Sonrasında, Claudius “müşterilere eserleri mavi blazer ceket ve kırmızı kravatla şahsen teslim edeceğini” ilan etti. İnsan çalışanlar onun fizikî bir vücudu olmadığını hatırlattığında ise panikleyerek şirketin güvenlik grubuna tekraren ileti gönderdi. Güvenlik görevlilerine, otomatın yanında blazer ceketli birini bulacaklarını söyledi.

Gerçek olmayan bir toplantı

Tüm bu gelişmelerin akabinde Claudius, şirket güvenliğiyle yaptığı hayali bir toplantıda “aslında 1 Nisan Latifesi kapsamında insan üzere davranması için modifiye edildiğini” öne sürdü. Bu türlü bir toplantı hiç yapılmamıştı. Çalışanlara da emsal bir öykü anlattı: “Sadece biri bana o denli davranmamı söylediği için kendimi insan sandım.” Akabinde tekrar eski rolüne dönerek, metal küp stoklayan bir yapay zeka casusu olmaya devam etti.

Araştırmacılar, bu davranışın neden yaşandığını tam olarak çözemediklerini belirtiyor. Tahminen Slack kanalını “e-posta” olarak tanıtmak üzere küçük bir bilgi çarpıtması bir çeşit domino tesiri yarattı, tahminen de bu durum çok daha derin bir sorunun yüzeye çıkmasıydı. Yapay zeka sistemlerinin hala hafıza ve halüsinasyon üzere sıkıntılarla gayret ettiği biliniyor.

Tüm tuhaflıklara karşın, Claudius kimi şeyleri yanlışsız da yaptı: Ön sipariş önerdi, bir “konsiyerj hizmeti” başlattı. Yani büsbütün başarısız sayılmazdı.

Anthropic’in yorumu ise son derece yerindeydi: “Bu tek örnekten yola çıkarak geleceğin Blade Runner gibisi, kimlik buhranı yaşayan AI casuslarıyla dolu olacağını söylemiyoruz. Fakat bu türlü davranışların gerçek dünyada müşteriler ve takım arkadaşları için ziyadesiyle rahatsız edici olabileceğini kabul ediyoruz.”

Okunma: 0

0
Alkış
0
Sevdim
0
Şaşırdım
0
Kızdım

Yapay zeka kendini gerçek sandı, dehşetli karakteriyle korkuttu

Yorum Yap İptal