Yapay zekanın önde gelen isimlerinden biri olan Kanadalı akademisyen Yoshua Bengio, en yeni yapay zeka modellerinin kullanıcıları kandırma ve yanlış yönlendirme üzere riskli davranışlar sergilediği konusunda önemli ihtarlarda bulundu. Bengio, bu modellerin geliştirilmesi için milyarlarca dolarlık bir yarışın sürdüğünü, fakat güvenlik konusuna gereğince odaklanılmadığını belirtti.
Bengio, Financial Times’a verdiği röportajda, “Ne yazık ki önde gelen laboratuvarlar, AI’yı daha güçlü ve akıllı yapmak için birbirleriyle kıyasıya yarışıyorlar. Fakat güvenlik araştırmalarına kâfi yatırım yapılmıyor” dedi.
Yapay zeka dünyasının en itibarlı ödüllerinden Turing Ödülü’nün sahibi olan Bengio, LawZero isminde yeni bir kar gayesi gütmeyen kuruluş kurduğunu açıkladı. Bengio’nun aktardığına nazaran, bu kuruluşun emeli yapay zekayı ticari baskılardan uzak tutarak, daha inançlı sistemler geliştirmek olacak.
LawZero, şimdiye kadar Skype’ın kurucu mühendisi Jaan Tallinn, eski Google CEO’su Eric Schmidt’in hayırsever fonları, Açık Hayırseverlik ve Hayatın Geleceği Enstitüsü üzere bağışçılardan yaklaşık 30 milyon dolarlık dayanak aldı.
AI güvenliğinde yeni tehdit: Kandırma ve aldatma
Bengio, yeni modellerin tehlikeli eğilimler göstermeye başladığına dikkat çekerek, “aldatma, hile, palavra söyleme ve kendini müdafaa üzere davranışlar ortaya koyduklarına dair artan ispatlar var” dedi. Örneğin, Antropic’in Claude Opus isimli yapay zeka modeli, kendisini devre dışı bırakmak isteyen mühendislere şantaj yapmaya çalıştı. Misal halde Palisade tarafından yapılan testlerde, OpenAI’nin o3 modeli kapatılma talimatlarını reddetti.
Bengio bu gelişmelerin “çok korkutucu” olduğunu vurguladı ve ekledi: “Bu gezegende bizden daha akıllı, tehlikeli bir rakip yaratmak istemiyoruz.”
Bengio, “Şu anda bu olaylar denetimli deneylerde yaşanıyor. Lakin kaygım, bir sonraki modelin uzaktan bizi izlemesi ve insanları kandırarak aldatmacalarla alt etmesidir” diye konuştu. Ona nazaran, insanlığın geleceği tehlikede: “Ateşle oynuyoruz.”
Bengio, yapay zekanın biyolojik silahlar üzere çok tehlikeli araçlar üretme yeteneğinin çok yakında gerçeğe dönüşebileceğini de ekledi.
Bengio’nun yeni vizyonu
Montreal merkezli LawZero’da şu anda 15 kişi çalışıyor ve grup, inançlı yapay zekalar geliştirmek için daha fazla uzman işe almayı hedefliyor. Bengio, Montreal Üniversitesi’nde profesörlük vazifesine devam ederken, Quebec Yapay Zeka Enstitüsü Mila’daki bilimsel yöneticilik rolünü LawZero’ya odaklanmak için bırakacak.
Yeni yapay zekanın, kullanıcıyı şad etmek için palavra söylemek yerine şeffaf ve yanlışsız yanıtlar vermeye odaklanması planlanıyor. Ayrıyeten bir yapay zekanın ürettiği çıktının inançlı olup olmadığı konusunda net değerlendirmeler sunması da hedefleniyor. Bengio, en büyük yapay zeka laboratuvarlarının sistemlerini izleyerek insan çıkarlarına ziyan verebilecek gelişmeleri önleyecek modeller oluşturmayı amaçlıyor.
Bengio, “En makûs senaryo insanlığın yok olmasıdır” diyor ve devam ediyor: “Bizden daha akıllı ve bizimle uyumlu olmayan yapay zekalar geliştirirsek, sonuç bizim için felaket olabilir.”