1. Anasayfa
  2. Yapay Zeka

Google’ın yapay zekası, beşerlerle tıpkı kurallarda yarıştı ve kazandı


Her yıl dünyanın en zeki gençlerini bir ortaya getiren Milletlerarası Matematik Olimpiyatları (IMO), bu yıl bir prensip sahne oldu. Google DeepMind’ın geliştirdiği yapay zekâ modeli Gemini Deep Think, müsabakaya insan iştirakçilerle tıpkı kurallar altında katıldı ve altın madalya kazandı. Bu başarıyı, OpenAI üzere firmaların daha esnek kıymetlendirme usulleriyle değil, IMO’nun resmi kurallarına sadık kalarak elde etti.

Yeni jenerasyon yapay zeka: Deep Think

Geçtiğimiz yıl AlphaProof ve AlphaGeometry 2 ile yarışa katılan DeepMind, bu yıl yeni bir modelle geldi: Gemini Deep Think. Bu model, klasik doğrusal fikir sistemleri yerine, birebir anda birden fazla akıl yürütme yolunu tahlil edip, en mantıklı olanı seçebilen paralel niyet sistemiyle dikkat çekiyor.

DeepMind grubuna nazaran bu, evvelki kuşak modellere nazaran büyük bir paradigma değişimi. Artık bir uzmanın soruyu özel matematiksel lisana çevirmesine gerek kalmadan, model doğal lisanla verilen sorunu anlayıp çözebiliyor.

Matematiksel düşünmede yeni bir seviye

Geçmişte LLM’lerin (büyük lisan modellerinin) matematikte başarılı olabilmesi için çoklukla yalnızca gerçek karşılığa ulaşmaları kafiydi. Lakin IMO üzere müsabakalarda değerli olan sadece sonuç değil, o sonuca nasıl ulaşıldığını adım adım göstermek. Google, bu zorluğu aşmak için modelini uzun, açıklamalı tahliller üretmeye odaklı yeni pekiştirmeli öğrenme teknikleriyle eğitti.

DeepMind kıdemli bilim insanı Thang Luong, bu teknikle sağlam ve dengeli düşünme yolları geliştirdiklerini vurguluyor.

Yarışma gerçek koşullar altında gerçekleşti

Deep Think, tıpkı insan yarışmacılar üzere, sorunları doğal lisanda aldı ve tahlilleri tekrar doğal lisanla sundu. Üstelik, her yarışmacıya tanınan 4,5 saatlik mühlet içinde çalıştı. Bu istikametiyle, daha evvel Gemini uygulamasında gördüğümüz süratli lakin yüzeysel cevapların tersine, çok daha derinlikli bir tahlil süreci işletildi.

İleri eğitim ve akıllı çözümler

DeepMind araştırmacılarının dikkat çektiği bir öteki nokta ise, modelin sırf yanlışsız karşılığı bulması değil, tahlil sürecinde gösterdiği “zekice yaklaşımlar.” Örneğin, iştirakçilerin birden fazla bir soruda ileri seviye bir matematik teoremini kullanırken, Deep Think tıpkı sonuca temel sayı teorisiyle ulaşmayı başardı. Brown Üniversitesi’nden araştırmacı Junehyuk Jung’a nazaran, bu müşahede modelin derin içgörü yeteneğini ortaya koyuyor.

Tek yanlış, en sıkıntı soru

Deep Think yalnızca bir soruda başarısız oldu. Bu soruda model yanlış bir varsayımla yola çıktı ve tahlil yolu baştan kusurlu oldu. Lakin bu soruyu tüm yarışmacılar ortasında sırf beş kişi yanlışsız yanıtladı. Yani model, en kuvvetli soruda bile rekabetçi bir seviyedeydi.

Değerlendirme gerçek IMO kurallarına nazaran yapıldı

Google, Deep Think’in değerlendirmesinin IMO tertibi tarafından, resmi prosedürlere uygun biçimde yapıldığını belirtiyor. Bu, OpenAI’nin yaklaşımından farklı. OpenAI ise değerlendirmeyi eski IMO iştirakçilerinden oluşan bir heyetle gerçekleştirmişti. Google’a nazaran bu, sonucu direkt etkileyebilir.

Gelecekte ne var?

Şu an Deep Think’in özel sürümü, sağlam test uzmanları tarafından deneniyor. Modelin, aylık 250 dolar ödeyen Google AI Ultra abonelerine sunulması planlanıyor. DeepMind ise önümüzdeki yıl daha da gelişmiş bir sürümle yarışa dönmeyi ve tam puan hedeflemeyi amaçlıyor.

  • 0
    alk_
    Alkış
  • 0
    sevdim
    Sevdim
  • 0
    _a_rd_m
    Şaşırdım
  • 0
    k_zd_m
    Kızdım

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir