
Uluslararası Matematik Olimpiyatları’nda iştirakçilerden cebir, kombinatorik, geometri gibi altı farklı alanda son derece karmaşık sorunları dört buçuk saat içinde çözmeleri isteniyor. Hem OpenAI’ın hem de Google DeepMind’ın yapay zekası bu altı sorudan beşini hakikat çözerek 42 üzerinden 35 puan almayı başardı.
Tarihsel olarak baktığımızda, bu müsabakaya katılan genç matematikçiler ortasında altın madalya düzeyine ulaşanların oranı yüzde 8’i geçmiyor. Pek az insanın ulaşabildiği bu düzeye artık iki yapay zekanın birden ulaşmış olması, yapay zekaların insan zekasının ötesine geçmeye ne kadar yaklaştığını gözler önüne seriyor.
Google DeepMind, Geçtiğimiz Yıl Gümüş Madalya ile Yetinmişti
Google DeepMind, geçtiğimiz yıl da Gemini’in en gelişmiş versiyonuyla bu yarışa katılmış lakin gümüş madalya ile yetinmişti. Gemini’ın bu sefer altın madalya düzeyine ulaşması, bu alanda yaşanan ilerlemeyi daha somut bir tabana oturtuyor.
Gemini’nin bu başarısı, klasik tek istikametli muhakeme yerine “paralel düşünme” (parallel thinking) yaklaşımına dayanan yeni bir mimariyle mümkün oldu. Bu sistemde model, tek bir akıl yürütme zincirini takip etmek yerine, tıpkı matematiksel sorunu çözmek için birden fazla mantıksal yol oluşturarak bu yolları eş vakitli olarak pahalandırıyor. Her tahlil kısmı, kendi içinde bir tıp bağımsız hipotez üretiyor ve sistem, bu hipotezleri çapraz denetim ederek en dengeli ve sağlam tahlil yolunu seçiyor. Gemini Deep Think adı verilen bu özel sürümde kullanılan tekniklerden biri de “spekülatif akıl yürütme modülleri” (speculative reasoning modules). Bu modüller, tahlil sürecinde makul adımlarda alternatif ispat yolları üreterek modelin sadece gerçek yanıtı bulmasına değil, birebir vakitte matematiksel ispat üretmesinde de doğruluğu artırmasına yardımcı oluyor.
Ayrıca model, doğal lisan girdilerini direkt sembolik mantık yapılarına çevirebilen yeni bir dönüştürücü sistem kullanıyor. Bu sayede sorun tarifi ile tahlil ortasındaki bağ daha şeffaf hâle geliyor. Gemini’nin bu versiyonu, evvelki sistemlerdeki üzere soruların programlama lisanlarına çevrilmesine gereksinim duymadan, sadece metinsel açıklamayı kullanarak adım adım ispat oluşturabiliyor. DeepMind araştırmacılarına nazaran bu, modelin büsbütün uçtan uca bir biçimde çalıştığını ve sonuçları yorumlamak için dış müdahaleye muhtaçlık duymadığını gösteriyor.
Yarışma heyeti, Gemini’ın tahlillerini değerlendirirken bilhassa modelin sunduğu ispatların açıklık, mantıksal bütünlük ve insan matematikçilerin yaklaşımına yakınlığı açısından “dikkat cazibeli derecede güçlü” olduğunu belirtiyor. O denli ki birtakım tahliller heyet üyeleri tarafından “insan tarafından yazılmış sanılabilecek düzeyde” halinde yorumlandı.
OpenAI Bu Yarışa Şimdi Kamuya Açılmayan Bir Modelle Katıldı

Bu modellerin kısa vadede son kullanıcıya ulaşması beklenmiyor. OpenAI CEO’su Sam Altman, bu düzeydeki muhakeme kabiliyetinin şimdilik yalnızca araştırma hedefli kullanılacağını ve GPT serisi modellerin bu yetenek düzeyine bir müddet daha ulaşamayacağını belirtiyor.
Yapay zekaların şimdiye kadar zorlandıkları, yaratıcılık gerektiren, açık uçlu ve çok adımlı sorunları artık yüksek muvaffakiyet oranıyla çözebiliyor olmaları, yeni bir periyoda giridiğini gösteriyor. Zira yapay zekalar artık salt bilgi sürecin ötesine geçip daha soyut ve yaratıcı muhakemeler yapabilecek düzeye ulaşmış durumda.