1. Anasayfa
  2. Yapay Zeka

Taşınabilir aygıtlar için Google’dan yeni yapay zeka modeli: Gemma 3n


Google, taşınabilir aygıtlar için özel olarak tasarlanmış, kıymetli bir gelişmeyi temsil eden yeni yapay zeka modeli Gemma 3n’yi duyurdu. Geçen ay Google I/O’da ön izlemesi yapılan tam sürüm artık hazır ve donanımınızda direkt çalıştırılabiliyor. Google’ın kendi geliştirdiği Gemini’den farklı olarak, bu açık kaynaklı yapay zeka modeli, geliştiricilerin indirmesi ve üzerinde değişiklik yapması için sunuluyor.

Multimodal yetenekler ve optimizasyon
Gemma 3n, multimodal bir model olarak öne çıkıyor; yani imajlar, ses ve görüntü üzere çeşitli girdileri doğal olarak işleyebiliyor ve metin çıktıları üretebiliyor. Bu özellik, öncelikle metin tabanlı olan evvelki versiyonlara nazaran büyük bir güzelleşme sağlıyor. Model, 2 GB üzere düşük bir bellek kapasitesine sahip donanımlarda bile çalışabilecek formda aygıt içi kullanım için yüksek seviyede optimize edilmiştir.

Model, E2B ve E4B olmak üzere iki boyutta sunuluyor. Ham parametre sayıları sırasıyla 5B ve 8B olmasına karşın, mimari yenilikleri sayesinde klâsik 2B ve 4B modellerine kıyasla emsal bellek ayak izleriyle çalışabiliyorlar.

Çığır açan mimari ve performans
Gemma 3n’nin çığır açan taraflarından biri, hesaplama esnekliği sağlayan MatFormer mimarisi. Ayrıyeten bellek verimliliği için Katman Başına Gömme (PLE) ve taşınabilir kullanım senaryoları için optimize edilmiş yeni ses ve MobileNet-v5 tabanlı vizyon kodlayıcıları içeriyor. Bu yenilikler, çok dillilik (metin için 140, multimodal manaya için 35 lisan desteği), matematik, kodlama ve muhakeme dahil olmak üzere çeşitli alanlarda geliştirilmiş kaliteye katkıda bulunuyor. MatFormer mimarisi, daha büyük bir modelin içinde daha küçük, büsbütün fonksiyonel bir sürüm barındıran bir Rus Matruşka bebeğine benzetilerek, tek bir modelin farklı vazifeler için farklı boyutlarda çalışmasına imkan tanıyor.

Performans açısından, daha büyük olan E4B modeli, 10B parametrenin altındaki modeller ortasında 1300’ü aşan bir LMArena puanına ulaşan birinci model olmasıyla dikkat çekiyor. Ses yetenekleri ortasında, konuşmayı ince ayrıntılarla işleyen bir kodlayıcı kullanarak aygıt içi konuşmadan metne dönüştürme ve çeviri de bulunuyor. Görsel yetenekleri, Google Pixel aygıtlarda saniyede 60 kareye kadar görüntü işleyebilen, evvelki sürümüne nazaran değerli ölçüde daha süratli ve verimli olan yeni MobileNet-V5 kodlayıcı tarafından desteklenmekte.

Geliştiriciler, Gemma 3n’ye Hugging Face ve Kaggle üzere platformlar üzerinden yahut direkt Google AI Studio’dan erişebilir ve deneyebilirler.

  • 0
    alk_
    Alkış
  • 0
    sevdim
    Sevdim
  • 0
    _a_rd_m
    Şaşırdım
  • 0
    k_zd_m
    Kızdım

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir