1. Anasayfa
  2. Teknoloji Haberleri

DeepSeek Değerli Güzelleştirmelerle Güncellenmiş R1 Akıl Yürütme Modelini Yayınladı


Bu yılın başlarında büyük ölçüde bilinmeyen bir Çin teşebbüsü olmasına karşın DeepSeek, OpenAI, Anthropic ve Google üzere büyük yapay zeka şirketlerinin önde gelen modelleriyle birebir performansı ortaya koyan fiyatsız ve açık kaynaklı bir akıl yürütme modeli olan R1 ile dikkatleri üzerine çekmişti. Artık ise DeepSeek R1 akıl yürütme modeli iyileştirmeler aldı.

DeepSeek, açık kaynaklı ve yüksek performanslı olmasının yanı sıra eğitim için çok daha az kaynak kullanarak dikkate bedel bir verimlilik gösterdi. Bu, rafine edilmiş bir uzmanlar karışımı (MoE) mimarisi, gelişmiş sıkıştırma yolları, çoklu belirteç kestirim yetenekleri ve destekli öğrenme öncelikli eğitim metodolojisi dahil olmak üzere çeşitli tekniklerle elde edildi.

Son olarak DeepSeek, R1 modelinin birinci büyük güncellemesi olan DeepSeek-R1-0528’i yayınladı. Güncellenen model ve yükleri halihazırda Hugging Face‘te mevcut. DeepSeek şimdi resmi ölçütleri yayınlamamış olsa da birkaç yapay zeka meraklısı ve geliştiricisi sonuçları paylaşmaya başladı ve etkilenmiş görünüyorlar.

Büyük lisan modellerinin kodlama yeteneklerini kıymetlendirmek için bir ölçüt olan LiveCodeBench’e nazaran, DeepSeek-R1-0528 artık 4. sırada yer alıyor ve o4 Küçük (Düşük), Grok-3-mini (Yüksek) ve Gemini 2.5 Flash Preview üzere modelleri geride bırakıyor.

Ayrıca, son DeepSeek R1 güncellemesinin artık Google’ın modellerine misal halde derinlemesine akıl yürüttüğünü ve vazifeye bağlı olarak 30-60 dakikaya kadar düşünebildiği söz ediliyor.

Bu son R1 güncellemesini denemek isteyenler için model OpenRouter yahut LMArena‘da mevcut.

  • 0
    alk_
    Alkış
  • 0
    sevdim
    Sevdim
  • 0
    _a_rd_m
    Şaşırdım
  • 0
    k_zd_m
    Kızdım

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir