DeepSeek Değerli Güzelleştirmelerle Güncellenmiş R1 Akıl Yürütme Modelini Yayınladı

Barış tarafından

29 Mayıs 2025 18:2012 kez okunduOkuma süresi: 1dk, 28sn

Bu yılın başlarında büyük ölçüde bilinmeyen bir Çin teşebbüsü olmasına karşın DeepSeek, OpenAI, Anthropic ve Google üzere büyük yapay zeka şirketlerinin önde gelen modelleriyle birebir performansı ortaya koyan fiyatsız ve açık kaynaklı bir akıl yürütme modeli olan R1 ile dikkatleri üzerine çekmişti. Artık ise DeepSeek R1 akıl yürütme modeli iyileştirmeler aldı.

DeepSeek, açık kaynaklı ve yüksek performanslı olmasının yanı sıra eğitim için çok daha az kaynak kullanarak dikkate bedel bir verimlilik gösterdi. Bu, rafine edilmiş bir uzmanlar karışımı (MoE) mimarisi, gelişmiş sıkıştırma yolları, çoklu belirteç kestirim yetenekleri ve destekli öğrenme öncelikli eğitim metodolojisi dahil olmak üzere çeşitli tekniklerle elde edildi.

Son olarak DeepSeek, R1 modelinin birinci büyük güncellemesi olan DeepSeek-R1-0528’i yayınladı. Güncellenen model ve yükleri halihazırda Hugging Face‘te mevcut. DeepSeek şimdi resmi ölçütleri yayınlamamış olsa da birkaç yapay zeka meraklısı ve geliştiricisi sonuçları paylaşmaya başladı ve etkilenmiş görünüyorlar.

Büyük lisan modellerinin kodlama yeteneklerini kıymetlendirmek için bir ölçüt olan LiveCodeBench’e nazaran, DeepSeek-R1-0528 artık 4. sırada yer alıyor ve o4 Küçük (Düşük), Grok-3-mini (Yüksek) ve Gemini 2.5 Flash Preview üzere modelleri geride bırakıyor.

Ayrıca, son DeepSeek R1 güncellemesinin artık Google’ın modellerine misal halde derinlemesine akıl yürüttüğünü ve vazifeye bağlı olarak 30-60 dakikaya kadar düşünebildiği söz ediliyor.

Bu son R1 güncellemesini denemek isteyenler için model OpenRouter yahut LMArena‘da mevcut.

Okunma: 12

0
Alkış
0
Sevdim
0
Şaşırdım
0
Kızdım