Magenta RealTime: Google’dan canlı müzik üreyen yapay zeka

Barış tarafından

25 Haziran 2025 10:38 27 kez okundu Okuma süresi: 2dk, 54sn

magenta realtime googledan canli muzik ureyen yapay zeka 0

Magenta RT, yaklaşık 190 bin saatlik stok enstrümantal müzik üzerinde eğitilmiş, 800 milyon parametreli otoregresif bir transformer modeli. Model şu anda fiyatsız Colab TPU’larında çalışıyor lakin ilerleyen devirde lokal aygıtlarda kullanılabilecek halde optimize edilmesi hedefleniyor.

Canlı ve etkileşimli müzik üretimi

Magenta RT, müzik üretimini gerçek vakitli hâle getirerek hem performans sırasında hem de yaratım sürecinde kullanıcıya tam denetim sağlıyor. Model, önceki ses çıktıları ve bir tarz vektörü üzerinden yeni ses blokları üretiyor. Bu yapı sayesinde kullanıcılar, farklı şekilleri, enstrümanları ve müzikal nitelikleri canlı olarak karıştırıp yine şekillendirebiliyor. Blok bazlı otoregresyon usulüyle çalışan model, sesleri 2 saniyelik kısımlar hâlinde ve gecikmesiz olarak üretiyor. Bu, bir performans esnasında yapay zekâ dayanaklı doğaçlamaların mümkün olabileceği manasına geliyor.

magenta realtime googledan canli muzik ureyen yapay zeka 1 kIunGzFZ

Magenta RT’nin en çarpıcı istikametlerinden biri de canlı müzik üretimini interaktif keşif alanına dönüştürmesi. Kullanıcılar, iki farklı şekil ortasında geçişler yapabiliyor, sıra dışı enstrüman kombinasyonlarını deneyebiliyor ya da kendi örneklerini kullanarak özgün ses dokuları oluşturabiliyor.

Açık kaynak yaklaşımı

Google’ın açıklamasına nazaran Magenta RT, sırf geliştiricilere değil, araştırmacılara, sanatkarlara ve yaratıcı kod müelliflerine da hitap ediyor. Kodlar GitHub’da, model yükleri ise Google Cloud Storage ve Hugging Face üzerinden, müsaadeli açık lisanslarla erişime açılmış durumda.

Öte yandan Magenta RealTime hâlâ araştırma kademesinde olan bir model olduğundan birtakım teknik ve içerik sınırlamaları bulunuyor. Model, yüklü olarak Batı enstrümantal müziği üzerinde eğitildiği için vokal performansları ve daha geniş kültürel müzik gelenekleri konusunda sonlu bir kapsama sahip. Bu nedenle daha çeşitli üslupları destekleyen gerçek vakitli üretimler için Lyria RealTime API öneriliyor. Ayrıyeten model şarkı kelamlarına dayalı bir eğitim almadığı için, söz üreten vokal performanslar yerine yalnızca hırıltı, mırıldanma üzere sesler üretebiliyor.

Gecikme süresi açısından bakıldığında, model iki saniyelik ses blokları hâlinde çalıştığı için kullanıcıdan gelen tarz komutlarının tesirinin duyulması birkaç saniye sürebiliyor. Son olarak, modelin ses sürece penceresi sadece on saniyelik bir geçmişi kapsayabiliyor. Bu, kısa melodiler, ritimler ve akor geçişleri üretmek için kâfi olsa da, uzun soluklu müzik yapıları oluşturmak için kâfi değil.

Okunma: 27

0

Harika
0

Beğenmedim
0

Bayıldım
0

Üzgünüm
0

Şaşkınım

Magenta RealTime: Google’dan canlı müzik üreyen yapay zeka

Bültenimize Katılın

Yorum Yap

Önerilen Yazılar