1. Anasayfa
  2. Yapay Zeka

ChatGPT’ye yeni güç: Web’de gezinip sunum hazırlama aracı periyodu başladı


OpenAI, halihazırda sunduğu iki temsilci modelini bir adım öteye taşıyarak, Operatör ve Derin Araştırma casuslarının yeteneklerini ChatGPT’nin konuşma marifetleriyle birleştiren yesyeni bir aracı tanıttı. Bu yeni ChatGPT ortacısı, web üzerinde gezinebilme, derinlemesine tahlil yapabilme ve doğal sohbet kurabilme özelliklerini birebir çatı altında buluşturuyor.

Kendi bilgisayarında gerçek misyonları tamamlayabiliyor

Yeni ChatGPT ortacısı artık kendi sanal bilgisayar ortamında çalışabiliyor. Bu sayede kullanıcıdan gelen talepler doğrultusunda:

  • Web sitelerinde gezinebiliyor,

  • Sonuçları tahlil edip filtreleyebiliyor,

  • Gerekirse kullanıcıdan oturum açmasını isteyebiliyor,

  • Kod yazabiliyor ve çalıştırabiliyor,

  • Elektronik tablolar, PowerPoint sunumları oluşturabiliyor,

  • Ve çok daha fazlasını gerçekleştirebiliyor.

Kullanabileceği araçlar

ChatGPT ortacısı, verilen vazifeleri yerine getirebilmek için şu bileşenlere erişim sağlayabiliyor:

  • Görsel kullanıcı arayüzüne sahip bir web tarayıcısı

  • Daha kolay sorgular için metin tabanlı tarayıcı

  • Komut satırı (terminal)

  • API’lerle direkt bağlantı

  • ChatGPT konnektörleri aracılığıyla uygulamalarla entegrasyon

Görevler ortası geçişte kusursuz entegrasyon

Aracı, tüm süreçleri kendi sanal bilgisayarı üzerinden gerçekleştirdiği için bağlamı daima koruyabiliyor. Örneğin, bir web sitesinden evrak indirip bu belgeyi terminal üzerinden düzenledikten sonra, elde ettiği çıktıyı tekrar görsel tarayıcıda görüntüleyebiliyor. Bu da adım adım ilerleyen karmaşık misyonlarda yüksek doğruluk ve tutarlılık sağlıyor.

Performans değerlendirmeleri: Sonları zorluyor

OpenAI, yeni aracı modelinin gerçek dünya misyonlarında üst seviye muvaffakiyet gösterdiğini belirtiyor. İşte birtakım dikkat alımlı kıymetlendirme sonuçları:

HumanEval: Yeni aracının pass@1 skoru 41,6; çoklu denemelerde bu skor 44,4’e çıkıyor.

SınırMath: %27,4 doğruluk oranı yakalıyor.

DSBench: Data bilimi misyonlarında insan düzeyini kıymetli ölçüde aşıyor.

SpreadsheetBench: ChatGPT ortacısı %45,5 muvaffakiyet gösterirken, Microsoft Excel Copilot %20,0’de kalıyor.

BrowseComp: %68,9 ile yeni bir rekor (SOTA) kırıyor.

WebArena: %65,4 skor ile güçlü performans sergiliyor.

OpenAI’nin dahili ekonomik vazife testleri: Aracının çıktısı, testlerin yaklaşık yarısında beşerle eşit ya da daha âlâ.

Yeni aracı modu kullanıma açılıyor

Yeni “aracı modu”, artık ChatGPT araçları menüsünde yer alıyor. Kullanıcılar, aracının vazifesini nasıl gerçekleştirdiğini ekrandan takip edebiliyor; gerektiğinde ortaya girerek süreci durdurabiliyor yahut yönlendirebiliyor.

Bu güçlü temsilci şu anda:

  • Tüm ChatGPT Pro kullanıcılarına gün sonuna kadar,

  • ChatGPT Plus ve Team kullanıcılarına önümüzdeki birkaç gün,

  • Kurumsal (Enterprise) ve Eğitim (Education) kullanıcılarına ise önümüzdeki haftalar içinde sunulacak.

Ayrıca:

  • Pro kullanıcılar ayda 400 vazife bildirisi hakkına sahipken,

  • Diğer fiyatlı kullanıcılar ayda 40 iletilik kullanım ile hudutlu.

  • İhtiyaca nazaran kredi tabanlı esnek planlar üzerinden ek kullanım satın alınabiliyor.

  • 0
    alk_
    Alkış
  • 0
    sevdim
    Sevdim
  • 0
    _a_rd_m
    Şaşırdım
  • 0
    k_zd_m
    Kızdım

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir