Sosyal medya, Meta’nın Llama 3’ün başarısıyla (Temmuz ayında daha büyük bir modelin gelmesiyle) ve yapay zeka laboratuvarı tarafından paylaşılan, 22 sayısını gösteren esrarengiz bir dizi görüntü ile tetiklenen söylentilerle çalkalanıyor.
22 Nisan, OpenAI CEO’su Sam Altman’ın doğum günü olduğu için – 39 yaşında – söylenti şirketin Sora veya çok beklenen GPT-5 gibi büyük bir şey duyuracağını öne sürüyor.
Eğer bahsi geçen sonuncusu olursa ve büyük bir yeni yapay zeka modeli alırsak, Altman’ın daha önce “önemli ölçüde daha iyi” olacağını ve insanları şaşırtacağını ilan ettiği bir an olacak.
Ben şahsen, muhtemelen GPT-4.5 veya hatta OpenAI’nin görüntü üretim modeli DALL-E için yeni bir güncelleme gibi bir şey olacağını düşünüyorum, ancak her ihtimale karşı GPT-5 ile ilgili bildiklerimizi paylaşayım.
GPT-5 hakkında ne biliyoruz?
GPT-5 hakkında çok az şey biliyoruz çünkü OpenAI, sonraki nesil modelinin performansı ve işlevselliği hakkında genellikle konuşmamayı tercih ediyor. Altman’ın bu deklarasyonu röportajlarda defalarca yaptığı için “önemli ölçüde daha iyi” olacağını biliyoruz.
OpenAI’den her yeni büyük dil modeli, önceki nesile göre akıl yürütme, kodlama, bilgi ve konuşma alanlarında önemli bir iyileşme sunar. GPT-5 de farklı olmayacak.
GPT-4’ten bu yana eğitimde veya 1.5 trilyon parametreden önemli ölçüde daha fazlasına sahip olacak ya da benzer bir sayıya sahip olacak ancak genel model boyutunu artırmadan önemli bir performans artışına izin verecek daha güçlü bir alt yapıya sahip olacak.
Bunun Meta’nın Llama 3 70B gibi diğerlerinden gördüğümüz bir şey olduğunu gördük, bu model GPT-3.5 gibi daha büyük modellere göre çok daha küçük olmasına rağmen benzer düzeyde performans gösteriyor.
Chat GPT-5, büyük olasılıkla multimodal olacak, yani sadece metinden değil, daha fazlasından giriş alabilecek ancak bu ne ölçüde olacağı belirsiz. Google’ın Gemini 1.5 modelleri metin, görüntü, video, konuşma, kod, mekansal bilgi ve hatta müziği anlayabiliyor. GPT-5’in benzer yeteneklere sahip olması muhtemel.
GPT-5 ne yapabilecek?
Önceki sürümlere göre GPT-5’te görebileceğimiz en büyük değişikliklerden biri, sohbet botundan ajan odaklı bir değişime olabilir. Bu, yapay zeka modelinin alt modellere görevler atamasına veya farklı hizmetlere bağlanarak kendi başına gerçek dünya eylemleri gerçekleştirmesine olanak tanır.
Bu, tüm endüstrinin araştırdığı bir alan ve Tavşan r1 AI cihazının arkasındaki büyünün bir parçasıdır. Bu, bir kullanıcının yapay zekaya sadece bir soru sormakla kalmayıp, aksine yapay zekaya çağrıları yönetmesini, uçuşları rezerve etmesini veya verileri başka yerlerden toplamasını isteyebileceği anlamına gelir.
Ajanların potansiyel kullanımlarından biri, günlük yaşam görevlerini yönetmektir. ChatGPT’ye GPT-5 ile beslenme gereksinimlerinizi, akıllı buzdolabı kamerasına erişimi ve market hesabınızı verebilirsiniz ve otomatik olarak yeniden dolduruları sipariş etmesini sağlayabilirsiniz.
Bunun bu yıl olması pek olası değil ama özellikle daha fazla akıllı cihaz ve sistem bağlandıkça ajanlar kesinlikle yapay zeka endüstrisinin gidişatı olacaktır.