Stratejya 2025–13 Haftalık Notlar: Chatgpt 4o görsel üretimi, Google Gemini 2.5 Pro, Perplexity yanıt modları
Chatgpt yeni görsel üretim aracı ile zirveye oynuyor. Google, Gemini 2.5 Pro ile teknik alanlarda ön plana çıktı.
Altını çizdiklerim:
Google: Gemini 2.5 Pro’yu duyurdu.
OpenAI yeni görüntü modeli ile DALL-E'yi çöpe attı.
Perplexity, yeni yanıt modları ekledi.
Google Gemini 2.5 Pro
Fark ettin mi hiç, Google son birkaç aydır yapay zeka alanında gelişim sürecini çok hızlandırdı. Özellikle Gemini 2.5 Pro, OpenAI’nin o3-mini ve Anthropic’in Claude 3.7 Sonnet modellerini birçok testte geride bıraktı.
Ayrıntılar
1 milyon token desteği ile büyük veri kümelerini işleme yeteneği sunuyor. İlerleyen zamanda bu desteğin 2 milyona çıkarılması bekleniyor.
Çoklu model entegrasyonu sayesinde metin, kod, ses ve görüntü verilerini tek bir modelde birleştirebiliyor.
Gelişmiş muhakeme ve problem çözme yetenekleri sayesinde matematik, kodlama ve bilimsel alanda GPQA ve Humanity's Last Exam gibi zorlu testlerde öne çıkıyor.
Gemini 2.5 Pro şu anda bütün kullanıcılar için erişilebilir durumda.
Neden önemli?
Son model bir yapay zeka modelinin ücretsiz olarak kullanılabilir olması bilgiye erişimi kolaylaştırıyor. Ayrıca muhakeme ve problem çözme yetenekleri de üst seviyede diyebiliriz.
« X - Google Gemini 2.5 Pro | Google Blog »
OpenAI Görüntü İşleme Modeli
Dall-E çağı sona erdi. OpenAI hiç de beklemediğimiz bir hamle yaptı. 4o modeline ve Sora'ya entegre edilmiş şekilde kullanabildiğimiz yep yeni görüntü işleme modelini duyurdu. Sonunda.
Özellikler
GPT-4o mimarisiyle bütünleşik durumda.
Bir prompt içinde önceki modele göre iki kat daha fazla nesne odaklı çalışabiliyor. (yaklaşık 15-20 nesne)
Doğal konuşma sırasında bir önceki görüntü üzerinde değişiklikler yapabiliyorsun.
Yüklenen görüntüyü analiz ettirerek, talep ettiğin komutlar ile yeni görüntüler oluşturabiliyorsun.
Daha yüksek çözünürlüklü görüntüler sunuyor.
Görselde istenen metinler (genel olarak) artık doğru şekilde oluşturuluyor.
Kullanım Sınırları
Ücretsiz kullanıcılar günde 3 görüntü oluşturabilir.
Plus/Pro kullanıcıları ise 3 saatte 50 görüntü oluşturabiliyor.
Ancak hızlı güncellemeler talep edildiğinde 5-10 dakika kadar bekleme süresi gerekli olabilir.
Görsel oluşturma süresi de uzadı; 1-2 dakika arasında değişebiliyor.
Neden önemli?
DALL-E diğer görsel üreticilere göre çok geride kalmıştı. Oluşturduğum görsellere ve kullanıcıların paylaştıklarına göre, beklediğimize değmiş gibi duruyor.
Konuşma dili ile görsel ürettirme yeteneklerini birleştirmesi de yeni bir standart oluşturuyor. Çeşitli programlarda simgeler basarak yaptığım işleri artık sadece yazarak ya da konuşarak yaptırabileceğiz.
« OpenAI 4o Image Generation »
Perplexity yanıt modları
Perplexity arama sürecine getirdiği yenilikle Google'dan çok farklılaşmıştı. Şimdi de Google sayfalarında uzun zamandır sabit olarak duran bazı başlıkları interaktif hale getirip deneyimi zenginleştirmeyi hedefliyor.
Pratik Uygulama
Yanıt modları olarak tanıtılan alanlar; Seyahat, Alışveriş, Video, Görseller, İş ilanları, Yerler, Hayat.
Bu alanlar ile ilgili arama yapıldığında ayrıca bir sekme olarak beliriyor. Google gibi sabit olarak bulunmuyor.
"Yerler" sekmesi faydalı görünüyor. Bilgi kartları ile zenginleştirilmiş, kritik bilgiler sunuyor. Hızlı erişim sağlıyor. Ancak kart bilgisi Google Maps'ten çekiliyor.
"Görseller" sekmesi idare eder. Görselleri hızlıca tarayabiliyorsun. "Video" sekmesi de aynı şekilde çalışıyor. Ancak çoğu arama sonucu Youtube’a yönlendiriyor. Hal böyle olunca Youtube arama sonuç sayfasının mevcut Perplexity sekmesinden daha iyi olduğunu söyleyebilirim.
“Fethiye civarı çadır kamp tesisleri” aramasını yaptırdım, inceleyebilirsin.
Fikir olarak güzel, beğendim ama sonuçlar henüz kısıtlı. Yer kartları da iyi ama seçenekler iki elin parmaklarını geçmiyor. Gelişimini takip etmeye değer.
Neden önemli?
Bu arama derinliği doğrudan Google'ın Adwords reklam geliri modelini hedef alıyor. Perplexity CEO'su da bunu doğrulayarak ilk hedeflerenin seyahat dikeyi olduğunu vurguladı. Perplexity açısından gelir modelini zenginleştirme amacı taşıyor.
« X - Perplexity CEO Aravind Srivinas »
Kısa Kısa
« Reve Image 1.0 » İleri gerçeklikte görseller oluşturabilen yeni bir görüntü üretme aracı. İlk sürümüne göre keşif sayfası etkileyici.
« Ideogram 3.0 » Metin işleme yetenekleri geliştirilmiş, benzeri Imagen 3 ve Flux Pro 1.1 gibi modellere kıyasla daha iyi sonuçlar üreten güncellemesini çıkardı.
Görsel üretimi alanındaki rekabet daha da kızışıyor. Bu araçlarla üretilen görüntülerin bir çoğu da video üreten yapay zeka araçlarının hammaddesi haline dönüşüyor. Kullanıcı açısından baktığımızda daha kaliteli ve ucuza hizmet alacağımız kesin.
« DeepSeek V3-0324 » Mevcut sürümünü güncelleştirdi.
« Chatgpt Voice Mode » Chatgpt konuşmalarda seni daha iyi anlayan ve daha az sözünü kesen güncellemeler yaptı.
« Microsoft 365 Copilot » Analyst ve Researcher adında iki yeni operatör (agent) ekledi. Daha yenileri de bu yıl içinde gelecek.
« Chatgpt 4o » Pro kullancılar için yeni bir güncelleme yayınladı. Ayrıntılı promptları daha iyi takip ediyor. Yaratıcılık, kodlama ve teknik konularında daha iyi. Ücretsiz kullanıcılar birkaç hafta sonra bu güncellemeye erişebilecek.
« Claude nasıl çalışıyor? » İleri seviye yapay zekaya yaklaşırken bu modellerin nasıl davrandığını anlamak daha önemli hale geliyor. Güzel örnekler var.
Davranış dedim çünkü yapay zeka düz bir program değil. Eğitilmiş bir veri setiyle çalışıyor. Eğitim seviyesine göre farklı (davranışlar sergileyebiliyor) yanıtlar verebiliyor. Bilinç kazanma potansiyeline sahip bir şeyin nasıl çalıştığını bilmek önemli.