Imagen 3: Google’ın yüksek kaliteli görüntü oluşturucu yapay zekası

Google, yeni Imagen 3‘ün inanılmaz düzeyde ayrıntı sağlayacağını, doğal dili daha iyi anlayacağını ve daha iyi metin işleme sunacağını söyleyerek metinden görüntüye yapay zeka modellerinde önemli bir geliştirme yapıyor. I/O geliştirici konferansı sırasında “şimdiye kadarki en gelişmiş görüntü oluşturma modellimiz” olarak tanımlanan Imagen 3, temel olarak DALL-E ve Midjourney gibi benzerleriyle rekabet edecek.

Ancak Imagen 3, herkesin kullanımına açılmıyor; araç, ImageFX‘te özel önizlemede belirli içerik üreticiler için mevcut. Dilerseniz bekleme listesine kaydolabilirsiniz, ayrıca Google, Imagen 3’ün Vertex AI‘ye de geleceğini de söylüyor.

Benzer haberlimizde olduğu gibi bu içerikteki tüm görseller de yapay zeka ile yani Imagen 3 ile oluşturulmuştur.

Imagen 3’ün gücü detaylarda

Imagen 3, önceki modelere göre daha iyi ayrıntılara, daha zengin aydınlatmaya ve daha az dikkat dağıtıcı yapaylığa sahip görüntüler üretebilen bir model. Google, Imagen 3’ün istemleri anlama becerisini önemli ölçüde geliştirdiklerini, bunun da modellerin çok çeşitli görsel stiller oluşturmasına ve daha uzun istemlerden küçük ayrıntıları yakalamasına yardımcı olacağını söylüyor.

Daha da kullanışlı olması için Imagen 3, hızlı taslaklar oluşturmaktan yüksek çözünürlüklü görüntülere kadar her biri farklı görev türleri için optimize edilmiş birden fazla sürüme sahip olacak. Google, Imagen 3’ü fotogerçekçi manzaralardan zengin dokulu yağlı boya tablolara veya tuhaf kil sahnelerine kadar çok çeşitli format ve stillerde yüksek kaliteli görüntüler üretecek şekilde tasarladıklarını belirtiyor. Imagen 3 aynı zamanda doğal, günlük dilde yazılmış komut istemlerini de anlayarak karmaşık komut istemi mühendisliği olmadan istediğiniz çıktıyı almanızı izin verecek.
Imagen 3, iyi ışıklandırma ve kompozisyon ile görsel açıdan zengin, yüksek kaliteli görüntüler üretiyor. Bir kişinin elindeki ince kırışıklıklar gibi küçük ayrıntıları ve örülmüş oyuncak fil gibi karmaşık dokuları doğru bir şekilde oluşturabiliyor. Ayrıca yeni model çok daha iyi metin üretebiliyor. Dolayısıyla bir doğum günü kartı hazırlamanız daha kolay olacak veya bir sunum sayfası.

 

Google, Imagen 3 için bazı güvenlik önlemleri de alıyor. Bu önlemler arasında eğitim kütüphanesinden zararlı içerikler püskürtmemesi için kapsamlı filtreleme ve veri etiketlemeler bulunuyor. Ayrıca insanlar tarafından ince ayarlamalar da yapılmış durumda. Bunlara ek olarak Imagen 3 tarafından üretilen her görüntüde insanlar tarafından algılanamayan görünmez, piksellere yerleştirilen yenilikçi filigran aracı SynthID kullanılıyor.

Önümüzdeki aylarda Imagen 2’nin inpainting ve outpainting gibi popüler düzenleme özellikleri Imagen 3’te kullanıma sunulacak. Ayrıca Imagen 3’ün Gemini uygulaması ve web sürümünde, Workspace, Reklamlar ve daha fazla Google ürününde kullanılmaya başlanacak.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

x