Google’dan OpenAI’nin Sora’sına rakip: Veo 2

Google DeepMind, 4K çözünürlükte ve iki dakikalık videolar üretebilen yeni yapay zekâ aracı Veo 2 ile OpenAI’nin Sora modeline meydan okuyor.

Google’ın DeepMind laboratuvarı, yapay zekâ destekli video oluşturma aracı Veo 2’yi tanıttı. Model, 4K çözünürlükte ve iki dakikaya kadar uzunlukta videolar üreterek bu alandaki standartları yeniden tanımlamayı hedefliyor. OpenAI’nin Sora modeliyle doğrudan rekabet eden Veo 2, daha gerçekçi fiziksel hareketler, ışık yansımaları ve insan ifadeleri oluşturma kapasitesiyle dikkat çekiyor.

Veo 2, kullanıcıların metin istemleri ya da referans görsellerle video oluşturmasına olanak tanıyor. Örneğin, “Otoyolda hızla ilerleyen bir araba” gibi bir istem, yüksek detaylı ve akıcı hareketlere sahip bir videoya dönüştürülebiliyor. Ayrıca, modelin kamera açısını daha hassas bir şekilde kontrol etmesi ve dinamik sahneleri gerçeğe yakın şekilde üretmesi sağlanıyor. Google’ın yaptığı testler, Veo 2’nin daha yüksek çözünürlük ve daha uzun süreli videolar üretme konusunda Sora’yı geride bıraktığını gösteriyor.

Modelin teknik detayları arasında, ışık ve gölge dinamiklerini gerçeğe yakın bir şekilde simüle etmesi ve sıvı hareketlerini yüksek doğrulukla modelleyebilmesi yer alıyor. Ancak Google, Veo 2’nin hala uzun süreli senaryolarda karakter tutarlılığı ve karmaşık detaylar gibi alanlarda geliştirilmesi gerektiğini kabul ediyor. Bu süreçte kullanıcı geri bildirimlerinin önemli bir rol oynadığı belirtiliyor.

Veo 2 tarafından üretilen tüm içerikler, Google’ın SynthID adlı filigran teknolojisiyle işaretleniyor. Bu teknoloji, yapay zekâ ile üretilen içeriklerin tanınmasını sağlamak için kullanılıyor. Ayrıca, modelin eğitimi sırasında kullanılan veri kaynakları hakkında tam bilgi paylaşılmasa da, Google’ın YouTube içeriklerinden yararlanmış olabileceği belirtiliyor.

Google, Veo 2’nin yanı sıra, görüntü oluşturma modeli Imagen 3 üzerinde de geliştirmeler yaptı. Imagen 3, kullanıcıların fotogerçekçilikten soyut sanata kadar farklı tarzlarda görseller üretmesine olanak tanıyor. Daha detaylı ve canlı görüntüler sunan bu model, ImageFX platformu üzerinden erişime açıldı.

Kaynak: TechCrunch