ChatGPT'ye bir darbe daha!

Çin, yapay zeka alanındaki atılımlarına bir yenisini daha ekledi. Daha önce DeepSeek modeliyle dil işleme konusunda büyük bir rekabet başlatan Çin, şimdi de video üretim alanında önemli bir hamle yapıyor. TikTok’un çatı şirketi ByteDance, OmniHuman-1 adlı yeni bir yapay zeka modelini duyurdu. Bu model, yalnızca bir görsel veya metin girdisiyle insanları konuşurken, dans ederken, şarkı söylerken ya da müzik aleti çalarken gösterebilen videolar üretebiliyor.

OmniHuman-1, OpenAI’nin Sora modeline rakip olacak

OmniHuman-1, video üretiminde insan hareketlerini, konuşmalarını ve jestlerini gerçeğe oldukça yakın bir şekilde taklit edebilen çok modlu bir yapay zeka modeli olarak tanıtıldı. Şirketin açıklamalarına göre, bu model ister bir portre fotoğrafı, ister tam vücut görseli olsun, doğal hareketler ve gerçekçi ifadeler üretebiliyor. Bu teknoloji, OpenAI’nin geçtiğimiz Aralık ayında tanıttığı Sora modeline doğrudan rakip olarak görülüyor.

OmniHuman-1’in temel özellikleri şunlar:

Gerçekçi insan hareketleri ve yüz ifadeleri
Çoklu giriş desteği (görseller, ses ve video parçaları)
Yüksek kaliteli ve gerçekçi video üretimi
İnsan dışındaki animasyonlar için de kullanılabilme potansiyeli…

Şunu da ekleyelim: Bu tür gelişmiş yapay zeka teknolojileri, etik ve güvenlik kaygılarını da beraberinde getiriyor. Bazı uzmanlar, bu tür modellerin kötüye kullanılma potansiyeline dikkat çekerek, “Bu tür yapay zeka modelleri, derin sahte (deepfake) içeriklerin üretimini kolaylaştırabilir ve bu da bilgi kirliliğine yol açabilir. Bu nedenle, bu teknolojilerin geliştirilmesi ve kullanımı sıkı bir şekilde denetlenmeli.” şeklinde görüş belirtiyor.

Bu bağlamda, bazı akademisyenler ve etik uzmanları, OmniHuman-1 gibi modellerin potansiyel riskleri nedeniyle yasaklanması veya sıkı düzenlemelere tabi tutulması gerektiğini savunuyor.

ByteDance’in bu alandaki atılımı, gelecekte video içerik üretiminde yapay zekanın rolünü daha da artırabilir.