Yapay zeka şirketleri, veri ve işlem gücü artırmak yerine, insana benzer düşünme yetisine sahip akıllı modeller geliştirmeye odaklanıyor. Bu dönüşüm, enerji ve çip talebinde yeni bir rekabetin başlangıcı olabilir.
Yapay zeka şirketleri, veri ve işlem gücü artırmak yerine, insana benzer düşünme yetisine sahip akıllı modeller geliştirmeye odaklanıyor. Bu dönüşüm, enerji ve çip talebinde yeni bir rekabetin başlangıcı olabilir.
OpenAI gibi yapay zeka şirketleri, büyük dil modellerini daha büyük ve güçlü hale getirme sürecinde karşılaştıkları beklenmedik sorunları aşmak için yeni yöntemler geliştiriyor. Şirketler, veriyi artırarak ve işlem gücünü büyüterek ilerlemek yerine, yapay zeka algoritmalarının daha “insan gibi düşünmesini” sağlayacak yenilikçi tekniklere yöneliyor. OpenAI’nin geliştirdiği yeni “o1” modeli, bu yeni yaklaşıma örnek teşkil ediyor ve yapay zeka araştırmalarının geleceğini şekillendirme potansiyeli taşıyor.
ChatGPT’nin büyük ilgi görmesinden sonra teknoloji şirketleri, daha fazla veri ekleyerek ve işlem gücünü artırarak sürekli olarak daha büyük yapay zeka modelleri geliştirebileceklerine inanıyordu. Öte yandan son yıllarda, önde gelen bazı yapay zeka bilim insanları ve mühendisler, bu “büyütme” stratejisinin bir sınırı olduğunu vurgulamaya başladı.
OpenAI’in kurucularından Ilya Sutskever, büyük veri ve işlem gücüyle model eğitmenin artık istenilen sonuçları vermediğini söylüyor. Bir zamanlar veri ve işlem gücüyle büyük sıçramalar yapılabileceğine inanan Sutskever, bu yöntemle elde edilen gelişmelerin sınırına gelindiğini ifade ediyor. Sutskever, artık yeni yaklaşımlar keşfetmenin ve doğru teknikleri bulmanın ön planda olduğunu vurguluyor.
Yapay zeka laboratuvarları, büyük dil modelleri geliştirme yarışında birçok teknik ve mali zorlukla karşılaşıyor. Bu büyük modellerin eğitimi sırasında yapılan “eğitim çalışmaları” milyonlarca dolarlık maliyete yol açıyor ve çok sayıda çip kullanılarak gerçekleştiriliyor. Ayrıca, büyük dil modelleri çok büyük miktarda veriye ihtiyaç duyduğundan, dünyanın her yerinden kolayca erişilebilen veriler neredeyse tükenmiş durumda. Modellerin eğitim sürecinde ihtiyaç duyduğu yüksek enerji nedeniyle de bazı bölgelerde elektrik sıkıntıları yaşanıyor. Bu zorluklar, yapay zekayı daha akıllı hale getirme sürecinde farklı yollar aranmasına yol açıyor.
Yeni yöntem “akıllı cevaplama”
Bu sorunların üstesinden gelmek için araştırmacılar, modellerin kullanım aşamasında daha etkili çalışmasını sağlayacak teknikleri araştırıyor. “Test-time compute” adı verilen bu teknik, modelin yanıt üretirken çok daha fazla işlem gücü kullanmasını sağlıyor. Örneğin, model bir soruya hemen cevap vermek yerine, önce birkaç farklı yanıt seçeneği üretiyor ve en iyi cevabı belirliyor. Böylece model, matematik veya kodlama gibi daha karmaşık ve analitik düşünme gerektiren sorunları çözmede daha başarılı oluyor. OpenAI’den araştırmacı Noam Brown, bu yöntem sayesinde bir yapay zekanın yalnızca birkaç saniye daha fazla düşünmesinin, modele büyük oranda performans artışı sağladığını söylüyor.
OpenAI, bu yöntemi yeni “o1” modelinde kullanıyor. O1 modeli, insan gibi “adım adım düşünerek” sorunları çözebiliyor. Model, aynı zamanda alanında uzman akademik ve sektörel geri bildirimlerden faydalanarak eğitildiği için daha doğru sonuçlar üretiyor. OpenAI, bu yaklaşımı gelecekte daha büyük modellerde de kullanmayı planlıyor. Bu sırada, diğer büyük yapay zeka şirketleri olan Google DeepMind, Anthropic ve xAI da kendi versiyonlarını geliştirmek için çalışmalara başlamış durumda.
Nvidia çiplerinin sonu belirsiz
Bu yeni tekniklerin yaygınlaşmasıyla, Nvidia gibi donanım şirketlerinin işleyişinin de etkilenebileceği düşünülüyor. Şimdiye dek Nvidia’nın güçlü çipleri, devasa işlem gücü gerektiren model eğitimi için tercih ediliyordu ve Nvidia bu pazarda hakim konumdaydı. Ancak yeni yöntem, eğitmek yerine “çözüm üretme” aşamasına odaklandığı için, Nvidia’nın bu tek hakimiyeti kırılabilir. Bu da yapay zeka sektöründe rekabetin daha geniş bir alana yayılmasını sağlayabilir. Nvidia CEO’su Jensen Huang da bu geçişin farkında olduklarını belirterek, yeni geliştirdikleri Blackwell çipinin özellikle çözüm üretme aşamasında yüksek bir talep gördüğünü ifade ediyor.
Yapay zeka alanı büyük bir dönüşüm geçiriyor. Şirketler artık veri ve işlem gücüyle büyüme yerine daha “akıllı” ve “insana benzer düşünce yapısına” sahip modeller geliştirmeye yöneliyor. Bu değişim, enerji ve çip gibi kaynak talebinde yeni bir rekabet ortamı yaratabilir ve yapay zeka alanında daha yaratıcı çözümler sunan, daha verimli bir dönemin başlangıcı olabilir.
Kaynak: Reuters