OpenAI’ın “Strawberry” kod adlı yapay zeka teknolojisi makinelerin daha insansı düşünmesi için önemli bir adım olduğu öne sürülüyor.
Yapay zekanın insansılaştırmasına doğru

ChatGPT’nin üreticisi OpenAI, “Strawberry” kod adlı yeni bir proje üzerinde çalışıyor. Bu proje, yapay zeka modellerine yeni bir yaklaşım getirmeyi hedefliyor. Proje üzerindeki çalışmalar hala devam ediyor ve Strawberry’nin ne zaman kullanıma açıklanacağı ise henüz belli değil.
Strawberry’nin nasıl çalıştığı OpenAI ofislerinde dahi sır gibi saklanıyor. Proje, yapay zekanın yalnızca sorgulara yanıt vermekle kalmayıp internette dolaşarak “derin araştırma” (deep research) yapmasını sağlamayı hedefliyor. Bunun, yapay zeka modellerinin bugüne kadar başaramadığı bir şey olduğu öne sürülüyor.
Yeni yapay zeka teknolojilerini “Yapay zeka modellerimizin dünyayı bizim gördüğümüz gibi görmesini ve anlamasını istiyoruz. Yeni yapay zeka yeteneklerine yönelik araştırmalar, bu sistemlerin zamanla sorgulama konusunda gelişeceğine dair ortak bir inançla yapılıyor” sözleriyle açıklayan adı açıklanmayan OpenAI sözcüsü Strawberry ile ilgili doğrudan bir cevap vermekten ise kaçınıyor.
Daha önce “Q*” adıyla bilinen Strawberry projesi, yapay zeka teknolojilerinde büyük bir atılım olarak görülüyor. Bu yılın başlarında, bazı OpenAI çalışanları yapılan denemelerde projenin oldukça zor fizik ve matematik sorularını rahatlıkla çözebildiğini söyledi. Bu projeyle yapay zeka modellerinin sorgulama yeteneklerinin büyük oranda gelişeceği iddia ediliyor.
Araştırmacılar, sorgulamanın yapay zekada insan üstü düzeyde zekaya ulaşmada kilit rol oynadığını düşünüyor ancak mevcut teknoloji, mantıksızlıkları tanımak veya üç taş gibi oyunlarda genellikle yetersiz kalıyor.
Muhakeme yeteneği belirleyici olacak
Yapay zeka modellerinde sorgulama yeteneklerinin gelişmesi bilimsel keşiflerden yeni yazılım uygulamaları planlamaya kadar pek çok alanda ilerlemeyi sağlamak için kritik bir adım olarak görülüyor.
OpenAI CEO’su Sam Altman, “Yapay zekada görüntü ve sesi hallettik ve beklediğimizden çok daha güçlü tepkiler aldık. Yakında bunu daha da ileri götürebiliriz ancak en önemli ilerleme alanları muhakeme yeteneği üzerine olacak. Şu anda GPT-4 sadece son derece sınırlı şekillerde muhakeme yapabiliyor.” diyerek bunun yeterli olmadığına ve daha iyisine ihtiyaç olduğuna dikkat çekti. Google, Meta ve Microsoft gibi şirketler de yapay zeka modellerinde sorgulama yeteneklerini geliştirmek için farklı teknikler deniyor ancak araştırmacılar büyük dil modellerinin uzun vadeli planlama yeteneği konusunda farklı görüşlere sahip. Meta’da çalışan ve modern yapay zekanın öncülerinden Yann LeCun, büyük dil modellerinin (LLM’lerin) insan benzeri muhakeme yeteneğine sahip olmadığını sık sık vurguluyor.

Strawberry’nin OpenAI’nin bu zorlukların üstesinden gelme planının önemli bir parçası olduğunu dile getiriliyor. Strawberry’nin neyi mümkün kılmayı hedeflediği açıklansa da bunun nasıl gerçekleştirileceği belirsizliğini korumaya devam ediyor.
Son aylarda şirket, geliştiricilere önemli ölçüde daha gelişmiş sorgulama yeteneklerine sahip bir teknolojiyi piyasaya sürmek üzere olduğunun sinyallerini veriyor
Derin araştırma ve gelecek planlaması
Strawberry’nin, OpenAI’nin yapay zeka modellerini “sonradan eğitme” olarak bilinen özel bir yöntemle geliştirmeyi hedeflediği belirtiliyor. Bu yöntem, eğitim sonrası süreçte ince ayar yapılarak, modelin performansını belirli şekillerde iyileştirmeyi amaçlıyor.
Strawberry’nin Stanford Üniversitesi’nde 2022 yılında geliştirilen “Self-Taught Reasoner” (STaR) adlı bir yöntemle benzerlik taşıdığı ifade ediliyor. STaR, yapay zeka modellerinin kendi eğitim verilerini oluşturarak daha yüksek zeka seviyelerine ulaşmasını sağlıyor ve bu, teoride dil modellerinin insan seviyesindeki zekayı aşmasına yardımcı olabileceği düşünülüyor.
OpenAI’nin hedeflediği yetenekler arasında, bir modelin uzun vadeli görevleri yerine getirebilme kapasitesi de yer alıyor. Bu, modelin ileriyi planlamasını ve uzun süreli bir dizi eylemi gerçekleştirmesini gerektiren karmaşık görevleri içeriyor.
OpenAI, bu yetenekleri geliştirmek için “derin araştırma” adı verilen özel bir veri seti oluşturup değerlendiriyor ancak bu veri setinde neyin bulunduğu ya da “uzun süre”nin ne anlama geldiği henüz bilinmiyor.
Kaynak: Reuters