ChatGPT'nin yeni versiyonu hayal kırıklığı yaratıyor ve vaat edilen süper insan yapay zekası hayalini suya düşürüyor.

Sanki Steve Jobs 2007'de iPhone'u duyuruyormuş gibi, Sam Altman dün yeni gözbebeğini tanıttı: ChatGPT'nin en son güncellemesi olan GPT-5 . Genel olarak bakıldığında, öncekilerden daha akıllı, daha hızlı ve daha mantıklı bir sürüm. Ancak asıl mesele bu. Bu, Altman'ın peşinde olduğu yapay genel zeka (AGI) değil ve hatta dünyanın en iyi programcısından bile üstün değil.
Bu durum, geçen haftaki duyuruları heyecanla bekleyen tüm yapay zeka uzmanlarını hayal kırıklığına uğrattı. Altman, GPT-5'in piyasadaki diğer tüm yapay zeka sistemlerini "yok edeceği" imasıyla Ölüm Yıldızı benzeri tweetler atarak heyecan yarattı. Durum böyle olmadı ve aynı zamanda WWDC 2024'teki duyurusunda verilen sözlerle karşılaştırıldığında, Apple Intelligence'ın lansmanının fiyaskosunu hatırlattı.
Yapay zeka uzmanı ve OthersideAI'nin sahibi Matt Shumer, birkaç hafta önce GPT-5'e erişebildi ve ABC'ye, şu ana kadarki en iyi model olmasına rağmen "en iyi şekilde yararlanmak için çok çaba sarf etmek gerektiğini", ortalama bir kullanıcının şu anda bunu yapamayacağını ve bu nedenle şimdiye kadar kullandıkları GPT-4.5 ile arasında çok fazla fark görmeyeceklerini açıkladı.
Shumer, "GPT-5, uzun bağlamlarda en iyi olmaya odaklanmış, çok ayrıntı odaklı bir model, çünkü orada daha az aptalca hata yapıyor. Programlama için ideal, hatta en iyi yapay zeka olduğunu gördük," diyor. Hatta Altman, yeni modelin tanıtımı sırasında bunun "bir programcı için mükemmel bir asistan" olduğunu belirtti.

Gerçek dünya GitHub görevlerine odaklanan SWE-bench Verified kıyaslamasında, GPT-5 ilk denemede %74,9 başarı oranına ulaşıyor. Hiçbir alternatif bu seviyeye ulaşamadı. Sam Altman liderliğindeki şirkete göre, Claude Opus 4.1 (%74,5) ve Gemini 2.5 Pro (%59,6)'yı geride bırakıyor. Sadece birkaç talimatla sıfırdan web siteleri oluşturabilir, uygulamalar, etkileşimli oyunlar tasarlayabilir veya büyük depolardaki kodları hassasiyetten ödün vermeden hata ayıklayabilir. Sadece çalıştırmakla kalmıyor, aynı zamanda ne yaptığını ve nedenini de açıklıyor.
Öte yandan, GPT-5 sadece iç mekanda iyileştirmeler yapmakla kalmıyor, aynı zamanda onunla etkileşim kurma biçimimizi de değiştiriyor. ChatGPT, gelişiyle birlikte dört yeni kişilik kazanıyor: Alaycı, Robot, Dinleyici ve İnek. Her biri kendi tarzıyla tepki veriyor, talimat gerektirmeden tonunu, tavrını ve yaklaşımını ayarlıyor. Ayrıca, yapay zekayla yaptığınız sohbetin rengini değiştirmenize de olanak tanıyor, ancak bu seçenek yalnızca ücretli hesaplara sahip kullanıcılar için mevcut. Her şey, OpenAI'nin eski Apple tasarımcısı Jony Ive ile olan ilişkisinin GPT-5'in yeni özelliklerini etkilediğini gösteriyor.
Ancak, GPT-o3'ün bilimsel araştırmalar için en iyi seçenek olmaya devam ettiği, GPT-4.5'in ise yazım için ideal model olduğu görülüyor. İyi haber şu ki, dün itibarıyla GPT-5, bugün itibarıyla tüm ChatGPT kullanıcılarına ücretsiz olarak sunuldu. Ücretsiz kullanıcılar hem GPT-5'e hem de daha hızlı ancak daha az doğruluğa sahip GPT-5 mini sürümüne erişebilecek. Bu, gelişmiş bir akıl yürütme modelinin abonelik olmadan ilk kez kullanılabilmesini sağlıyor.
GPT-5 konusunda heyecanlanmak için sebepler olsa da (model, sürüm alt bölümlemesinden vazgeçerek akıl yürütmeye mi yoksa hıza mı öncelik vereceğine gerçek zamanlı olarak karar veren tek bir model haline geliyor), bu sıçrama vaat edildiği gibi değil. Yeni modelin ilk testçilerinden ikisi, Reuters'a, fen ve matematik problemlerini programlama ve çözme becerisinden de etkilendiklerini, ancak GPT-4'ten GPT-5'e geçişin GPT-3'ten GPT-4'e geçiş kadar büyük olmadığına inandıklarını söyledi. "OpenAI'nin içinden ve dışından bazılarının yıllardır ima ettiği insan benzeri zeka fikrinden çok uzak," diye vurguluyorlar. ABC'de birkaç test yaptık ve uzmanların da belirttiği gibi, GPT-5'in halihazırda var olup olmadığı veya cevabındaki beşinci kelimenin ne olduğu gibi çok temel sorular sorulduğunda tökezliyor.

GPT-5'in geliştirilmesi de kolay olmadı. Altman, modelin tüm bileşenlerini entegre edemedikleri için lansmanın birkaç ay ertelendiğini kamuoyuna açıkladı. Ayrıca, "benzeri görülmemiş" bir talep olacağını öngördükleri kapasiteyi karşılamak istediklerini de belirtti. Ancak bu gecikmelerin ardında daha fazlası vardı. Bir yandan, OpenAI bir veri sorunuyla karşı karşıyaydı: artık bu tür modelleri eğitmek için pek çok yeni, büyük ve temiz kaynak yok.
Şirketin eski baş bilim insanı Ilya Sutskever bunu şu şekilde açıkladı: "Güç açısından ölçeklenebiliriz, ancak veri açısından değil." Bir diğer sorun ise, sistemin karmaşıklığı göz önüne alındığında, büyük modeller için yapılan "eğitim çalışmalarının" donanım kaynaklı aksaklıklara daha yatkın olması ve araştırmacıların, çalışmanın sonuna kadar, yani aylarca sürebilecek bir süre boyunca, modellerin nihai performansını bilememeleriydi.
ABC.es