Dil Seçin

Turkish

Down Icon

Ülke Seçin

Italy

Down Icon

Claude elinden geleni yapıyor: Opus 4 ve Sone 4 geliyor ve her şey değişiyor

Claude elinden geleni yapıyor: Opus 4 ve Sone 4 geliyor ve her şey değişiyor

En iyi performansa sahip yapay zeka nesline sahip olma yarışı bitmiyor. Anthropic, yapay zeka dünyasındaki zorluğu Claude Opus 4 ve Claude Sonnet 4 ile yeniden başlatıyor; yazılım geliştirmeden içerik üretimine, çok adımlı akıl yürütmeye kadar en karmaşık görevleri ele almak üzere tasarlanmış kanıtlanmış modellerinin evrimi, ilan edilen hedefe doğru somut bir sıçramayı işaret ediyor: Yapay zekayı gerçek bir sanal işbirlikçisine dönüştürmek.

Anthropic, Claude 4 ile yüksek hedefler koyuyor: "İnsan-makine işbirliği için yeni bir standart belirlemek istiyoruz." Ve bu sadece bir iddia değil. Yeni modeller uzun vadeli faaliyetleri sürdürebilme, dış araçları entegre edebilme, bilgi tutarlılığını koruyabilme ve büyük ölçekli sorunları çözebilme yeteneğine sahiptir. Kısacası: daha güvenilir, daha akıllı, daha kullanışlı.

Opus 4 amiral gemisi modelidir ve Anthropic'e göre dünyanın en iyi kodlama modelidir. SWE-bench Verified'da %72,5 ve Terminal-bench'te %43,2 puan alarak gerçek dünya programlama görevleri için uluslararası sıralamalarda en üst sıraya yerleşti. Testlerde, karmaşık bir proje üzerinde yaklaşık yedi saat boyunca otonom bir şekilde çalışabildiği görüldü. Bu başarı, Rakuten, Replit ve Cursor gibi şirketleri etkiledi ve bu şirketler, bu aracı birden fazla dosyaya kod yazma, hataları düzeltme, karmaşık talimatları izleme ve büyük projelerde tutarlılığı koruma yeteneğine sahip bir araç olarak tanımlıyor.

Claude Sonnet 4, selefi 3.7 versiyonuna kıyasla kalite açısından da bir sıçrama yapıyor. SWE-bench'te %72,7 puan alıyor, talimatlara daha doğru yanıt veriyor, kod tabanlarını daha etkili bir şekilde yönetiyor ve karmaşık sorunları daha rafine akıl yürütmeyle çözüyor. GitHub, bunu yeni Copilot aracısına entegre etti bile; Sourcegraph, iGent ve Augment Code gibi şirketler ise çok işlevli görevlerde kod kalitesi, gezinme ve özerklik üzerindeki olumlu etkisini vurguluyor.

Her iki model de hibrit olup, anında tepkiler verebilme veya "genişletilmiş düşünme" adı verilen uzun süreli düşünme modunu harekete geçirebilme yeteneğine sahiptir. Bu aşamada modeller, web aramaları veya yerel dosyalar gibi harici araçlara erişebilir, akıl yürütme ve eylemi akıcı ve koordineli bir şekilde değiştirebilir. Üstelik birden fazla aracı paralel olarak kullanabilir, yanıtlarını iyileştirebilir ve kalıcı bellek oluşturabilirler. Geliştiriciler tarafından yetkilendirildiklerinde, karmaşık projelerde ve zaman içinde bilişsel sürekliliği koruyarak ilgili bilgileri kaydedebilir ve güncelleyebilirler.

ilsole24ore

ilsole24ore

Benzer Haberler

Tüm Haberler
Animated ArrowAnimated ArrowAnimated Arrow