Çinli girişim Z.ai, PowerPoint oluşturma özelliğine sahip güçlü, açık kaynaklı GLM-4.5 model ailesini piyasaya sürdü

Gelen kutunuza daha akıllı içgörüler mi gelsin? Kurumsal yapay zeka, veri ve güvenlik liderleri için yalnızca önemli olan bilgileri almak için haftalık bültenlerimize kaydolun. Hemen Abone Olun
2025 yazının yeni bir haftası başladı ve geçen haftaki trendin devamı olarak, daha güçlü Çin açık kaynaklı yapay zeka modelleri geliyor.
Batı'da pek bilinmeyen Çinli girişim Z.ai, yapay zeka akıl yürütme, etken davranış ve kodlama için başvurulacak çözümler olarak öne çıkan iki yeni açık kaynaklı LLM programı duyurdu : GLM-4.5 ve GLM-4.5-Air .
Z.ai'nin blog yazısına göre, modeller ABD'deki diğer özel LLM liderlerinin en üst sıralarında yer alıyor
Örneğin, amiral gemisi GLM-4.5, BrowseComp , AIME24 ve SWE-bench Verified gibi değerlendirmelerde Claude 4 Sonnet , Claude 4 Opus ve Gemini 2.5 Pro gibi önde gelen tescilli modellerle eşleşiyor veya onları geride bırakıyor; aynı zamanda bir düzine rekabetçi testte genel olarak üçüncü sırada yer alıyor.
AI Impact Serisi San Francisco'ya Geri Dönüyor - 5 Ağustos
Yapay zekanın bir sonraki aşaması burada - hazır mısınız? Block, GSK ve SAP liderleriyle bir araya gelerek, otonom ajanların gerçek zamanlı karar alma sürecinden uçtan uca otomasyona kadar kurumsal iş akışlarını nasıl yeniden şekillendirdiğine dair özel bir bakış açısı edinin.
Yerini hemen ayırt - kontenjan sınırlıdır: https://bit.ly/3GuuPLF
Daha hafif kardeşi GLM-4.5-Air de ilk altıda yer alıyor ve daha küçük ölçekli modeline göre güçlü sonuçlar sunuyor.
Her iki model de çift çalışma moduna sahiptir: karmaşık muhakeme ve araç kullanımı için düşünme modu ve anında yanıt senaryoları için düşünmeme modu. Tek bir başlık veya komuttan otomatik olarak eksiksiz PowerPoint sunumları oluşturabilirler, bu da onları toplantı hazırlığı, eğitim ve şirket içi raporlama için kullanışlı hale getirir.
Ayrıca, sosyal medya ve web için markalı içerik oluşturmak üzere yaratıcı yazarlık, duygusal farkındalık yaratan metin yazarlığı ve senaryo oluşturma hizmetleri de sunuyorlar. Ayrıca z.ai, müşteri desteği, rol yapma, hayran etkileşimi veya dijital kişilik hikaye anlatımı için sanal karakter geliştirme ve sıra tabanlı diyalog sistemlerini desteklediklerini belirtiyor.
Her iki model de akıl yürütme, kodlama ve aracılık yeteneklerini desteklerken, GLM-4.5-Air daha hızlı çıkarım ve daha düşük kaynak gereksinimlerine sahip, daha hafif ve daha uygun maliyetli bir alternatif arayan ekipler için tasarlanmıştır.
Z.ai ayrıca API'sinde GLM-4.5 ailesindeki birkaç özelleşmiş modeli listeliyor ; bunlar arasında ultra hızlı çıkarım için GLM-4.5-X ve GLM-4.5-AirX ve kodlama ve muhakeme görevleri için optimize edilmiş ücretsiz bir varyant olan GLM-4.5-Flash yer alıyor.
Artık doğrudan Z.ai'de ve geliştiricilerin üçüncü taraf uygulamalara bağlanabilmesi için Z.ai uygulama programlama arayüzü (API) aracılığıyla kullanılabilirler ve kodları HuggingFace ve ModelScope'ta mevcuttur. Şirket ayrıca, vLLM ve SGLang aracılığıyla çıkarım desteği de dahil olmak üzere birden fazla entegrasyon yolu sunmaktadır.
GLM-4.5 ve GLM-4.5-Air, izin verici ve ticari açıdan uygun bir açık kaynak lisansı olan Apache 2.0 lisansı altında yayınlanmıştır.
Bu, geliştiricilerin ve kuruluşların modelleri hem araştırma hem de ticari amaçlarla özgürce kullanmalarına, değiştirmelerine, kendi kendilerine barındırmalarına, ince ayar yapmalarına ve yeniden dağıtmalarına olanak tanır.
Model kodunu veya ağırlıklarını indirmek ve kendi kendine barındırmak veya dağıtmak istemeyenler için z.ai'nin bulut tabanlı API'si modeli aşağıdaki fiyatlara sunmaktadır.
- GLM-4.5 :
- 1 milyon giriş/çıkış belirteci başına 0,60 ABD Doları / 2,20 ABD Doları
- GLM-4.5-Hava :
- 1 milyon giriş/çıkış belirteci başına 0,20 ABD doları / 1,10 ABD doları
CNBC'nin modeller hakkındaki makalesinde, z.ai'nin her bir milyon giriş/çıkış belirteci için yalnızca 0,11 dolar / 0,28 dolar ücret alacağı belirtiliyordu; bu durum, şirketin "Hava modeli" için API dokümantasyonunda yayınladığı bir Çince grafikle de destekleniyor.

Ancak, bu durum yalnızca tek seferde 32.000'e kadar jeton girişi ve 200 jeton çıkışı için geçerli gibi görünüyor. (Hatırlama jetonları, LLM'nin farklı anlamsal kavramları ve kelime bileşenlerini temsil etmek için kullandığı sayısal gösterimlerdir ve LLM'nin ana dilidir; her jeton bir kelimeye veya bir kelimenin bir bölümüne çevrilir).
Aslında, Çince grafik, her iki model için de girilen/çıktısı alınan token grupları başına çok daha detaylı fiyatlandırmalar gösteriyor. Aşağıda çevirmeye çalıştım:

Bir diğer not: z.ai'nin merkezi Çin'de olduğundan, veri egemenliğine odaklanan Batılılar, API'yi kullanırken iç politikalar aracılığıyla gerekli özeni göstermek isteyeceklerdir; çünkü API, Çin içerik kısıtlamalarına tabi olabilir.

GLM-4.5, etkenlik, muhakeme ve kodlama performansını ölçen 12 endüstri ölçütünde üçüncü sırada yer alıyor ve yalnızca OpenAI'nin GPT-4 ve xAI'nin Grok 4'ünün gerisinde kalıyor. Daha kompakt kardeşi olan GLM-4.5-Air ise altıncı sırada yer alıyor.
Aracılık değerlendirmelerinde GLM-4.5, performans açısından Claude 4 Sonnet ile aynı seviyede ve web tabanlı görevlerde Claude 4 Opus'u geride bırakıyor. BrowseComp kıyaslamasında %26,4 doğruluk oranına ulaşırken, Claude 4 Opus'un %18,8'lik doğruluğuna ulaşıyor. Muhakeme kategorisinde ise MATH 500 (%98,2), AIME24 (%91,0) ve GPQA (%79,1) gibi görevlerde rekabetçi puanlar alıyor.
Kodlamada GLM-4.5, SWE-bench Verified'da %64,2 ve Terminal-bench'te %37,5 başarı oranına sahip. İkili karşılaştırmalarda, %80,8'lik bir başarı oranıyla Qwen3-Coder'ı geride bırakıyor ve görevlerin %53,9'unda Kimi K2'yi geçiyor. Aracı kodlama yeteneği, Claude Code, Roo Code ve CodeGeex gibi araçlarla entegrasyonu sayesinde geliştiriliyor.
Model ayrıca %90,6'lık başarı oranıyla alet çağırma güvenilirliğinde de lider konumda olup, Claude 4 Sonnet ve yeni Kimi K2'yi geride bırakıyor.
GLM-4.5'in piyasaya sürülmesi, Çin'de rekabetçi açık kaynaklı model lansmanlarının artışıyla birlikte geldi; bunların en dikkat çekeni Alibaba'nın Qwen Ekibiydi .
Qwen, tek bir hafta içerisinde, aralarında muhakeme odaklı Qwen3-235B-A22B-Thinking-2507'nin de bulunduğu dört yeni açık kaynaklı LLM yayınladı. Bu LLM, AIME25, LiveCodeBench ve GPQA gibi muhakeme ölçütlerinde OpenAI'nin o4-mini ve Google'ın Gemini 2.5 Pro gibi önde gelen modellerle boy ölçüşüyor veya onları geride bırakıyor.
Alibaba bu hafta, güçlü yeni bir açık kaynaklı video modeli olan Wan 2.2'yi yayınlayarak bu trendi sürdürdü.
Alibaba'nın yeni modelleri, z.ai gibi, Apache 2.0 lisansı altında sunuluyor ve ticari kullanım, kendi kendine barındırma ve tescilli sistemlere entegrasyona izin veriyor.
Alibaba'nın sunduğu ürünlerin geniş çapta erişilebilir olması ve izin verici lisanslaması ve öncesinde Kimi K2 modeliyle Çinli girişim Moonshot'ın varlığı, Çinli yapay zeka şirketlerinin açık kaynaklı altyapıyı kapalı ABD merkezli modellere uygulanabilir bir alternatif olarak konumlandırma yönündeki devam eden stratejik çabalarını yansıtıyor.
Bu durum, ABD merkezli model sağlayıcısının açık kaynakta rekabet etme çabalarına da baskı yapıyor. Meta, bu yılın başlarında piyasaya sürülen Llama 4 model ailesinin yapay zeka topluluğundan karışık tepkiler almasının ardından işe alım çılgınlığına kapıldı . Bu tepkiler arasında, bazı yapay zeka uzmanlarının kıyaslama oyunu ve tutarsız performans olarak gördüğü uygulamalara yönelik ağır eleştiriler de yer alıyor .
Bu arada, OpenAI'nin kurucu ortağı ve CEO'su Sam Altman, OpenAI'nin uzun zamandır beklenen ve çok konuşulan sınır açık kaynak LLM programının (ChatGPT'nin 2022 sonlarında piyasaya sürülmesinden bu yana ilk program) başlangıçta planlanan Temmuz sürümünden henüz belirtilmeyen daha ileri bir tarihe erteleneceğini duyurdu.
GLM-4.5, toplam 355 milyar ve 32 milyar aktif parametreyle üretilmiştir. Muadili GLM-4.5-Air ise toplam 106 milyar ve 12 milyar aktif parametreyle daha hafif bir tasarım sunmaktadır.
Her ikisi de kayıpsız denge yönlendirme, sigmoid geçitleme ve geliştirilmiş muhakeme için artırılmış derinlik ile optimize edilmiş Uzman Karışımı (MoE) mimarisini kullanır.
Öz-dikkat bloğu, Gruplanmış Sorgu Dikkatini ve daha fazla sayıda dikkat başlığını içerir. Çoklu Belirteç Tahmini (MTP) katmanı, çıkarım sırasında spekülatif kod çözmeyi mümkün kılar.
Ön eğitim, genel amaçlı ve kod/muhakeme metinleri arasında bölünmüş 22 trilyon belirteci kapsar. Orta eğitim ise depo düzeyindeki kod verilerinden, sentetik muhakeme girdilerinden ve uzun bağlamlı/aracı kaynaklardan 1,1 trilyon belirteç ekler.
Z.ai'nin GLM-4.5 için eğitim sonrası süreci, ajan görevlerindeki verimi optimize etmek için veri oluşturma ve model eğitim süreçlerini ayıran, kendi bünyesindeki RL altyapısı olan slime tarafından desteklenen bir takviyeli öğrenme aşamasına dayanıyordu.
Kullandıkları teknikler arasında karma hassasiyetli dağıtımlar ve uyarlanabilir müfredat öğrenimi yer alıyordu. Karma hassasiyetli dağıtımlar, veri üretirken daha düşük hassasiyetli matematik kullanarak modelin daha hızlı ve daha verimli bir şekilde eğitilmesine yardımcı olurken, doğruluktan da çok ödün vermiyor.
Bu arada, uyarlanabilir müfredat öğrenimi, modelin daha kolay görevlerle başlayıp kademeli olarak daha zor olanlara geçmesi anlamına gelir ve zamanla daha karmaşık görevleri kademeli olarak öğrenmesine yardımcı olur.
GLM-4.5'in mimarisi hesaplama verimliliğine öncelik veriyor. CNBC'ye göre, Z.ai CEO'su Zhang Peng, modelin yalnızca sekiz Nvidia H20 GPU'da çalıştığını belirtti. Bu, ABD ihracat kontrollerine uymak için Çin pazarına özel olarak tasarlanmış bir silikon. Bu, DeepSeek'in benzer modellerinin donanım gereksiniminin yaklaşık yarısı.
Z.ai, blog yazısında tam yığın geliştirme, slayt oluşturma ve etkileşimli eser oluşturmayı gösteri alanları olarak vurguluyor.
Örnekler arasında Flappy Bird klonu, Pokémon Pokédex web uygulaması ve yapılandırılmış belgelerden veya web sorgularından oluşturulmuş slayt desteleri yer alır.

Kullanıcılar bu özelliklerle Z.ai sohbet platformu üzerinden veya API entegrasyonu yoluyla etkileşime girebilirler.
CNBC'ye göre Z.ai, 2019 yılında Zhipu ismiyle kuruldu ve o zamandan beri Çin'in en önemli yapay zeka girişimlerinden biri haline geldi.
Şirket, Alibaba, Tencent, Qiming Venture Partners ve Hangzhou ile Chengdu'daki belediye fonları da dahil olmak üzere yatırımcılardan 1,5 milyar doların üzerinde para topladı ve Aramco bağlantılı Prosperity7 Ventures'ın ek desteğini aldı.
GLM-4.5 lansmanı, çok sayıda Çinli firmanın gelişmelerini sergilediği Şanghay'daki Dünya Yapay Zeka Konferansı ile aynı zamana denk geliyor. Z.ai ayrıca, Çin'in yapay zeka alanındaki ilerlemesini vurgulayan Haziran ayında yayınlanan bir OpenAI raporunda da yer aldı ve o zamandan beri Amerikan firmalarıyla iş yapmayı kısıtlayan bir ABD kuruluş listesine eklendi.
Üretimde dil modelleri oluşturma, dağıtma veya ölçekleme görevini üstlenen kıdemli yapay zeka mühendisleri, veri mühendisleri ve yapay zeka orkestrasyon liderleri için GLM-4.5 ailesinin Apache 2.0 lisansı altında yayınlanması, seçeneklerde anlamlı bir değişiklik sunuyor.
Model, akıl yürütme, kodlama ve aracılık kıyaslamalarında en iyi tescilli sistemlerle rekabet eden bir performans sunarken, bulut, özel veya şirket içi ortamlar dahil olmak üzere tam ağırlık erişimi, ticari kullanım hakları ve esnek dağıtım yollarıyla birlikte gelir.
LLM yaşam döngülerini yönetenler için (ister model ince ayarını yöneten, ister çok aşamalı süreçleri düzenleyen, isterse modelleri dahili araçlarla entegre edenler olsun) GLM-4.5 ve GLM-4.5-Air test etme ve ölçeklendirmeye yönelik engelleri azaltır.
Modeller, standart OpenAI tarzı arayüzleri ve araç çağırma formatlarını destekleyerek, deneme ortamlarında değerlendirmeyi veya mevcut aracı çerçevelerine bırakmayı kolaylaştırır.
GLM-4.5 ayrıca akış çıktısını, bağlam önbelleğini ve yapılandırılmış JSON yanıtlarını destekleyerek kurumsal sistemler ve gerçek zamanlı arayüzlerle daha sorunsuz entegrasyon sağlar. Otonom araçlar geliştiren ekipler için derin düşünme modu, çok adımlı akıl yürütme davranışı üzerinde daha hassas kontrol sağlar.
Bütçe kısıtlamaları olan veya tedarikçi bağımlılığından kaçınmak isteyen ekipler için fiyatlandırma yapısı, DeepSeek ve Kimi K2 gibi önemli tescilli alternatiflerin fiyatlarını düşürüyor. Bu durum, kullanım hacmi, uzun bağlamlı görevler veya veri hassasiyetinin açık dağıtımı stratejik bir zorunluluk haline getirdiği kuruluşlar için önem taşıyor.
Yapay zeka altyapısı ve orkestrasyonu alanında çalışan profesyoneller (örneğin, CI/CD hatları uygulayanlar, üretimde modelleri izleyenler veya GPU kümelerini yönetenler) için GLM-4.5'in vLLM, SGLang ve karma hassasiyetli çıkarım desteği, verimli ve ölçeklenebilir model sunumundaki güncel en iyi uygulamalarla uyumludur. Açık kaynaklı RL altyapısı (slime) ve modüler bir eğitim yığınıyla bir araya gelen modelin tasarımı, alan özelinde ortamlarda ayarlama veya genişletme için esneklik sunar.
Kısacası, GLM-4.5'in lansmanı, kurumsal ekiplere, tescilli API'lere veya fiyatlandırma yapılarına bağlı kalmadan kontrol edebilecekleri, uyarlayabilecekleri ve ölçeklendirebilecekleri , uygulanabilir ve yüksek performanslı bir temel model sunuyor. İnovasyon, performans ve operasyonel kısıtlamaları dengeleyen ekipler için cazip bir seçenek.
Patronunuzu etkilemek istiyorsanız, VB Daily size yardımcı olabilir. Şirketlerin üretken yapay zeka ile ilgili neler yaptığına dair, mevzuat değişikliklerinden pratik uygulamalara kadar her şeyi size aktarıyoruz, böylece maksimum yatırım getirisi için fikirlerinizi paylaşabilirsiniz.
Gizlilik Politikamızı okuyun
Abone olduğunuz için teşekkür ederiz. Daha fazla VB bültenine buradan ulaşabilirsiniz.
Bir hata oluştu.

venturebeat