Microsoft destekli Mistral, AWS ve Azure ile rekabet etmek için Avrupa AI bulutunu başlattı

Yaklaşık yirmi yıldır kurumsal liderlerin güvendiği etkinliğe katılın. VB Transform, gerçek kurumsal AI stratejisi oluşturan insanları bir araya getiriyor. Daha fazla bilgi edinin
Fransız yapay zeka girişimi Mistral AI , Çarşamba günü şirketi Avrupa'nın Amerikan bulut bilişim devlerine cevabı konumuna getirecek kapsamlı bir yapay zeka altyapısı genişlemesi duyurdu ve aynı zamanda OpenAI'nin en gelişmiş sistemleriyle rekabet edebilecek yeni akıl yürütme modellerini ortaya koydu.
Paris merkezli şirket, Avrupa işletmelerine ve hükümetlerine Amazon Web Services , Microsoft Azure ve Google Cloud gibi ABD merkezli bulut sağlayıcılarına güvenmek yerine bir alternatif sunmak için tasarlanmış, Nvidia ile ortaklaşa inşa edilen kapsamlı bir AI altyapı platformu olan Mistral Compute'u duyurdu. Bu hamle, Mistral için yalnızca AI modelleri geliştirmekten tüm teknoloji yığınını kontrol etmeye doğru önemli bir stratejik değişimi temsil ediyor.
Mistral AI'nın CEO'su ve kurucu ortağı Arthur Mensch, "Yapay zeka altyapısına geçiş, Mistral AI için dönüştürücü bir adım teşkil ediyor çünkü bu, yapay zeka değer zincirinin kritik bir dikeyine hitap etmemizi sağlıyor," dedi. "Bu değişimle birlikte çözümlerimizin yalnızca inovasyonu ve yapay zekanın benimsenmesini sağlamakla kalmayıp aynı zamanda Avrupa'nın teknolojik özerkliğini desteklemesi ve sürdürülebilirlik liderliğine katkıda bulunması sorumluluğu da geliyor."
Altyapı duyurusunun yanı sıra Mistral, adım adım mantıksal düşünme yeteneğine sahip OpenAI'nin o1 modeli ve Çin'in DeepSeek R1'ine benzer AI sistemleri olan Magistral akıl yürütme modelleri serisini tanıttı. Ancak Mistral'in baş bilim insanı Guillaume Lample, şirketin yaklaşımının rakiplerinden önemli şekillerde farklı olduğunu söylüyor.
Lample bana özel bir röportajda, "Her şeyi sıfırdan yaptık, temel olarak sahip olduğumuz uzmanlığı öğrenmek istedik, yaptığımız işte esneklik gibi," dedi. "Aslında, daha güçlü çevrimiçi takviyeli öğrenme hattında gerçekten çok verimli olmayı başardık."
Akıl yürütme süreçlerini sıklıkla gizleyen rakiplerinin aksine, Mistral'in modelleri kullanıcılara düşünce zincirinin tamamını gösterir ve en önemlisi, varsayılan olarak İngilizce yerine kullanıcının ana dilinde gösterir. Lample, "Burada kullanıcıya verilen düşünce zincirinin tamamına sahibiz, ancak kendi dillerinde, böylece gerçekten okuyabilir ve mantıklı olup olmadığına bakabilirler," diye açıkladı.
Şirket iki versiyon yayınladı: 24 milyar parametreli açık kaynaklı bir model olan Magistral Small ve Mistral'in API'si aracılığıyla erişilebilen daha güçlü bir tescilli sistem olan Magistral Medium .
Modeller, eğitim sırasında ortaya çıkan şaşırtıcı yetenekleri gösterdi. En önemlisi, Magistral Medium, eğitim süreci yalnızca metin tabanlı matematiksel ve kodlama problemlerine odaklanmış olsa bile, çok modlu akıl yürütme yeteneklerini (görüntüleri analiz etme kapasitesi) korudu.
Lample, "Tam olarak yanlışlıkla olmasa da, kesinlikle beklemediğimiz bir şekilde fark ettiğimiz bir şey, takviyeli öğrenme eğitiminin sonunda, başlangıçtaki görsel kodlayıcıyı tekrar taktığınızda, aniden, hiçbir yerden, modelin görüntüler üzerinde muhakeme yapabildiğini görüyorsunuz" dedi.
Modeller ayrıca karmaşık sorguları yanıtlamak için otomatik olarak çok adımlı internet aramaları ve kod yürütmeleri gerçekleştiren sofistike işlev çağırma yetenekleri kazandı. "Göreceğiniz şey, bunu yapan, düşünen ve sonra fark eden bir model olacak, tamam, bu bilgi güncellenebilir. Bir web araması yapayım," diye açıkladı Lample. "İnternette arama yapacak ve sonra sonuçları gerçekten geçirecek ve bunun üzerine sonuç çıkaracak ve belki, belki de cevap bu sonuçlarda değildir diyecek. Tekrar arama yapayım."
Bu davranış, belirli bir eğitim olmadan doğal olarak ortaya çıktı. Lample, "Bu, yapılacak bir sonraki şey olup olmadığına bakılmaksızın, aslında doğal olarak gerçekleştiğini gördük. Bu yüzden bizim için çok hoş bir sürpriz oldu," diye belirtti.
Mistral'ın teknik ekibi, Lample'ın eğitim altyapısında bir atılım olarak tanımladığı şeyi yaratmak için önemli mühendislik zorluklarının üstesinden geldi. Şirket, önceden var olan eğitim verilerine güvenmek yerine, yanıtlar üretirken AI modellerinin sürekli olarak gelişmesine olanak tanıyan "çevrimiçi takviyeli öğrenme" için bir sistem geliştirdi.
Temel yenilik, gerçek zamanlı olarak yüzlerce grafik işleme birimi (GPU) arasında model güncellemelerini senkronize etmeyi içeriyordu. Lample, "Yaptığımız şey, modeli GPU'lar aracılığıyla sökmenin bir yolunu bulmaktı. Yani, GPU'dan GPU'ya," diye açıkladı. Bu, sistemin genellikle gereken saatler yerine saniyeler içinde farklı GPU kümeleri arasında model ağırlıklarını güncellemesini sağlar.
Lample, "Bunu düzgün bir şekilde yapacak açık kaynaklı bir altyapı yok," diye belirtti. "Genellikle, bunu yapmaya yönelik çok sayıda açık kaynaklı girişim oluyor, ancak aşırı yavaş. Burada, verimliliğe çok odaklandık."
Eğitim süreci geleneksel ön eğitimden çok daha hızlı ve ucuz oldu. Lample, "Normal ön eğitimden çok daha ucuzdu. Ön eğitim, diğer GPU'larda haftalar veya aylar sürecek bir şeydir. Burada, buna yakın bile değiliz. Şöyle bir şeydi, buna kaç kişi koyduğumuza bağlı. Ama daha çok, bir haftadan oldukça az bir süreydi," dedi.
Mistral Compute platformu, başlangıçta Fransa'nın Essonne kentindeki bir veri merkezinde barındırılan ve Avrupa genelinde genişleme planları olan Nvidia'nın en yeni Grace Blackwell yongalarından 18.000'inde çalışacak. Nvidia CEO'su Jensen Huang, ortaklığı Avrupa'nın teknolojik bağımsızlığı için çok önemli olarak nitelendirdi.
Huang, Paris'te ortak bir duyuruda, "Her ülke kendi ülkesi için, kendi ülkesinde AI inşa etmeli," dedi. "Mistral AI ile, Avrupa genelindeki işletmelerin zekayı sektörler arasında ölçeklendirmesi için egemen platformlar olarak hizmet eden modeller ve AI fabrikaları geliştiriyoruz."
Huang, Avrupa'nın AI hesaplama kapasitesinin önümüzdeki iki yıl içinde on kat artacağını ve kıta genelinde 20'den fazla "AI fabrikası" planlanacağını öngördü. Bu tesislerden birkaçı bir gigawatt'tan fazla kapasiteye sahip olacak ve potansiyel olarak dünyanın en büyük veri merkezleri arasında yer alacak.
Ortaklık, altyapının ötesine geçerek Nvidia'nın diğer Avrupa yapay zeka şirketleri ve arama şirketi Perplexity ile birlikte, eğitim verilerinin sıklıkla sınırlı olduğu çeşitli Avrupa dillerinde akıl yürütme modelleri geliştirme çalışmalarını da kapsıyor.
Mistral Compute, AI geliştirmeyle ilgili iki önemli endişeyi ele alıyor: çevresel etki ve veri egemenliği. Platform, Avrupalı müşterilerin bilgilerini AB sınırları içinde ve Avrupa yargı yetkisi altında tutabilmelerini sağlıyor.
Şirket, yapay zeka modellerinin yaşam döngüsü boyunca karbon ayak izini değerlendirmek ve en aza indirmek için Fransa'nın ulusal ekolojik geçiş ajansı ve önde gelen bir iklim danışmanlık şirketi olan Carbone 4 ile ortaklık kurdu. Mistral, veri merkezlerine karbondan arındırılmış enerji kaynaklarıyla güç sağlamayı planlıyor.
Şirket duyurusunda, "Tesislerimizin lokasyonu olarak Avrupa'yı seçerek, büyük ölçüde karbondan arındırılmış enerji kaynaklarından yararlanma olanağına kavuşuyoruz" ifadelerine yer verdi.
Erken testler, Mistral'in akıl yürütme modellerinin mevcut sistemlere yönelik yaygın bir eleştiri olan hıza değinirken rekabetçi performans sağladığını gösteriyor. OpenAI ve diğerlerinden gelen mevcut akıl yürütme modelleri karmaşık sorgulara yanıt vermek için dakikalar alabilir ve bu da pratik faydalarını sınırlar.
"İnsanların bu akıl yürütme modeliyle ilgili genellikle hoşlanmadıkları şeylerden biri, akıllı olmasına rağmen bazen çok zaman almasıdır," diye belirtti Lample. "Burada çıktıyı gerçekten sadece birkaç saniyede, bazen beş saniyeden daha kısa sürede, bazen bundan bile daha kısa sürede görüyorsunuz. Ve bu deneyimi değiştiriyor."
Hız avantajı, yapay zeka yanıtları için dakikalarca beklemenin iş akışı darboğazlarına yol açtığı iş uygulamalarında işletmelerin benimsenmesi açısından kritik öneme sahip olabilir.
Mistral'in altyapıya geçişi, onu bulut bilişim pazarına hakim olan teknoloji devleriyle doğrudan rekabete sokuyor. Amazon Web Services , Microsoft Azure ve Google Cloud şu anda küresel bulut altyapısının çoğunluğunu kontrol ederken, CoreWeave gibi daha yeni oyuncular özellikle yapay zeka iş yüklerinde zemin kazandı.
Şirketin yaklaşımı, donanım altyapısından AI modellerine ve yazılım hizmetlerine kadar eksiksiz, dikey olarak entegre bir çözüm sunarak rakiplerinden farklıdır. Buna geliştiriciler için Mistral AI Studio , kurumsal üretkenlik için Le Chat ve programlama yardımı için Mistral Code dahildir.
Endüstri analistleri Mistral'in stratejisini bölgesel AI gelişimine yönelik daha geniş bir eğilimin parçası olarak görüyor. Huang, Avrupa'nın küresel olarak rekabetçi kalmak istiyorsa AI altyapısını acilen ölçeklendirmesi gerektiğini belirterek, Avrupa politika yapıcılarının dile getirdiği endişeleri dile getirdi.
Duyuru, Avrupa hükümetlerinin kritik AI altyapısı için Amerikan teknoloji şirketlerine olan bağımlılıkları konusunda giderek daha fazla endişe duymasıyla geldi. Avrupa Birliği, kıta genelinde AI "gigafabrikaları" inşa etmek için 20 milyar avro taahhüt etti ve Mistral'ın Nvidia ile ortaklığı bu planları hızlandırmaya yardımcı olabilir.
Mistral'in altyapı ve model yeteneklerine ilişkin ikili duyurusu, şirketin yalnızca başka bir model sağlayıcısı olmaktan ziyade kapsamlı bir AI platformu olma hedefini işaret ediyor. Microsoft ve diğer yatırımcıların desteğiyle şirket 1 milyar doların üzerinde para topladı ve genişleyen kapsamını desteklemek için ek finansman aramaya devam ediyor.
Ancak Lample, akıl yürütme modelleri için ileride daha büyük olasılıklar görüyor. "Bence içerideki ilerlemeye baktığımda ve bazı kıyaslamalarda, modelin her hafta artı %5 doğruluk elde ettiğini düşünüyorum, toplamda altı hafta gibi bir süre boyunca," dedi. "Yani çok hızlı gelişiyor, performansı iyileştirecek çok, çok, yani, çok, çok, çok küçük fikirler düşünebilirsiniz."
Amerikan AI hakimiyetine yönelik bu Avrupa meydan okumasının başarısı, nihayetinde müşterilerin egemenliğe ve sürdürülebilirliğe yerleşik sağlayıcılardan geçiş yapacak kadar değer verip vermediğine bağlı olabilir. Şimdilik, en azından, bir seçeneğe sahipler.
Patronunuzu etkilemek istiyorsanız, VB Daily sizin için burada. Şirketlerin üretken yapay zeka ile ilgili olarak düzenleyici değişikliklerden pratik dağıtımlara kadar neler yaptıklarına dair içeriden bilgiler veriyoruz, böylece maksimum yatırım getirisi için içgörüler paylaşabilirsiniz.
Gizlilik Politikamızı okuyun
Abone olduğunuz için teşekkürler. Daha fazla VB bültenine buradan göz atın.
Bir hata oluştu.

venturebeat