Ajan dağıtımlarınızı bozmak üzere olan gizli ölçekleme uçurumu

Yaklaşık yirmi yıldır kurumsal liderlerin güvendiği etkinliğe katılın. VB Transform, gerçek kurumsal AI stratejisi oluşturan insanları bir araya getiriyor. Daha fazla bilgi edinin
Aracılar oluşturmak ve ölçeklendirmek isteyen işletmelerin başka bir gerçeği de kabul etmeleri gerekiyor: Aracılar diğer yazılımlar gibi oluşturulmuyor.
Writer CEO'su ve kurucu ortağı May Habib'e göre, aracılar nasıl oluşturuldukları, nasıl çalıştıkları ve nasıl geliştirildikleri açısından "kategorik olarak farklıdır". Bu, uyarlanabilir sistemlerle uğraşırken geleneksel yazılım geliştirme yaşam döngüsünden vazgeçmek anlamına gelir.
Habib, Çarşamba günü VB Transform'da sahnedeyken "Ajanlar kurallara güvenilir bir şekilde uymuyor" dedi. "Sonuç odaklılar. Yorumluyorlar. Uyum sağlıyorlar. Ve davranış gerçekten yalnızca gerçek dünya ortamlarında ortaya çıkıyor."
Neyin işe yarayıp neyin yaramadığını bilmek, Habib'in yüzlerce kurumsal müşteriye kurumsal düzeyde aracılar oluşturma ve ölçeklendirme konusunda yardımcı olma deneyiminden gelir. Habib'e göre, Fortune 1000'in 350'den fazlası Writer müşterisidir ve Fortune 500'ün yarısından fazlası 2025'in sonuna kadar aracıları Writer ile ölçeklendirecektir.
Habib, güçlü çıktılar üretmek için belirsiz teknoloji kullanmanın "gerçekten kabus gibi" olabileceğini söyledi — özellikle de ajanları sistematik olarak ölçeklendirmeye çalışırken. İşletme ekipleri ürün yöneticileri ve tasarımcıları olmadan ajanları devreye sokabilse bile, Habib ajanlarla işbirliği yapmak, ajanları oluşturmak, yinelemek ve sürdürmek için bir "PM zihniyetine" hala ihtiyaç olduğunu düşünüyor.
"Ne yazık ki ya da ne mutlu ki, bakış açınıza bağlı olarak, BT, iş ortaklarını bu yeni inşa etme biçimine yönlendirmezlerse zor durumda kalacak."
>> Transform 2025 ile ilgili tüm haberlerimizi burada görün <<Düşüncedeki değişimlerden biri, acentelerin sonuç odaklı doğasını anlamaktır. Örneğin, birçok müşterinin acentelerden hukuk ekiplerine sözleşmeleri gözden geçirme veya kırmızı çizgi çizme konusunda yardımcı olmalarını istediğini söyledi. Ancak bu çok açık uçludur. Bunun yerine, hedef odaklı bir yaklaşım, bir acenteyi sözleşmeleri gözden geçirme ve kırmızı çizgi çizme için harcanan zamanı azaltacak şekilde tasarlamak anlamına gelir.
Habib, "Geleneksel yazılım geliştirme yaşam döngüsünde, çok öngörülebilir adımlardan oluşan kesin bir dizi için tasarım yapıyorsunuz," dedi. "Bu, daha kesin bir şekilde girdi, girdi çıkışıdır. Ancak aracılarla, aracı davranışını şekillendirmeye çalışıyorsunuz. Bu nedenle, daha az kontrollü bir akış ve çok daha fazla bağlam sağlama ve aracı tarafından karar almaya rehberlik etme arayışındasınız."
Başka bir fark, ajanlara iş mantığıyla talimat veren bir plan oluşturmaktır, onlara takip edecekleri iş akışları sağlamak yerine. Bu, akıl yürütme döngüleri tasarlamayı ve istenen davranışları teşvik eden süreçleri haritalamak için konu uzmanlarıyla iş birliği yapmayı içerir.
Ölçeklenebilir ajanlar hakkında çok konuşulurken, Writer hala çoğu müşteriye bunları tek tek oluşturmada yardımcı oluyor. Bunun nedeni, öncelikle ajanın sahibi ve denetçisinin kim olduğu, kimin alakalı kaldığından emin olduğu ve hala istenen sonuçları üretip üretmediğini kontrol ettiğiyle ilgili soruları yanıtlamanın önemli olmasıdır.
Habib, "İnsanların acenteleri oluşturma ve ölçeklendirme konusunda yeni bir yaklaşım olmadan çok, çok hızlı bir şekilde ulaştıkları bir ölçekleme uçurumu var," dedi. "İnsanların, kuruluşlarının acenteleri sorumlu bir şekilde yönetme becerisi, departmandan departmana gerçekleşen geliştirme hızını gerçekten geride bıraktığında ulaşacakları bir uçurum var."
Kalite güvencesi, aracılar için de farklıdır. Nesnel bir kontrol listesi yerine, aracı değerlendirmesi ikili olmayan davranışları hesaba katmayı ve aracıların gerçek dünya durumlarında nasıl davrandıklarını değerlendirmeyi içerir. Bunun nedeni, başarısızlığın her zaman belirgin olmaması ve bir şeyin bozulup bozulmadığını kontrol etmek kadar siyah ve beyaz olmamasıdır. Bunun yerine, Habib bir aracının iyi davranıp davranmadığını kontrol etmenin, güvenlik önlemlerinin işe yarayıp yaramadığını sormanın, sonuçları ve niyeti değerlendirmenin daha iyi olduğunu söyledi: "Buradaki amaç mükemmellik değil. Davranışsal güven, çünkü burada çok fazla öznellik var."
Habib, yinelemenin önemini anlamayan işletmelerin "her iki tarafı da yıpratan ve artık oynamak istememelerine yol açan sürekli bir tenis oyunu" oynadıklarını söyledi. Ekiplerin, temsilcilerin mükemmel olmaktan uzak olmasıyla ve "onları güvenli bir şekilde başlatmak, hızlı çalıştırmak ve tekrar tekrar yinelemek" ile daha fazla ilgilenmeleri de önemlidir.
Zorluklara rağmen, AI aracılarının kurumsal işletmeler için yeni gelir elde etmeye yardımcı olduğu örnekler zaten var. Örneğin, Habib, Writer ile aracı tabanlı bir sistem geliştirmek için iş birliği yapan büyük bir bankadan bahsetti ve bu, yeni müşterileri birden fazla ürün hattına dahil ederek 600 milyon dolar değerinde yeni bir satış hattıyla sonuçlandı.
Agentic bakım da farklıdır. Geleneksel yazılım bakımı, bir şey bozulduğunda kodu kontrol etmeyi içerir, ancak Habib, AI ajanlarının davranışı şekillendirebilecek her şey için yeni bir tür sürüm kontrolü gerektirdiğini söyledi. Ayrıca, uygun bir yönetim ve gereksiz maliyetlere katlanmak yerine ajanların zaman içinde yararlı kalmasını sağlamayı gerektirir.
Habib, modeller AI ajanlarına temiz bir şekilde eşlenmediği için bakımın istemleri, model ayarlarını, araç şemalarını ve bellek yapılandırmasını kontrol etmeyi içerdiğini söyledi. Ayrıca girdiler, çıktılar, akıl yürütme adımları, araç çağrıları ve insan etkileşimleri arasında yürütmeleri tam olarak izlemek anlamına gelir.
Habib, "Bir [büyük dil modeli] LLM istemini güncelleyebilir ve git geçmişinde hiçbir şey değişmemiş olmasına rağmen aracının tamamen farklı davrandığını görebilirsiniz," dedi. "Model bağlantıları değişir, alma dizinleri güncellenir, araç API'leri gelişir ve aniden aynı istem beklendiği gibi davranmaz... Hayaletleri hata ayıklıyormuşuz gibi hissedebiliyoruz."
Patronunuzu etkilemek istiyorsanız, VB Daily sizin için burada. Şirketlerin üretken yapay zeka ile ilgili olarak düzenleyici değişikliklerden pratik dağıtımlara kadar neler yaptıklarına dair içeriden bilgiler veriyoruz, böylece maksimum yatırım getirisi için içgörüler paylaşabilirsiniz.
Gizlilik Politikamızı okuyun
Abone olduğunuz için teşekkürler. Daha fazla VB bültenine buradan göz atın.
Bir hata oluştu.

venturebeat