Claude 3.7 Sonnet firmy Anthropic mierzy się z OpenAI i DeepSeek w kolejnej wielkiej bitwie sztucznej inteligencji

Dołącz do naszych codziennych i cotygodniowych newsletterów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodących w branży relacji z AI. Dowiedz się więcej
Anthropic właśnie wystrzelił ostrzegawczy strzał w stronę OpenAI , DeepSeek i całej branży AI, wprowadzając na rynek Claude 3.7 Sonnet , model, który daje użytkownikom bezprecedensową kontrolę nad tym, ile czasu AI spędza na „ myśleniu ” przed wygenerowaniem odpowiedzi. Wydanie, obok debiutu Claude Code , agenta kodującego AI z wiersza poleceń, sygnalizuje agresywne wejście Anthropic na rynek korporacyjnej AI — taki, który może zmienić sposób, w jaki firmy tworzą oprogramowanie i automatyzują pracę.
Stawka nie mogłaby być wyższa. W zeszłym miesiącu DeepSeek zaskoczył świat technologii modelem AI, który dorównywał systemom amerykańskim za ułamek kosztów , co spowodowało spadek akcji Nvidii o 17% i wywołało alarm o amerykańskim przywództwie w dziedzinie AI. Teraz Anthropic zakłada, że precyzyjna kontrola nad rozumowaniem AI — nie tylko surowa prędkość lub oszczędności kosztów — da mu przewagę.

„Po prostu uważamy, że rozumowanie jest podstawową częścią i podstawowym komponentem SI, a nie czymś, za co trzeba osobno płacić, aby uzyskać dostęp” — powiedziała Dianne Penn, która kieruje działem zarządzania produktami badawczymi w Anthropic, w wywiadzie dla VentureBeat. „Podobnie jak ludzie, SI powinna obsługiwać zarówno szybkie odpowiedzi, jak i złożone myślenie. Na proste pytanie, takie jak „która godzina?”, powinna odpowiedzieć natychmiast. Jednak w przypadku złożonych zadań — takich jak planowanie dwutygodniowej podróży do Włoch z uwzględnieniem bezglutenowej diety — potrzebuje dłuższego czasu przetwarzania”.
„Nie postrzegamy rozumowania, planowania i autokorekty jako odrębnych zdolności” – dodała. „Tak więc jest to zasadniczo nasz sposób wyrażania tej filozoficznej różnicy… W idealnym przypadku sam model powinien rozpoznawać, kiedy problem wymaga bardziej intensywnego myślenia i dostosowywać się, zamiast wymagać od użytkowników wyraźnego wyboru różnych trybów rozumowania”.

Dane porównawcze potwierdzają ambitną wizję Anthropic. W trybie rozszerzonego myślenia Claude 3.7 Sonnet osiąga 78,2% dokładności w zadaniach rozumowania na poziomie absolwenta, co stanowi wyzwanie dla najnowszych modeli OpenAI i przewyższa DeepSeek R1.
Jednak bardziej wymowne dane pochodzą z zastosowań w świecie rzeczywistym: model uzyskał wynik 81,2% w przypadku wykorzystania narzędzi w handlu detalicznym i wykazał wyraźną poprawę w zakresie przestrzegania instrukcji (93,2%) — są to obszary, w których konkurenci albo mieli problemy, albo nie opublikowali żadnych wyników.
Podczas gdy DeepSeek i OpenAI przodują w tradycyjnych testach porównawczych matematycznych , zunifikowane podejście Claude 3.7 pokazuje, że pojedynczy model może skutecznie przełączać się między szybkimi odpowiedziami a dogłębną analizą, potencjalnie eliminując potrzebę utrzymywania przez przedsiębiorstwa oddzielnych systemów AI dla różnych typów zadań.
Moment wydania jest kluczowy. Pojawienie się DeepSeek w zeszłym miesiącu wywołało szok w Dolinie Krzemowej, pokazując, że wyrafinowane rozumowanie AI można osiągnąć przy znacznie mniejszej mocy obliczeniowej niż wcześniej sądzono. Podważyło to podstawowe założenia dotyczące kosztów rozwoju AI i wymagań infrastrukturalnych. Kiedy DeepSeek opublikował swoje wyniki, akcje Nvidii spadły o 17% w ciągu jednego dnia — inwestorzy nagle zaczęli wątpić, czy drogie chipy są naprawdę niezbędne dla zaawansowanej AI.
Dla firm stawka nie mogłaby być wyższa. Firmy wydają miliony na integrację AI ze swoimi operacjami, obstawiając, które podejście będzie dominować. Hybrydowy model Anthropic oferuje przekonującą ścieżkę pośrednią: możliwość dostrojenia wydajności AI w oparciu o zadanie, od natychmiastowych odpowiedzi obsługi klienta po złożoną analizę finansową. System utrzymuje poprzednie ceny Anthropic wynoszące 3 USD za milion tokenów wejściowych i 15 USD za milion tokenów wyjściowych, nawet z dodatkowymi funkcjami rozumowania.

„Nasi klienci starają się osiągnąć wyniki dla swoich klientów” — wyjaśnił Michael Gerstenhaber, szef platformy Anthropic. „Używanie tego samego modelu i zachęcanie do korzystania z niego na różne sposoby pozwala komuś takiemu jak Thompson Reuters na prowadzenie badań prawnych, a naszym partnerom ds. kodowania, takim jak Cursor lub GitHub, na tworzenie aplikacji i osiąganie tych celów”.
Hybrydowe podejście Anthropic stanowi zarówno ewolucję techniczną, jak i strategiczny gambit. Podczas gdy OpenAI utrzymuje oddzielne modele dla różnych możliwości , a DeepSeek koncentruje się na efektywności kosztowej , Anthropic dąży do ujednoliconych systemów, które mogą obsługiwać zarówno rutynowe zadania, jak i złożone rozumowanie. To filozofia, która może zmienić sposób, w jaki firmy wdrażają AI, eliminując potrzebę żonglowania wieloma wyspecjalizowanymi modelami.
Anthropic zaprezentował dziś również Claude Code , narzędzie wiersza poleceń, które pozwala deweloperom delegować złożone zadania inżynieryjne bezpośrednio do AI. System wymaga zatwierdzenia przez człowieka przed zatwierdzeniem zmian w kodzie, co odzwierciedla rosnące zainteresowanie branży odpowiedzialnym rozwojem AI.

„Właściwie nadal musisz zaakceptować zmiany wprowadzane przez Claude’a. Jesteś recenzentem z rękami na kierownicy” – zauważył Penn. „W zasadzie istnieje swego rodzaju lista kontrolna, którą musisz zasadniczo zaakceptować, aby model mógł podjąć określone działania”.
Ogłoszenia te pojawiają się w trakcie intensywnej konkurencji w rozwoju AI. Naukowcy ze Stanford niedawno stworzyli model rozumowania typu open source za mniej niż 50 USD, podczas gdy Microsoft właśnie zintegrował model o3-mini OpenAI z Azure. Sukces DeepSeek pobudził również nowe podejścia do rozwoju AI, a niektóre firmy badają techniki destylacji modeli, które mogłyby jeszcze bardziej obniżyć koszty.

Penn zilustrował dramatyczny postęp w możliwościach AI nieoczekiwanym przykładem: „Prosiliśmy różne wersje Claude'a, aby grał w Pokémony… Ta wersja dotarła aż do Vermilion City , złapała wiele Pokémonów, a nawet grinduje, aby awansować. Ma odpowiednie Pokémony do walki z rywalami”.
„Myślę, że zobaczycie, jak nadal wprowadzamy innowacje i naciskamy na jakość rozumowania, naciskamy na takie rzeczy jak dynamiczne rozumowanie” – wyjaśnił Penn. „Zawsze uważaliśmy to za podstawową część inteligencji, a nie coś odrębnego”.
Prawdziwym testem podejścia Anthropic będzie adopcja w przedsiębiorstwach. Granie w Pokémon może wydawać się trywialne, ale pokazuje, jakiego rodzaju adaptacyjnej inteligencji potrzebują firmy: AI, która może obsługiwać zarówno rutynowe operacje, jak i złożone decyzje strategiczne bez przełączania się między wyspecjalizowanymi modelami. Wcześniejsze wersje Claude nie mogły poruszać się poza miastem startowym gry. Najnowsza wersja buduje strategie, zarządza zasobami i podejmuje decyzje taktyczne — możliwości, które odzwierciedlają złożoność rzeczywistych wyzwań biznesowych.
Dla klientów korporacyjnych może to oznaczać różnicę między utrzymaniem wielu systemów AI do różnych zadań a wdrożeniem jednego, bardziej wydajnego rozwiązania. Następne kilka miesięcy pokaże, czy zakład Anthropic na ujednolicone rozumowanie AI zmieni kształt rynku korporacyjnego, czy stanie się kolejnym eksperymentem w szybkiej ewolucji branży.
Jeśli chcesz zaimponować swojemu szefowi, VB Daily ma dla Ciebie rozwiązanie. Dajemy Ci wewnętrzny wgląd w to, co firmy robią z generatywną sztuczną inteligencją, od zmian regulacyjnych po praktyczne wdrożenia, dzięki czemu możesz dzielić się spostrzeżeniami, aby uzyskać maksymalny zwrot z inwestycji.
Przeczytaj naszą Politykę prywatności
Dziękujemy za subskrypcję. Sprawdź więcej newsletterów VB tutaj .
Wystąpił błąd.

venturebeat