Rozpakowywanie agentów AI

W ciągu ostatnich sześciu miesięcy OpenAI, Anthropic, Google i inni wypuścili agentów przeglądających strony internetowe, którzy są zaprojektowani do samodzielnego wykonywania zadań, przy minimalnym udziale człowieka. Dyrektor generalny OpenAI Sam Altman nazwał nawet agentów AI „następnym gigantycznym przełomem”. W dzisiejszym odcinku zagłębimy się w to, co odróżnia tych agentów od innych form inteligencji maszynowej i czy ich możliwości są w stanie sprostać oczekiwaniom.
Możesz śledzić Michaela Calore na Bluesky na @snackfight , Lauren Goode na Bluesky na @laurengoode i Willa Knighta na Bluesky na @willknight . Napisz do nas na [email protected] .
Jak słuchaćPodcastu z tego tygodnia możesz zawsze posłuchać za pomocą odtwarzacza audio na tej stronie, ale jeśli chcesz zapisać się bezpłatnie i otrzymywać wszystkie odcinki, oto jak to zrobić:
Jeśli korzystasz z iPhone'a lub iPada, otwórz aplikację o nazwie Podcasts lub po prostu dotknij tego linku . Możesz również pobrać aplikację, taką jak Overcast lub Pocket Casts i wyszukać „uncanny valley”. Jesteśmy również na Spotify .
TranskrypcjaUwaga: Jest to zapis automatyczny, który może zawierać błędy.
Michael Calore: Cześć, tu Mike. Zanim zaczniemy, chciałbym przypomnieć, że chcemy usłyszeć od Ciebie. Czy masz jakieś pytania dotyczące AI, polityki lub prywatności, które zaprzątają Twoją głowę? A może po prostu temat, o którym chciałbyś, żebyśmy porozmawiali w programie? Jeśli tak, możesz do nas napisać na adres [email protected] . To [email protected] . Jeśli słuchasz i podobają Ci się nasze odcinki, oceń program i zostaw recenzję w wybranej przez siebie aplikacji do podcastów. To naprawdę pomaga innym ludziom nas znaleźć. Cześć wszystkim, jak się macie?
Lauren Goode: Mam się dobrze. Trzymam się. Jak się masz, Mike?
Michael Calore: Czuję się świetnie. Czuję się dobrze. W tym tygodniu w programie mamy Willa Knighta.
Lauren Goode: Tak, czuję się z tym świetnie. Tęsknię za Katie, ale wiemy, że Katie wyruszyła w poszukiwaniu więcej francuskiego masła. Dosłownie, pojechała do Francji.
Michael Calore: Myślę, Will, że przyniosłeś nam croissanta, prawda?
Will Knight: Tak. Tak, na pewno. Świeżo upieczony.
Lauren Goode: Dziękuję za to. Możesz już zostać w programie.
Michael Calore: To Uncanny Valley z WIRED, program o ludziach, potędze i wpływie Doliny Krzemowej. Dzisiaj porozmawiamy o agentach AI i o tym, dlaczego tak wiele firm technologicznych stawia na nich. W ciągu ostatnich sześciu miesięcy OpenAI, Anthropic, Google i inni wypuścili agentów przeglądarek internetowych, którzy są zaprojektowani do samodzielnego wykonywania zadań przy minimalnym udziale człowieka. Dyrektor generalny OpenAI, Sam Altman, nazwał agentów AI „następnym gigantycznym przełomem”. Według szacunków prawie połowa firm technologicznych już przyjmuje lub w pełni wdraża agentów ze sztuczną inteligencją. W tym tygodniu zagłębimy się w to, co odróżnia tych agentów od innych form inteligencji maszynowej i czy ich możliwości są w stanie sprostać oczekiwaniom. Jestem Michael Calore, dyrektor ds. technologii konsumenckich i kultury w WIRED.
Lauren Goode: Nazywam się Lauren Goode i jestem starszą korespondentką w WIRED.
Will Knight: Nazywam się Will Knight i jestem starszym autorem w WIRED.
Michael Calore: Chciałbym zacząć od pytania, czy któreś z was miało ostatnio doświadczenia z agentami?
Lauren Goode: Niedawno miałam pewne doświadczenie z Google Duplex. Pamiętasz?
Michael Calore: Jasne.
Lauren Goode: OK. To była wczesna wersja tego. Wyszło około 2018 roku; pisaliśmy o tym wtedy w WIRED. Ale ostatnio próbowałam zarezerwować stolik w restauracji, do której ty i ja poszliśmy na twoje urodziny. Wegańskie sushi. To już jest najbardziej San Francisco-ski podcast w historii. Rozmawiamy o wegańskim sushi i o tym, jak nieświadomie wysłałam agenta AI, żeby spróbował zrobić rezerwację za mnie.
Michael Calore: Jak to było nieświadome?
Lauren Goode: Ponieważ właśnie zrobiłam coś bardzo ludzkiego, kiedy weszłam na stronę internetową i wpisałam „chciałabym dokonać rezerwacji dla takiej liczby osób w tym czasie”. Nieświadomie przekierowało to do Asystenta Google. Następnie powiedziało: „Próbujemy restauracji w Twoim imieniu”.
Michael Calore: Och.
Lauren Goode: I próbował dalej, a potem wysłał mi powiadomienie. I próbował dalej, a potem wysłał mi powiadomienie. Pracował w tle, próbując dokonać rezerwacji. Nie udało mu się pomyślnie zakończyć rezerwacji. Czy to się liczy?
Michael Calore: Tak, to się liczy.
Lauren Goode: To jest agent AI? Pracował w moim imieniu.
Michael Calore: Tak.
Lauren Goode: Will, a co z tobą?
Will Knight: Bawiłem się narzędziami do kodowania AI, a przede wszystkim Claude Code, który jest, moim zdaniem, dobrym przykładem agenta. Ponieważ robi wszystkie te fajne rzeczy, jak nie tylko pisze kod, ale edytuje pliki, przenosi je. Używa twojego terminala. Usuwa rzeczy, jeśli masz pecha. To jest ta agentyczna rzecz, z którą się bawiłem.
Lauren Goode: Mówisz, że zajmujesz się kodowaniem wibracji.
Will Knight: Tak, tak. To było fascynujące. Kodowanie wibracji to termin, który wymyślił bardzo znany badacz AI, Andrej Karpathy, aby opisać w zasadzie tworzenie całych programów, gotowego oprogramowania, po prostu poprzez podpowiadanie modelu. Te modele zawsze były w stanie automatycznie uzupełniać kod, ale w zeszłym roku stały się tak dobre w kodowaniu, że mogą tworzyć całe projekty obejmujące wiele plików i wiele folderów i wszystko. Właściwie zacząłem to robić z moim dzieckiem, ponieważ pomyślałem: „Jak nauczyć dziecko rozumieć AI?”. I zawsze uważałeś, że dobrym pomysłem jest, aby zmusić je do kodowania. Uwielbia gry, więc pomyślałem: „Zakodujmy kilka gier”.
Michael Calore: Cóż, moje doświadczenie jest o wiele mniej techniczne, ponieważ niedawno musiałem dokonać zmiany w rezerwacji lotu za pośrednictwem aplikacji Southwest.
Lauren Goode: Przepraszam.
Michael Calore: Tak. Cóż, było w porządku.
Lauren Goode: Moje kondolencje.
Michael Calore: To mnie skłoniło do chatbota. To było coś w stylu „porozmawiaj z naszym chatbotem, jeśli potrzebujesz pomocy”. Pomyślałem sobie „Och, to będzie wkurzające”. Właściwie było w porządku. Zajęło to pięć minut. Podałem mu swój numer potwierdzenia, informacje o locie. Potem powiedział „Jaką zmianę chcesz wprowadzić?” Powiedziałem „Chciałbym to zrobić”. Powiedzieli „Możemy to zrobić dla ciebie bez opłat”. Pomyślałem „Świetnie”. „Czy chcesz to zarezerwować?” Tak. „OK, jest zarezerwowane. Oto twoja nowa karta pokładowa. Musisz się zameldować, ale oto link, aby się zameldować i otrzymać nową kartę pokładową”. Pomyślałem sobie „Wow”.
Lauren Goode: Czy to jest agent, o którym mówimy? To agent obsługi klienta.
Michael Calore: Zgadza się.
Lauren Goode: I to jest bot, który to powiela. Ale ta nowa era agentowej AI, firmy technologiczne pozyskujące miliony dolarów i mające wyceny w miliardach, ponieważ przechodzą na agentów, to nie jest dokładnie to, prawda?
Michael Calore: Jasne. To dobre pytanie dla Willa. Czy możemy rzucić ci to pytanie, Will? Jaka jest różnica między agentem AI, o którym mówimy, a tradycyjnym chatbotem, którego większość ludzi doświadczyła?
Will Knight: Tak. Chatbot generuje tekst i można się z nim komunikować za pośrednictwem tej bardzo, bardzo wąskiej domeny tekstu. To było niezwykle potężne. Rewolucja, którą widzieliśmy, opiera się na tych modelach językowych, które mogą dawać niezwykle spójne i dobre odpowiedzi na pytania, co nie jest tym samym, co system AI, który jest z natury agentem. Jeśli cofniesz się w historii AI, tak naprawdę wielu badaczy zawsze pracowało nad ideą, że inteligencja z natury obejmuje sprawczość. Ludzie nie są rzeczami, które po prostu mówią. Próbują i wykonują działania, ty próbujesz i rozwiązujesz problemy. To był od dawna zamierzony cel. To dziwna dziwność, że mieliśmy te modele językowe, które są tak ograniczone i staromodne. Wiele z tego, co widzimy, jeśli chodzi o agentów, to w zasadzie ludzie biorący modele językowe i wykorzystujący fakt, że są bardzo ogólne i bardzo elastyczne, aby przyjąć złożone polecenie i wywołać pewne działania. Prawdziwym krokiem, jakiego pragną firmy, jest to, aby modele same decydowały i mogły same formułować swoje działania, bardziej jak inteligentne byty.
Lauren Goode: Człowiek nadal jest w pętli, ale człowiek wprowadza polecenie lub monit, a następnie się wycofuje. Agent wykonuje mnóstwo rzeczy związanych ze sztuczną inteligencją, podczas gdy ty robisz inne rzeczy. To jest obietnica, że będą w stanie sprawić, że wszyscy będziemy hiperproduktywni.
Will Knight: Tak. W idealnym przypadku miałbyś agenta, który zadzwoniłby do linii lotniczych w twoim imieniu. Mówisz mu, co chcesz zrobić, a on idzie i prowadzi negocjacje za ciebie. Możesz też dawać mu bardziej otwarte polecenia lub to, co chcesz osiągnąć, a on wymyśla, jak to zrobić za ciebie. Modele językowe są tak ogólne, tak zdolne, że teoretycznie powinny być w stanie to zrobić. Ale jest kilka naprawdę kluczowych pułapek, jeśli chodzi o to, jak próbujesz odtworzyć ludzką agencję, ponieważ na świecie dzieje się o wiele więcej niż tylko język. Agencja w rzeczywistości obejmuje coś więcej niż tylko próbę rozwiązania indywidualnego problemu, ponieważ angażuje innych ludzi, co ją komplikuje.
Michael Calore: Mówiąc delikatnie.
Will Knight: Tak.
Michael Calore: Skoro mowa o modelach, wygląda na to, że cała Dolina Krzemowa zainwestowała w rozwój własnych agentów AI, ale kto jest obecnie głównym graczem?
Will Knight: Główni gracze są oczywisti. OpenAI, Anthropic, Google. Myślę, że Amazon jest dobrym czarnym koniem w tym wyścigu. Zatrudnili kilku ekspertów z OpenAI, którzy stworzyli startup agentów. Mają laboratorium, w którym próbują zbudować wielu agentów. Jedną z kluczowych rzeczy dla tych firm jest to, skąd czerpiesz dane. Wszyscy rozpaczliwie próbują dowiedzieć się, jak zdobyć dane do szkolenia tych agentów. Zamiast mieć tylko tekst, chcesz przykładów rzeczy, które robią ludzie. Amazon ma naprawdę sporo dobrych przykładów tego, ludzi robiących rzeczy na swoich stronach. Są dobrym graczem.
Lauren Goode: Cóż, w świecie kodowania również istnieją firmy takie jak Cursor. Opowiedz nam o całym tym świecie, skoro jesteś w vibe kodowania ze swoim synem.
Will Knight: Tak. Tak, jest wiele startupów, które naprawdę jechały na plecach innych firm AI, ale naprawdę skupiły się na kodowaniu. Myślę, że po prostu dlatego, że to tak szybko się rozwinęło, udało im się wykroić te nisze. Plotki głoszą, że OpenAI chce przejąć jedną z tych firm, Windsurf, za około trzy miliardy. Co daje ci wskazówkę, jak udało im się stworzyć dla siebie naprawdę świetny biznes.
Lauren Goode: Wydaje się, że na każdym spotkaniu informacyjnym, w którym uczestniczymy, jakaś firma rozmawia o agentach.
Michael Calore: Tak.
Lauren Goode: To też się waha. To każda firma od Nvidii, przez Microsoft, po dobrze finansowane startupy. Nawet na początku tego tygodnia, firma o nazwie Glean, jestem pewna, że o niej słyszeliście. To firma, która stworzyła wyszukiwarkę dla aplikacji korporacyjnych. Właśnie pozyskali 150 milionów w rundzie finansowania serii F. Obecnie są wyceniani na 7,2 miliarda dolarów. Teraz cała ich działalność to agenci. Wszystko kręci się wokół agentów.
Will Knight: Myślę, że sposób myślenia o tym jest taki, kto naprawdę buduje modele, które próbują nauczyć się ogólnej agencji, którą widzisz w modelu języka, a mianowicie OpenAI, te firmy bazujące na modelu. Możesz wrócić do poprzedniej ery w AI, kiedy mieliśmy niektóre z tych systemów AI do gier, takich jak AlphaZero. To wykorzystywało uczenie się przez wzmacnianie, ten proces eksperymentowania. Ale to było zasadniczo agentyczne. Działa tylko w bardzo ograniczonym świecie gry planszowej, ale podejmuje działania, wymyśla, jak je podjąć. To, co teraz widzimy w tych firmach AI, odzwierciedla to lub w pewien sposób do tego wraca, ponieważ próbują zmusić je do rozumowania do konkretnej odpowiedzi, do konkretnego celu końcowego.
Michael Calore: Jeśli pomyślimy o roli, jaką agenci AI mogliby odegrać w dłuższej perspektywie, wiele firm, o których mówimy, zaczyna od obsługi klienta. Zaczynają od: OK, masz proste pytanie, potrzebujesz czegoś prostego. Mogę to dla ciebie rozgryźć, mogę to dla ciebie wykonać. Myślę, że to właśnie tam poczyniono większość wczesnych kroków. Gartner, firma zajmująca się badaniem rynku technologii, opublikowała szacunki, że agenci AI rozwiążą 80% typowych zapytań dotyczących obsługi klienta do roku 2029. To cztery lata od teraz, agenci AI będą wykonywać wszystkie nasze zadania związane z obsługą klienta. Na podstawie niektórych z tych przykładów, o których mówiliśmy, wydaje się, że automatyzacja zadań obecnie wykonywanych przez pracowników, którzy są ludźmi, jest tutaj wspólnym wątkiem.
Will Knight: Tak. Myślę, że obsługa klienta jest oczywistym punktem wyjścia, ponieważ obejmuje ona wykorzystanie modeli językowych, w których są genialne, czyli rozmawianie z ludźmi, a następnie próbowanie wykonania dość ograniczonej liczby rzeczy. Wiele z tych firm, dużych graczy AI, rozważa przejście od kodowania do sposobu automatyzacji pracy biurowej. W pracy biurowej jest mnóstwo powtarzalnych zadań. Teoretycznie można by użyć tych modeli jako spoiwa, aby dowiedzieć się, co ktoś próbuje zrobić, a następnie to powtórzyć. W świecie kodowania istnieje już ogromna obawa, że wyeliminuje to wiele miejsc pracy. Myślę, że jest duża szansa, że obejmie to również znacznie więcej rutynowej pracy umysłowej.
Lauren Goode: Cóż, fajnie było nagrywać ten podcast z wami wszystkimi.
Michael Calore: Skupialiśmy się głównie na tym, jak agenci AI wychodzą i wykonują różne czynności, takie jak surfowanie po sieci, dzwonienie do restauracji lub wykonywanie jakiegoś zadania w produkcie Microsoft Office. Ale jestem ciekaw, jak wygląda świat agentowej AI w naszych domach, na naszych urządzeniach fizycznych. Ostatnio wiele osób o tym myśli, ponieważ OpenAI właśnie ogłosiło, że zawarło umowę z Jony Ive, byłym i wieloletnim szefem ds. projektowania w Apple, w celu przejęcia nowego startupu, który uruchomił, aby zbudować nową klasę urządzeń AI do domu. Co sądzimy o tym rozwoju?
Lauren Goode: Trudno powiedzieć, ponieważ nie wiemy jeszcze, jaką dokładnie przyjmie formę. Myślę, że to jest reprezentatywne dla nowej generacji startupów i startupów sprzętowych, które będą istnieć, aby służyć tym AI. Są budowane od podstaw z myślą o przyszłości sztucznej inteligencji i obliczeń otoczenia. Nie wiemy jeszcze, jaką dokładnie przyjmie formę. Czy będzie na twoim komputerze stacjonarnym, czy na twoim ciele, a może na obu. Cóż, doceniam jedno, myślę, że to Jony Ive powiedział coś w stylu: „Wszyscy możemy się zgodzić, jesteśmy trochę zbyt przywiązani do naszego iPhone'a”. Rzecz, którą wynaleźli, teraz brzmi: „Musimy rozwiązać problem rzeczy, którą wynaleźliśmy”. Ale chodzi o to, czy AI faktycznie może zrobić wystarczająco dużo, aby uwolnić nas od konieczności ciągłego siedzenia głową w dół lub twarzą w ekran, faktycznie wykonując czynności? Czy technologia może zrobić coś z tego za nas? A następnie uwolnić nas do innych rzeczy. To zawsze było w Dolinie Krzemowej, jedną z obietnic AI. Pamiętam, jak rozmawiałem z Astro Tellerem z Google X lata temu i zapytałem go: „Cóż, co to oznacza dla miejsc pracy?” A on w zasadzie odpowiedział: „Cóż, dzięki AI ludzie po prostu awansują”. To zawsze było naprawdę pogodne, optymistyczne spojrzenie Doliny Krzemowej na AI. Myślę, że powstanie nowa kategoria miejsc pracy, a także zadań, o których być może jeszcze nie pomyśleliśmy, ale nadal nie mamy pojęcia, jak to faktycznie będzie działać w naszym codziennym życiu.
Michael Calore: Tak. Ponieważ mam wrażenie, że ludzie próbują tego od dawna. Za każdym razem, gdy widzieliśmy demo kolejnej wersji Siri, albo kolejnej wersji Alexy, albo kolejnej wersji Asystenta Google, zawsze była demonstracja, w której proszono głośnik, inteligentny głośnik sterowany głosem, o zamówienie pizzy.
Lauren Goode: Tak, to była pizza i Uber, to zawsze były przykłady.
Michael Calore: To są umowy, które producenci urządzeń zawarli z firmami i zakodowali to. Kiedy pytasz Alexę „Czy możesz zamówić pizzę”, nie dzwoni do Dominoes i głos Alexy nie zamawia pizzy za ciebie. Po prostu robi to w aplikacji internetowej, zasadniczo za pośrednictwem API. Myślę, że kiedy mówisz o tym, czym jest następna generacja tego, to możesz poprosić ją o zrobienie czegokolwiek. Co to jest za rzecz, o którą pytasz? To jakieś urządzenie, które znajduje się obok twojego komputera i telefonu? Dlaczego musi to być oddzielne urządzenie? Dlaczego może to być po prostu twój komputer i twój telefon, to jest najważniejsze pytanie, które mam. Czy potrzebujemy czegoś, co prawdopodobnie będzie kosztować kilkaset dolarów, co prawdopodobnie będzie bardzo piękne i będzie robić wiele z tego, co robią dwa inne urządzenia, które już posiadamy? Naprawdę nie wiem. Wszyscy są tym podekscytowani, ponieważ Jony Ive i Sam Altman połączyli siły.
Lauren Goode: Tak. Staje się mechanizmem dostarczania tego, czym jest ta nowa era informatyki. Myślę też, że przykłady, o których mówimy, to przyszłość w stylu Wall-E. Jak leniwi możemy być, skoro wysyłamy sztuczną inteligencję i uczenie maszynowe, aby robiły to za nas? Podczas gdy będzie też miejsce na to, ile jeszcze mogę się nauczyć? Jakiego rodzaju wiedzę mogę uzyskać? Co mogę zrobić inaczej, ponieważ sztuczna inteligencja mi pomaga? Od dawna istnieje obietnica ze strony konsumentów, że zmieni to codzienne życie, wykorzystując te małe niedogodności, które mamy teraz. Ale myślę, że prawdziwe zyski to, po pierwsze, nie chcę brzmieć zbyt optymistycznie, ponieważ nie jestem, ale czy możemy zamknąć luki w wiedzy, ponieważ sztuczna inteligencja faktycznie nam w tym pomoże?
Will Knight: Tak. Myślę, że jeśli chodzi o OpenAI i Jony'ego Ive'a, modele stają się coraz lepsze w interpretowaniu świata wizualnego i interakcji za pomocą mowy. Myślę, że w etosie jest taka idea, że możesz mieć zupełnie nowy, nowy interfejs, możesz całkowicie przeprojektować interfejs. Nie masz tego graficznego interfejsu użytkownika. Bóg wie, co wymyślą. Google zaprezentował to w ramach Project Astra, gdzie nosisz te okulary i możesz rozmawiać o tym, co cię otacza. Próbowałem tego. To robi wrażenie. Tak, może są nowe sposoby zamawiania pizzy za jego pomocą. Ale nie mogę przestać myśleć o tym, że potrzebują danych o tym, co ludzie robią coraz częściej, aby również szkolić te modele. Czuję, że producenci sprzętu mają tak wiele interesujących danych. Nie mają tendencji do korzystania z nich ze względu na kwestie prywatności, ale może OpenAI znajdzie sposób. Następnie w kwestii tego, jak szkolisz, luka w wiedzy, myślę, że to naprawdę, naprawdę ważny punkt, ponieważ automatyzacja często powoduje zanik umiejętności ludzi. Widzisz to w autopilocie w samolotach. Wtedy zdecydowanie widzisz programistów mówiących, że tracą umiejętności, ponieważ polegają na tym zbyt mocno. Co to oznacza dla siły roboczej?
Lauren Goode: Jasne. Jeśli wszyscy ci agenci AI uwolnią nas do robienia innych rzeczy, to do czego dokładnie nas uwolnią? Jak wypełnimy ten czas? W naszym ultrakapitalistycznym, niektórzy mogą to nazwać końcowym stadium kapitalistycznego społeczeństwa, odpowiedź brzmi prawdopodobnie: „Cóż, możesz po prostu być bardziej produktywny. Możesz po prostu robić więcej, więcej, więcej”. Myślę, że to od nas, ludzi, będzie zależało, czy się temu przeciwstawimy i powiemy: „Oto, jak naprawdę chcemy wypełniać nasz czas”. Będą też przez jakiś czas te małe wąskie gardła, które moim zdaniem sprawią, że będzie to bardziej skomplikowane niż cokolwiek innego. Kiedy byłem w Google IO kilka tygodni temu, dostałem demo, Will, ich Project Mariner. Widziałeś to już?
Will Knight: Tak, próbowałem. Tak.
Lauren Goode: Próbowałaś? Nie wiem, czy to była wersja demo, którą ci dali, ale w doświadczeniu, które widziałam, zeskanowało przepis na koktajl. Następnie automatycznie pobrało składniki koktajlu i umieściło je w koszyku zakupowym Instacart. Ale potem nastąpiło wąskie gardło, ponieważ nie było uwierzytelniania konta Instacart. To było takie: „Och, czekaj, musimy się zalogować”. Potem jakiś demo-er próbował zalogować się do Instacart. „Ale spójrz, to takie płynne”. Ja na to: „Nie, dosłownie mogłam to po prostu dodać do Instacart”.
Will Knight: Tak. Ich przykłady zawsze wydają się obejmować kupowanie czegoś z jakiegoś powodu.
Michael Calore: Dlaczego uważamy, że w Dolinie Krzemowej tak bardzo skupiamy się na agentach AI? Czy to tendencja Doliny do ciągłego szukania nowego celu, do którego można się ścigać? Czy to oznaka czegoś większego? Czy to jest to, co VC najbardziej interesują w finansowaniu? Jaki jest tego powód?
Will Knight: Z mojej perspektywy jednym z głównych powodów jest to, że wracając do historii AI, jest to naprawdę kolejny krok, który można wykonać w budowaniu czegoś, co zbliża się do ludzkiej AI lub AGI, czy jakkolwiek chcesz to nazwać. Wielu badaczy jest bardzo zainteresowanych zrobieniem tego. Myślę, że jest też mnóstwo potencjału. Rozmowa z chatbotem jest przydatna, jeśli chcesz zrobić wiele rzeczy, odpowiedzieć na wiele pytań. Ale pomysł, że można zautomatyzować wiele prac lub przyziemnych obowiązków, jest potencjalnie cenny.
Lauren Goode: Tak. Myślę, że jeśli jesteś po stronie startupów, to właśnie tam teraz płyną pieniądze. Od jakiegoś czasu jesteśmy w erze, w której stopy procentowe są naprawdę wysokie. Dla niektórych startupów nie było łatwo pozyskać kapitał. Na rynku IPO nastąpiła pewna przerwa, która nieco ostygła. Chociaż teraz są oznaki, że znów się rozkręca. Myślę, że groźba taryf wciąż wisi nad głowami ludzi w Dolinie Krzemowej. Jeśli iterowałeś swoje oprogramowanie i nagle możesz powiedzieć swoim potencjalnym inwestorom: „Ale czekaj. Przechodzimy na agentów. Robimy tę agentyczną sztuczną inteligencję. Będziemy mogli sprzedawać to oprogramowanie innym firmom, a także usprawnimy nasze własne procesy i obniżymy nasze własne koszty ogólne”. To prawdopodobnie droga do pozyskania kapitału w tej chwili. Czy część z tego to szum? Jasne, że tak. Ale jak mówi Will, ponieważ jesteś tak zaangażowany w badania i rozwój tego tematu, faktycznie widać pewne naprawdę znaczące postępy.
Michael Calore: Zróbmy sobie teraz przerwę i zaraz wrócimy. Rozwój agentów idzie pełną parą, ale jak już mówiliśmy, obecni agenci, których możemy używać, mają pewne istotne ograniczenia. Ale szybko, jakie są inne obawy związane z rozwojem agentów AI? Nie tylko dotyczące użyteczności, ale także innych rzeczy, które robią.
Lauren Goode: Cóż, myślę, że niezawodność jest z pewnością jednym z problemów, ponieważ nadal podlegają tym samym halucynacjom, błędom, a nawet pochlebstwom, co LLM. Wprowadzasz do niego również o wiele bardziej złożone zapytania, ponieważ nie prosisz go tylko o przeprowadzenie wyszukiwania. Prosisz go o wykonanie wielu kroków w określonych warunkach. Istnieją również obawy dotyczące wysokich kosztów mocy obliczeniowej. A potem jest sprzedaż samego produktu. The Information niedawno podało, że OpenAI może pobierać do 20 000 USD miesięcznie za niektórych ze swoich bardziej wyspecjalizowanych agentów AI. Podobno są to agenci, którzy byliby w stanie wykonywać zadania na poziomie eksperta absolwenta studiów doktoranckich, rzekomo. Z jednej strony jest to naprawdę, naprawdę drogie. Z drugiej strony nasz kolega Paresh Dave donosił, że niektórzy ludzie w branży uważają, że to wcale nie są takie duże pieniądze. Ponieważ ostatecznie, jeśli ci agenci zastąpią stanowiska pracy, co mogą zrobić, to zaoszczędzisz na wszystkich tych kosztach wynagrodzeń. To może być w rzeczywistości okazja. Teraz jednak ceny są trochę szokujące.
Will Knight: Tak, myślę, że to prawda. Jest wiele innych problemów, rzeczy, które mogą pójść nie tak i prawdopodobnie pójdą nie tak. Rozmawiałem z wieloma badaczami... Rozmawiałem z Zico Kolterem z CMU, który jest również w zarządzie OpenAI, który badał bezpieczeństwo agentów i właśnie wprowadzał agentów, którzy będą, w idealnym przypadku, w przyszłości wchodzić w interakcje z innymi agentami. Masz ten efekt wzmacniający, który może być bardzo trudny do przewidzenia. Jak mówi Lauren, również pomysł, że te rzeczy kupują rzeczy, z natury czyni je o wiele bardziej atrakcyjnym celem dla hakerów. Jeśli masz coś takiego jak Mariner korzystający z sieci, naprawdę ciekawie jest pomyśleć o pomyśle, że ludzie być może spróbują wymyślić na nowo SEO, aby pracować dla agentów. Jednym z bardziej podstawowych problemów, myślę, jest to, że tak naprawdę nie replikują one ludzkiej agencji. Jest naprawdę interesująca książka na ten temat, aby zagłębić się w szczegóły, zatytułowana The Evolution of Agency. Gdzie jeśli spojrzysz na zwierzęta i jak ewoluowała ich sprawczość, kiedy dojdziesz do ludzi, istnieje bardzo fundamentalna różnica w sposobie działania ludzkiej sprawczości i polega ona na współpracy z innymi ludźmi. Polega ona na współpracy i świadomości, że często trzeba poświęcić coś, aby pracować razem. Masz takie rzeczy jak poczucie winy, masz empatię, która ewoluowała. Te modele, widzimy przykłady modeli robiących naprawdę szalone rzeczy w sztucznych przykładach, gdzie mówi się im, że zostaną wyłączone, a następnie będą kogoś szantażować. To niekoniecznie jest przykład złego modelu, może to być po prostu przykład modelu, który nie nauczył się, jak oczekujemy, że osoba będzie się zachowywać przez cały czas. Tak, to może mieć wiele nieprzewidzianych konsekwencji.
Michael Calore: Myślę, że moim największym zmartwieniem jest coś, o czym wspomniałaś, Lauren, czyli fakt, że wraz ze wzrostem szumu i emocji wokół agentów AI, wiele firm będzie postrzegać je jako sposób na obniżenie kosztów pracy. Nie ma nic złego w obniżaniu kosztów pracy, ale czuję, że jest coś złego w zastępowaniu całej klasy pracowników w firmie maszynami. To dosłownie odczłowiecza. I mam na myśli nie tylko żartobliwy sens pozbywania się ludzi, ale także po prostu to, że ludzie tam pracujący i klienci, którzy wchodzą w interakcje z Twoją firmą, poczują się teraz od Ciebie wyobcowani, ponieważ nie będą już mieć tej ludzkiej interakcji, do której są przyzwyczajeni. Już to widzimy. To jest ten rodzaj rzeczy, który ekscytuje ludzi, którzy są bardzo zaniepokojeni wynikiem finansowym, i niepokoi tych, którzy martwią się o dochody i równość oraz wszystkie problemy, które pojawiają się wraz z tym szaleńczym dążeniem do mechanizacji. Jako społeczeństwo zmagamy się z tym problemem od 150 lat i wydaje mi się, że w miarę rozwoju technologii te obawy jedynie nasilają się.
Lauren Goode: Tylko w zeszłym tygodniu słyszałam, jak inwestor venture capital i CEO mówili w oddzielnych wywiadach, że „sześć z 10 miejsc pracy, 60% miejsc pracy, które istnieją teraz, nie istniało w 1940 roku”. Rzeczy się zmieniają, rzeczy się zmieniają, technologia umożliwia nowe rodzaje miejsc pracy. Futuryści, CEO, inwestorzy venture capital uwielbiają to, ponieważ tworzy to pustą przestrzeń dla tego, czego jeszcze nie byliśmy w stanie sobie wyobrazić, jeśli chodzi o to, jakie miejsca pracy będą istnieć. Czy wierzę, że są pewne prace, które syn Willa, z którym teraz koduje, mógłby potencjalnie mieć, o których jeszcze nie pomyśleliśmy?
Michael Calore: Czy wszyscy w Dolinie Krzemowej myślą o agentach AI w ten sam sposób?
Will Knight: Nie sądzę. Myślę, że jest dużo entuzjazmu, ale jest też mnóstwo różnych definicji. Niedawno rozmawiałem z Sonyą Huang, partnerką w Sequoia, która śledzi AI. Mówiła, że większość startupów agentów, większość firm oferujących agentów, tak naprawdę po prostu zmienia markę istniejących narzędzi AI na agentów.
Lauren Goode: Tak. Wracając do wcześniejszego punktu Willa, nie ma obecnie jasnej definicji tego, czym jest agent AI ani czym ma być. Istnieje naprawdę szerokie spektrum, więc firmy mogą przesuwać igłę i definiować ją w dowolny sposób. Albo powiedzieć, że oferują ją w określony sposób. Myślę, że zobaczymy również, myślę, coś w rodzaju przemysłu domowego, który pojawi się w przestrzeniach między agentami AI. Załóżmy na przykład, że istnieje wąskie gardło uwierzytelniania, które występuje, gdy wysyłasz agenta, aby wykonał wiele różnych zadań online za pośrednictwem wielu różnych aplikacji. Musi istnieć jakiś rodzaj połączenia między tymi aplikacjami i musi być ono bezpieczne. Myślę, że zobaczysz rozwiązania dla tego. Myślę, że zobaczysz jakąś wersję wysyłki ostatniej mili, ale dla kodowania. Ponieważ teraz dzieje się wiele kodowania wibracji i ludzie mówią o kodowaniu wibracji i „spójrz, co ten bot może dla mnie zrobić”. Ale nie cały ten kod jest faktycznie możliwy do wysłania. Musisz być w stanie to debugować i musisz być w stanie to wysłać. Musi działać, musi działać. Myślę, że zaczniesz widzieć coraz więcej startupów i firm próbujących oferować rozwiązania wszystkich tych małych luk i wąskich gardeł, które istnieją między agentami AI. Wtedy nasze zadania zostaną w pełni zajęte. Dobre czasy.
Michael Calore: Will, dla ludzi takich jak my, którzy są konsumentami tej technologii... Nie zajmujemy się kodowaniem wibracji jak Will.
Lauren Goode: Jeszcze nie.
Michael Calore: Generalnie rzecz biorąc, w naszym codziennym życiu spotykamy się z jakąś formą agentowej AI. W miarę jak staje się ona coraz bardziej powszechna, w jaki sposób możemy ocenić jej potencjał i ryzyko w sposób zrównoważony?
Will Knight: Przede wszystkim uważam, że wszyscy powinniście kodować wibracje. Tworzę wszelkiego rodzaju śmieci. Kiedy koduję wibracje, robię to bardzo świadomie na maszynie, na której nie przeszkadza mi, jeśli usunie mnóstwo plików, ponieważ jest to naprawdę nieprzewidywalne i czasami tak się dzieje. Naprawdę nie wiem, jak to zrobić w przypadku czegoś, co zamierzasz puścić wodze fantazji podczas zakupów. Czy masz budżet, który po prostu pozwalasz agentowi wydać? Myślę, że to świetne pytanie. Oczywiście, że całe ryzyko będzie po naszej stronie, tak sądzę.
Michael Calore: Tak.
Lauren Goode: Tak. Ale myślę, że w miarę jak ci agenci stają się coraz lepsi w wykonywaniu zadań za nas, mamy przynajmniej kilka obowiązków. Po pierwsze, musimy zmienić siebie i nasze nawyki i nauczyć się korzystać z nowych narzędzi, ponieważ przejmą one kontrolę nad naszym życiem. Po drugie, musimy ustalić, gdzie pasujemy jako ludzie i zachować część tej ludzkiej sprawczości, a mimo to uczestniczyć, być na bieżąco, nadal uczestniczyć w naszym własnym życiu, a nie tylko pozwolić technologii przejąć kontrolę. Po trzecie, musimy naprawdę mocno zastanowić się nad etyką, prywatnością i bezpieczeństwem tego, co robią ci agenci AI, gdy przejmują kontrolę nad życiem ludzi. Wszyscy optymiści obiecują, że to zamknie lukę równości. Po raz kolejny, będzie to świetne dla wszystkich. Wiemy prawie na pewno, że nie będzie to świetne dla wszystkich.
Michael Calore: Tak. Dlatego w tym momencie jestem przeciwieństwem optymistów. Myślę, że wielka ostrożność i wielki sceptycyzm to rzeczy, które są tutaj podane. Musimy upewnić się, że kiedy przyjmujemy te technologie, robimy to w sposób bardzo, bardzo przemyślany i ostrożny. To jest coś, co wydaje się znajome. Prawdopodobnie najnowszym przykładem jest telefon, smartfon. Coś, co powoduje tarcie w związkach, jest to coś, na co możesz zwrócić uwagę i możesz zignorować ludzi. Możesz użyć go do interakcji z innymi ludźmi, możesz użyć go do nie interakcji z innymi ludźmi. Ta siła, która naprawdę erodowała niewielką część naszej ludzkości w ciągu 15 lub 20 lat, że była to część naszego życia. Widzę, że dzieje się to z agentami AI jako rzeczy, które polegaliśmy na ludziach, i rzeczy, które zmusiły nas do interakcji ze sobą, odchodzą. Mam takie samo doświadczenie, gdy jeżdżę w Waymo zamiast jeździć na Uber lub biorę taksówkę. Fakt, że teraz w równaniu nie ma człowieka, nie ma osoby do interakcji. Robiąc to w kółko, powoli uleczam własne poczucie tego, co to znaczy być człowiekiem. Wiem, że to brzmi naprawdę ezoterycznie, ale możesz to z czasem wytyczyć i prawdopodobnie przekonasz się, że czujesz to samo w swoim życiu. Zachęcam ludzi do podjęcia tej decyzji o tym, jak chcą korzystać z agentów AI. Jeśli nie uważają, że jest to coś, co należy do ich życia, powinni głosować swoimi dolarami.
Will Knight: Może potrzebujemy również odnowionego ruchu open source, więc nie używamy tylko agentów, którzy należą do tych gigantycznych firm. Użyj kodu i modeli open source oraz tego rodzaju rzeczy.
Michael Calore: To bardzo dobry pomysł. Powinniśmy uzyskać na ten temat sygnał. Powinni to zacząć. Powinny stworzyć własny model.
Lauren Goode: Myślę, że to brzmi świetnie.
Michael Calore: OK, zróbmy kolejną przerwę i wrócimy. Will i Lauren, dziękuję za ożywienie rozmowy. Na chwilę odłożymy agentów AI na bok i ponownie zdobyć człowieka. Porozmawiajmy o zaleceń. Will, jako nasz gość, zaleca coś naszym słuchaczom.
Will Knight: OK, mówiłem o tym wcześniej, ale chcę to wydać moją zalecenie. Mam zamiar to utrzymać, co jest świetnym radiem. Ta książka, która jest ewolucją agencji Michaela Tomasello. Uznałem to za fascynujące i naprawdę ujawniające o tym, czego brakuje w sztucznej inteligencji, jeśli chodzi o agencję oraz znaczenie zrozumienia ludzkiej interakcji społecznej, kultury ludzkiej. Jeśli chodzi o duży obraz inteligencji w AGI, o którym wszyscy mówią, ale tak naprawdę nie mówią o tym tak wiele.
Michael Calore: Fajnie. Lauren, jakie masz zalecenie?
Lauren Goode: Moją zaleceniem są wiadomości lokalne, aw szczególności misja lokalna.
Michael Calore: Tak!
Lauren Goode: Mission Local to lokalna organizacja non -profit informacyjna tutaj w San Francisco, która obejmuje dzielnicę misji, ale także ogólnie w San Francisco. Wykonują fantastyczną robotę. W USA wiele dzieje się teraz, w szczególności w Los Angeles, a także w San Francisco. W całym kraju odbywają się naloty lodowe, a ludzie wyjeżdżają na ulice, aby zaprotestować. Mission Local wykonuje świetną robotę, obejmując to, co działo się w San Francisco do tej pory. Polecam, abyś je wspierał i wspierać swoje lokalne wiadomości, jeśli możesz. Mike, jakie masz zalecenie?
Michael Calore: Chcę polecić esej w bieżącym numerze Harpera. To jest norweski pisarz Karl Ove Knausgaard, który, Lauren, jestem pewien, że masz dość, że mówię. Ale to fantastyczny esej. Nazywa się to „Ponowne świat”. Karl ove licząc z technologią. Opowiada o tym, że po raz pierwszy spotkał komputer, który był 40 lat temu. Wtedy po prostu nie zwrócił uwagi na komputery i zaczyna mu to przeszkadzać. Na górze jest świetny cytat. „Informacje o tym, aby nieco poinformować o sytuacji politycznej na świecie, jest obowiązkiem, czego nie ma prawa się odwrócić. Czy coś podobnego nie miało zastosowania do technologii, biorąc pod uwagę jego wpływ?” Uwielbiam ten cytat, ponieważ naprawdę dociera do centrum tego, o czym dzisiaj mówimy. Aby zaangażować się w świat, musisz zrozumieć, jak działają te systemy. Wydaje się na grecką wyspę, aby odwiedzić pisarza Jamesa Bridle'a, ponieważ ich książka jest naprawdę dobrym wprowadzeniem do inteligencji i sztucznej inteligencji i naturalnej inteligencji. Dużo mówią o sztucznej inteligencji i o tym, jak się rozwinęła i o tym, jak różne sposoby obliczania inteligencji pojawiły się w naszym życiu. To naprawdę cudowny zgłoszony utwór na temat obecnego stanu technologii w naszym życiu.
Lauren Goode: Świetna.
Michael Calore: Tak.
Lauren Goode: Brzmi o wiele krótsze niż jego książki.
Michael Calore: Tak. Możesz to przeczytać w niecałą godzinę.
Lauren Goode: Allright, brzmi dla mnie dobrze.
Michael Calore: Dzięki za wysłuchanie Uncanny Valley . Jeśli podoba Ci się to, co usłyszałeś dzisiaj, śledź nasz program i oceń go w wybranej aplikacji podcastu. Jeśli chcesz się z nami skontaktować z jakymi pytaniami, komentarzami lub sugestiami, napisz do nas pod adresem [email protected]. Dzisiejszy program wyprodukował Adriana Tapia. Amar Lal z Macro Sound wymieszał w tym odcinku. Jake Loomis był naszym inżynierem w Nowym Jorku. Meghan Herbst sprawdził ten odcinek. Jordan Bell jest naszym producentem wykonawczym. Katie Drummond jest globalnym dyrektorem redakcyjnym. Chris Bannon jest szefem globalnego dźwięku.
wired