A estratégia de chip personalizado da AWS está mostrando resultados e reduzindo o domínio da IA da Nvidia

Amazon A Web Services está pronta para anunciar uma atualização para seu chip Graviton4 que inclui 600 gigabytes por segundo de largura de banda de rede, o que a empresa chama de a maior oferta na nuvem pública.
Ali Saidi, um engenheiro renomado da AWS, comparou a velocidade a uma máquina lendo 100 CDs de música por segundo.
Graviton4, uma unidade central de processamento, ou CPU, é um dos muitos chips produzidos pelo Annapurna Labs da Amazon em Austin, Texas. O chip representa uma vitória para a estratégia personalizada da empresa e a coloca em competição com empresas tradicionais de semicondutores, como a Intel. e AMD .
Mas a verdadeira batalha é com a Nvidia no espaço de infraestrutura de inteligência artificial .
Na conferência re:Invent 2024 da AWS em dezembro passado, a empresa anunciou o Projeto Rainier – um supercomputador de IA desenvolvido para a startup Anthropic . A AWS investiu US$ 8 bilhões para apoiar a Anthropic.
O diretor sênior de engenharia de projetos e clientes da AWS, Gadi Hutt, disse que a Amazon está procurando reduzir os custos de treinamento de IA e fornecer uma alternativa às caras unidades de processamento gráfico, ou GPUs, da Nvidia.
O modelo de IA Claude Opus 4 da Anthropic é treinado em GPUs Trainium2, de acordo com a AWS, e o Projeto Rainier é alimentado por mais de meio milhão desses chips — um pedido que tradicionalmente seria feito para a Nvidia.
Hutt disse que, embora o Blackwell da Nvidia seja um chip de desempenho superior ao Trainium2, o chip AWS oferece melhor desempenho de custo.
"O Trainium3 será lançado este ano e dobrará o desempenho do Trainium2, além de economizar energia em mais 50%", disse ele.
A demanda por esses chips já está superando a oferta, de acordo com Rami Sinno, diretor de engenharia do Annapurna Labs da AWS.
"Nossa oferta é muito, muito grande, mas cada serviço que criamos tem um cliente vinculado a ele", disse ele.
Com a atualização do Graviton4 no horizonte e os chips Trainium do Projeto Rainier, a Amazon está demonstrando sua ambição mais ampla de controlar toda a pilha de infraestrutura de IA, da rede ao treinamento e inferência.
E à medida que mais modelos importantes de IA, como o Claude 4, provam que podem treinar com sucesso em hardware que não é da Nvidia, a questão não é se a AWS pode competir com a gigante dos chips — mas sim quanta participação de mercado ela pode conquistar.
O cronograma de lançamento da atualização do Graviton4 será fornecido até o final de junho, de acordo com um porta-voz da AWS.
CNBC