La stratégie de puces personnalisées d'AWS porte ses fruits et réduit la domination de Nvidia en matière d'IA

Amazone Web Services s'apprête à annoncer une mise à jour de sa puce Graviton4 qui comprend 600 gigaoctets par seconde de bande passante réseau, ce que la société appelle l'offre la plus élevée dans le cloud public.
Ali Saidi, un ingénieur distingué d'AWS, a comparé la vitesse à celle d'une machine lisant 100 CD de musique par seconde.
Graviton4, une unité centrale de traitement (UCT), est l'une des nombreuses puces produites par les laboratoires Annapurna d'Amazon à Austin, au Texas. Cette puce est un atout majeur pour la stratégie de personnalisation de l'entreprise et lui permet de rivaliser avec les acteurs traditionnels des semi-conducteurs comme Intel. et AMD .
Mais la vraie bataille est avec Nvidia dans le domaine des infrastructures d’intelligence artificielle .
Lors de la conférence re:Invent 2024 d'AWS en décembre dernier, l'entreprise a annoncé le projet Rainier, un supercalculateur d'IA conçu pour la startup Anthropic . AWS a investi 8 milliards de dollars pour soutenir Anthropic.
Gadi Hutt, directeur principal d'AWS pour l'ingénierie client et projet, a déclaré qu'Amazon cherchait à réduire les coûts de formation de l'IA et à fournir une alternative aux coûteuses unités de traitement graphique, ou GPU, de Nvidia.
Le modèle d'IA Claude Opus 4 d'Anthropic est formé sur des GPU Trainium2, selon AWS, et le projet Rainier est alimenté par plus d'un demi-million de puces - une commande qui aurait traditionnellement été attribuée à Nvidia.
Hutt a déclaré que même si la puce Blackwell de Nvidia est plus performante que Trainium2, la puce AWS offre un meilleur rapport qualité-prix.
« Trainium3 arrive cette année, il double les performances de Trainium2 et permettra d'économiser 50 % d'énergie supplémentaires », a-t-il déclaré.
La demande pour ces puces dépasse déjà l'offre, selon Rami Sinno, directeur de l'ingénierie chez Annapurna Labs d'AWS.
« Notre offre est très, très large, mais chaque service que nous créons est associé à un client », a-t-il déclaré.
Avec la mise à niveau de Graviton4 à l'horizon et les puces Trainium du projet Rainier, Amazon démontre son ambition plus large de contrôler l'ensemble de la pile d'infrastructure d'IA, de la mise en réseau à la formation en passant par l'inférence.
Et comme de plus en plus de modèles d'IA majeurs comme Claude 4 prouvent qu'ils peuvent s'entraîner avec succès sur du matériel non Nvidia, la question n'est pas de savoir si AWS peut rivaliser avec le géant des puces, mais quelle part de marché il peut prendre.
Le calendrier de sortie de la mise à jour Graviton4 sera fourni d'ici la fin du mois de juin, selon un porte-parole d'AWS.
CNBC