Sélectionner la langue

French

Down Icon

Sélectionnez un pays

America

Down Icon

Google lance des modèles d'IA Gemini 2.5 prêts pour la production pour défier la domination d'OpenAI sur les entreprises

Google lance des modèles d'IA Gemini 2.5 prêts pour la production pour défier la domination d'OpenAI sur les entreprises

Participez à l'événement auquel les chefs d'entreprise font confiance depuis près de deux décennies. VB Transform rassemble les personnes qui élaborent de véritables stratégies d'IA pour les entreprises. En savoir plus

Google a pris des mesures décisives pour renforcer sa position dans la course aux armements de l'intelligence artificielle lundi, déclarant que ses modèles Gemini 2.5 les plus puissants étaient prêts pour la production en entreprise tout en dévoilant une nouvelle variante ultra-efficace conçue pour surpasser ses concurrents en termes de coût et de vitesse.

La filiale d'Alphabet a promu deux de ses modèles phares d'IA , Gemini 2.5 Pro et Gemini 2.5 Flash , du statut d'aperçu expérimental à la disponibilité générale , témoignant de la confiance de l'entreprise dans la capacité de cette technologie à gérer des applications métier critiques. Google a simultanément présenté Gemini 2.5 Flash-Lite , le positionnant comme l'option la plus rentable de sa gamme pour les tâches à volume élevé.

Ces annonces représentent le défi le plus ambitieux lancé par Google à OpenAI pour son leadership sur le marché , en proposant aux entreprises une suite complète d'outils d'IA, allant des capacités de raisonnement haut de gamme à l'automatisation à moindre coût. Cette initiative intervient alors que les entreprises exigent de plus en plus de systèmes d'IA prêts à la production et capables d'évoluer de manière fiable sur l'ensemble de leurs opérations.

La décision de Google de retirer ces modèles de la version préliminaire reflète la pression croissante pour s'adapter au déploiement rapide des outils d'IA grand public et d'entreprise d'OpenAI. Alors qu'OpenAI a fait la une des journaux avec ChatGPT et sa famille GPT-4 , Google a adopté une approche plus prudente, testant intensivement ses modèles avant de les déclarer prêts pour la production.

« L'ère Gemini 2.5 continue de prendre de l'ampleur », a écrit Jason Gelman, directeur de la gestion des produits chez Vertex AI, dans un billet de blog annonçant les mises à jour. Ce commentaire suggère que Google considère ce moment comme crucial pour asseoir la crédibilité de sa plateforme d'IA auprès des acheteurs professionnels.

Le timing semble stratégique. Google a publié ces mises à jour quelques semaines seulement après qu'OpenAI ait été soumis à un examen minutieux de la sécurité et de la fiabilité de ses derniers modèles, ce qui lui a permis de se positionner comme une alternative plus stable et plus adaptée aux entreprises.

L'approche de Google se distingue par l'accent mis sur les capacités de « raisonnement » ou de « réflexion », une architecture technique qui permet aux modèles de traiter les problèmes de manière plus réfléchie avant d'y répondre. Contrairement aux modèles de langage traditionnels qui génèrent des réponses immédiates, les modèles Gemini 2.5 peuvent mobiliser des ressources de calcul supplémentaires pour résoudre des problèmes complexes étape par étape.

Ce « budget de réflexion » offre aux développeurs un contrôle sans précédent sur le comportement de l'IA. Ils peuvent demander aux modèles de réfléchir plus longtemps pour des tâches de raisonnement complexes ou de répondre rapidement à des requêtes simples, optimisant ainsi la précision et les coûts. Cette fonctionnalité répond à un besoin essentiel des entreprises : un comportement prévisible de l'IA, adaptable à leurs besoins spécifiques.

Gemini 2.5 Pro , le modèle le plus performant de Google, excelle dans le raisonnement complexe, la génération de code avancée et la compréhension multimodale. Il peut traiter jusqu'à un million de jetons de contexte, soit environ 750 000 mots, ce qui lui permet d'analyser des bases de code entières ou de longs documents en une seule session.

Gemini 2.5 Flash offre un équilibre parfait entre performances et efficacité, conçu pour les tâches d'entreprise à haut débit, comme la synthèse de documents volumineux et les applications de chat réactives. La nouvelle version Flash-Lite sacrifie une partie de l'intelligence au profit d'économies considérables, ciblant des cas d'utilisation comme la classification et la traduction, où la vitesse et le volume comptent plus que le raisonnement sophistiqué.

Plusieurs grandes entreprises ont déjà intégré ces modèles dans leurs systèmes de production, ce qui suggère que la confiance de Google dans leur stabilité est justifiée. Snap Inc. utilise Gemini 2.5 Pro pour alimenter les fonctions d'intelligence spatiale de ses lunettes de réalité augmentée, traduisant les coordonnées d'images 2D en espace 3D pour les applications de réalité augmentée.

SmartBear , fournisseur d'outils de test logiciel, utilise Gemini 2.5 Flash pour traduire les scripts de test manuels en tests automatisés. « Le retour sur investissement est multiforme », a déclaré Fitz Nowlan, vice-président de l'IA de l'entreprise, décrivant comment cette technologie accélère la vitesse des tests tout en réduisant les coûts.

Connective Health, une entreprise de technologie médicale, utilise ces modèles pour extraire des informations médicales vitales de dossiers complexes en texte libre, une tâche exigeant à la fois précision et fiabilité compte tenu de la nature vitale des données médicales. Le succès rencontré par l'entreprise avec ces applications suggère que les modèles de Google ont atteint le seuil de fiabilité requis pour les secteurs réglementés.

Les décisions tarifaires de Google témoignent de sa détermination à se montrer compétitif sur tous les segments de marché. L'entreprise a augmenté le prix des jetons d'entrée Flash Gemini 2.5 de 0,15 $ à 0,30 $ par million de jetons, tout en réduisant le coût des jetons de sortie de 3,50 $ à 2,50 $ par million de jetons. Cette restructuration profite aux applications générant des réponses longues, un cas d'usage courant en entreprise.

Plus important encore, Google a supprimé la distinction entre tarification « réfléchie » et « non réfléchie », qui perturbait les développeurs. La structure tarifaire simplifiée supprime un obstacle à l'adoption tout en facilitant la prévision des coûts pour les acheteurs professionnels.

L'introduction de Flash-Lite à 0,10 $ par million de jetons d'entrée et à 0,40 $ par million de jetons de sortie crée un nouveau niveau de base conçu pour répondre aux charges de travail sensibles aux prix. Cette tarification permet à Google de concurrencer les petits fournisseurs d'IA qui ont gagné en popularité en proposant des modèles de base à des coûts extrêmement bas.

Le lancement simultané de trois modèles prêts pour la production, déclinés en différents niveaux de performance, témoigne d'une stratégie de segmentation de marché sophistiquée. Google semble s'inspirer de la stratégie traditionnelle de l'industrie du logiciel : proposer des options performantes, optimales et optimales pour capter les clients de tous budgets, tout en proposant des solutions de mise à niveau en fonction de l'évolution des besoins.

Cette approche contraste fortement avec la stratégie d'OpenAI qui pousse les utilisateurs vers ses modèles les plus performants (et les plus coûteux). La volonté de Google de proposer des alternatives véritablement économiques pourrait perturber la dynamique tarifaire du marché, notamment pour les applications à fort volume où le coût par interaction prime sur les performances optimales.

Les capacités techniques de Google lui confèrent également un avantage concurrentiel pour les cycles de vente des entreprises. La longueur du contexte, d'un million de jetons, permet des cas d'utilisation, comme l'analyse de contrats juridiques complets ou le traitement de rapports financiers complets, que les modèles concurrents ne peuvent pas gérer efficacement. Pour les grandes entreprises ayant des besoins complexes en matière de traitement de documents, cette différence de capacité pourrait s'avérer décisive.

Ces lancements interviennent dans un contexte de concurrence croissante autour de l'IA sur de multiples fronts. Si l'attention des consommateurs se concentre sur les interfaces de chatbot, la véritable valeur commerciale – et le potentiel de revenus – réside dans les applications d'entreprise capables d'automatiser des flux de travail complexes et d'améliorer la prise de décision humaine.

L'accent mis par Google sur la préparation à la production et les fonctionnalités d'entreprise suggère que l'entreprise a tiré les leçons des précédents défis liés au déploiement de l'IA. Les précédents lancements de l'IA par Google semblaient parfois prématurés ou déconnectés des besoins réels de l'entreprise. La longue période de prévisualisation des modèles Gemini 2.5, combinée aux premiers partenariats avec les entreprises, témoigne d'une approche plus mature du développement produit.

Les choix d'architecture technique reflètent également les enseignements tirés de l'expérience du secteur dans son ensemble. La capacité de « réflexion » répond aux critiques selon lesquelles les modèles d'IA prennent des décisions trop rapidement, sans prendre suffisamment en compte des facteurs complexes. En rendant ce processus de raisonnement contrôlable et transparent, Google positionne ses modèles comme plus fiables pour les applications métier à enjeux élevés.

Le positionnement agressif de Google sur la famille Gemini 2.5 fait de 2025 une année charnière pour l'adoption de l'IA en entreprise. Avec des modèles prêts à la production répondant aux exigences de performance et de coût, Google a éliminé de nombreux obstacles techniques et économiques qui limitaient auparavant le déploiement de l'IA en entreprise.

Le véritable test aura lieu lorsque les entreprises intégreront ces outils à leurs flux de travail critiques. Les premières entreprises à les adopter font état de résultats prometteurs, mais une validation plus large sur le marché nécessite des mois d'utilisation en production dans divers secteurs et applications.

Pour les décideurs techniques, l'annonce de Google crée à la fois des opportunités et de la complexité. La diversité des modèles proposés permet une adéquation plus précise des fonctionnalités aux besoins, mais exige également des stratégies d'évaluation et de déploiement plus sophistiquées. Les organisations doivent désormais se demander non seulement si elles doivent adopter l'IA, mais aussi quels modèles et configurations spécifiques répondent le mieux à leurs besoins spécifiques.

Les enjeux dépassent les décisions individuelles des entreprises. L'IA devenant partie intégrante des opérations commerciales dans tous les secteurs, le choix de la plateforme d'IA détermine de plus en plus l'avantage concurrentiel. Les entreprises acquéreuses sont confrontées à un tournant crucial : s'engager dans l'écosystème d'un seul fournisseur d'IA ou maintenir des stratégies multifournisseurs coûteuses à mesure que la technologie mûrit.

Google souhaite devenir la référence en matière d'IA pour les entreprises, une position qui pourrait s'avérer extrêmement précieuse à mesure que l'adoption de l'IA s'accélère. L'entreprise qui a créé le moteur de recherche souhaite désormais créer le moteur d'intelligence qui alimente chaque décision commerciale.

Après avoir vu OpenAI faire la une des journaux et gagner des parts de marché pendant des années, Google a finalement arrêté de parler de l'avenir de l'IA et a commencé à la vendre.

Informations quotidiennes sur les cas d'utilisation métier avec VB Daily

Si vous souhaitez impressionner votre patron, VB Daily a tout prévu. Nous vous présentons en avant-première les avancées des entreprises en matière d'IA générative, des évolutions réglementaires aux déploiements pratiques, afin que vous puissiez partager vos idées pour un retour sur investissement maximal.

Lisez notre politique de confidentialité

Merci de votre abonnement. Découvrez d'autres newsletters VB ici .

Une erreur s'est produite.

venturebeat

venturebeat

Nouvelles similaires

Toutes les actualités
Animated ArrowAnimated ArrowAnimated Arrow