OpenAI vient de publier ses premiers modèles Open-Weight depuis GPT-2

OpenAI vient de lancer ses premiers modèles open-weight depuis plus de cinq ans. Les deux modèles de langage, gpt-oss-120b et gpt-oss-20b, peuvent être exécutés localement sur des appareils grand public et être optimisés pour des besoins spécifiques. Pour OpenAI , ils marquent un tournant par rapport à sa récente stratégie axée sur les versions propriétaires, l'entreprise s'orientant vers un ensemble plus large et plus ouvert de modèles d'IA accessibles aux utilisateurs.
« Nous sommes ravis de mettre ce modèle, fruit de milliards de dollars de recherche, à la disposition du monde entier afin de mettre l'IA à la portée du plus grand nombre », a déclaré Sam Altman, PDG d'OpenAI, dans un communiqué envoyé par courriel. gpt-oss-120b et gpt-oss-20b sont officiellement disponibles en téléchargement gratuit sur Hugging Face, une plateforme d'hébergement populaire pour les outils d'IA . Le dernier modèle open-weight publié par OpenAI était GPT-2 , en 2019.
Ce qui distingue un modèle Open Weight, c'est que ses « pondérations » sont accessibles au public, ce qui signifie que chacun peut consulter les paramètres internes pour se faire une idée de la façon dont il traite l'information. Plutôt que de concurrencer les modèles propriétaires d'OpenAI avec une option gratuite, le cofondateur Greg Brockman considère cette version comme un complément aux services payants de l'entreprise, comme l'interface de programmation d'applications actuellement utilisée par de nombreux développeurs. « Les modèles Open Weight présentent des atouts très différents », a déclaré Brockman lors d'une conférence de presse. Contrairement à ChatGPT, un modèle gpt-oss peut être exécuté sans connexion Internet et derrière un pare-feu.
Les deux modèles gpt-oss utilisent des approches de raisonnement par chaîne de pensée , déployées initialement par OpenAI dans son modèle o1 l'automne dernier. Plutôt que de se contenter de produire une sortie, cette approche permet aux outils d'IA générative de suivre plusieurs étapes pour répondre à une invite. Ces nouveaux modèles textuels ne sont pas multimodaux, mais ils peuvent naviguer sur le web, appeler des modèles cloud pour faciliter les tâches, exécuter du code et naviguer dans des logiciels en tant qu'agent d'IA . Le plus petit des deux modèles, gpt-oss-20b, est suffisamment compact pour fonctionner localement sur un appareil grand public doté de plus de 16 Go de mémoire.
Les deux nouveaux modèles d'OpenAI sont disponibles sous la licence Apache 2.0 , un choix populaire pour les modèles à pondération ouverte. Avec Apache 2.0, les modèles peuvent être utilisés à des fins commerciales, redistribués et intégrés à d'autres logiciels sous licence. Les versions de modèles à pondération ouverte de Qwen (Alibaba) et de Mistral fonctionnent également sous Apache 2.0.
Annoncée publiquement en mars, la publication de ces modèles ouverts a été initialement retardée pour des tests de sécurité supplémentaires. La publication d'un modèle ouvert est potentiellement plus dangereuse qu'une version fermée, car elle supprime les barrières entourant l'utilisation de l'outil, et n'importe qui peut tenter d'affiner une version de gpt-oss à des fins non prévues.
Outre les évaluations habituellement effectuées par OpenAI sur ses modèles propriétaires, la startup a personnalisé l'option « open-weight » afin d'identifier les risques potentiels d'utilisation abusive par un « acteur malveillant » téléchargeant l'outil. « Nous avons peaufiné le modèle en interne sur certains de ces domaines de risque », explique Eric Wallace, chercheur en sécurité chez OpenAI, « et mesuré jusqu'où nous pouvions les pousser. » Lors des tests d'OpenAI, le modèle « open-weight » n'a pas atteint un niveau de risque élevé, tel que mesuré par son cadre de préparation .
Comment ces modèles se comparent-ils aux autres versions d'OpenAI ? « Les scores de référence de ces deux modèles sont plutôt bons », a déclaré Chris Koch, chercheur chez OpenAI, lors de la conférence de presse. Concernant gpt-oss-120b, le chercheur a comparé ses performances à celles des modèles o3 et o4-mini d'OpenAI, qui sont propriétaires, et les a même surpassées dans certaines évaluations. La fiche du modèle gpt-oss détaille sa comparaison avec les autres offres de l'entreprise. Lors d'une conférence de presse préalable au lancement, les membres de l'équipe d'OpenAI ont également insisté sur la latence offerte par gpt-oss et sur le coût d'exploitation plus faible de ces modèles.
Début 2015, la startup chinoise DeepSeek a surpris la Silicon Valley avec le lancement de son modèle open source, peu coûteux à utiliser. Bien que le blog consacré à gpt-oss ne mentionne pas directement DeepSeek ni aucune autre entreprise chinoise d'IA, Altman affirme clairement qu'il souhaite que l'innovation autour des modèles open source se développe aux États-Unis. « Depuis nos débuts en 2015, la mission d'OpenAI est de garantir une IAG bénéfique pour toute l'humanité », a déclaré Altman dans un communiqué. « À cette fin, nous sommes ravis que le monde s'appuie sur une pile d'IA ouverte créée aux États-Unis, fondée sur des valeurs démocratiques, accessible gratuitement à tous et pour le plus grand bien de tous. »
Aux États-Unis, Meta est le leader du marché open source. Le géant technologique a lancé le premier modèle de sa série Llama en 2023, et sa dernière version, Llama 4 , est arrivée il y a quelques mois. Dans cette optique, Meta se concentre actuellement sur le développement d'une IA capable de surpasser la cognition humaine, souvent qualifiée de « superintelligence » par les spécialistes de l'IA. L'entreprise a récemment lancé un nouveau laboratoire interne dédié à ce sujet, dirigé par Alexandr Wang, ancien PDG de Scale. Mark Zuckerberg a indiqué que l'entreprise pourrait abandonner l'open source pour ses futurs modèles, invoquant de potentiels problèmes de sécurité.
La sortie de gpt-oss intervient alors que la guerre des talents en IA entre des entreprises comme OpenAI et Meta s'intensifie. En 2025, les chercheurs en IA disposant de talents recherchés se verront proposer des offres astronomiques pour changer d'entreprise. Les dernières versions d'OpenAI pourraient constituer une concurrence féroce pour Meta, selon l'accueil réservé aux modèles gpt-oss par les développeurs.
wired