L'IA a toujours un problème d'hallucination : comment MongoDB vise à le résoudre avec des rerankers avancés et des modèles d'intégration

Inscrivez-vous à nos newsletters quotidiennes et hebdomadaires pour recevoir les dernières mises à jour et du contenu exclusif sur la couverture de l'IA de pointe. En savoir plus
Pour obtenir le meilleur résultat possible d’une requête IA, les organisations ont besoin des meilleures données possibles.
La réponse que de nombreuses organisations ont dû apporter pour surmonter ce défi est la génération augmentée de données (RAG). Avec la RAG, les résultats sont basés sur les données d'une base de données. Il s'avère cependant que toutes les RAG ne sont pas identiques et qu'optimiser une base de données pour obtenir les meilleurs résultats possibles peut s'avérer difficile.
Le fournisseur de bases de données MongoDB n'est pas étranger au monde de l'IA ou du RAG. La base de données du même nom de l'entreprise est déjà utilisée pour le RAG, et MongoDB a également lancé des initiatives de développement d'applications d'IA . Bien que l'entreprise et ses utilisateurs, comme le géant médical Novo Nordisk , aient connu le succès avec l'IA de génération, il reste encore beaucoup à faire.
En particulier, les hallucinations et la précision continuent d'être un problème qui empêche certaines organisations de mettre en production l'IA de génération. À cette fin, MongoDB a annoncé aujourd'hui l'acquisition de la société privée Voyage AI , qui développe des modèles avancés d'intégration et de récupération. Voyage a levé 20 millions de dollars de financement en octobre 2024 lors d'un tour de table soutenu par le géant des données cloud Snowflake. L'acquisition apportera l'expertise de Voyage AI en matière d'intégration de la génération et du reclassement - des composants essentiels pour la recherche et la récupération alimentées par l'IA - directement dans la plateforme de base de données de MongoDB.
« Au cours de l’année dernière, et en particulier alors que les organisations ont essayé de réfléchir à la manière dont elles pourraient créer des applications basées sur l’IA, il est devenu de plus en plus clair que la qualité et la confiance des applications qu’elles créent, ou leur absence, devenaient l’un des obstacles à l’application de l’IA aux cas d’utilisation critiques pour la mission », a déclaré Sahir Azam, CPO de MongoDB, à VentureBeat.
L’idée de base derrière RAG est que, au lieu de s’appuyer simplement sur une base de connaissances à partir de données formées, le moteur d’IA gen peut obtenir des données fondées à partir d’une base de données.
Créer un RAG très précis est assez complexe et il existe toujours un risque potentiel d'hallucinations, un défi auquel sont confrontés MongoDB et ses utilisateurs. Bien qu'Azam ait refusé de fournir un exemple ou un incident spécifique où l'IA RAG a échoué pour un utilisateur, il a noté que la précision est toujours une préoccupation.
Améliorer la précision et réduire les hallucinations implique plusieurs étapes. La première consiste à améliorer la qualité de la récupération (le « R » de RAG).
« Dans de nombreux cas, la qualité de la recherche n’est pas suffisante », a déclaré à VentureBeat Tengyu Ma, fondateur et PDG de Voyage AI. « À l’étape de la recherche, si les informations ne sont pas pertinentes, la recherche n’est pas très utile et le modèle de langage étendu (LLM) hallucine car il doit deviner un certain contexte. »
Les modèles Voyage AI, désormais intégrés à MongoDB, contribuent à améliorer RAG de plusieurs manières clés :
- Modèles et re-rankers spécifiques à un domaine : ils sont formés sur de grandes quantités de données non structurées provenant de secteurs verticaux spécifiques, ce qui leur permet de mieux comprendre la terminologie et la sémantique de ces domaines.
- Personnalisation et réglage fin : les utilisateurs peuvent affiner le mécanisme de récupération pour des ensembles de données et des cas d'utilisation uniques.

MongoDB n'est pas le premier ni le seul fournisseur à reconnaître la nécessité et l'intérêt d'une technologie d'intégration et de reclassement hautement optimisée. Après tout, c'est l'une des raisons pour lesquelles Snowflake a investi dans Voyage AI et utilise les modèles de l'entreprise.
Il est important de noter que, même après avoir été acquis par MongoDB, les modèles de Voyage AI resteront disponibles pour Snowflake et les autres utilisateurs de Voyage AI. La grande différence est que Voyage AI sera désormais de plus en plus intégré aux plateformes de bases de données de MongoDB.
L'intégration directe de modèles d'intégration avancés dans une base de données est une approche adoptée par d'autres fournisseurs de bases de données concurrents. En juin 2024, DataStax a annoncé sa propre technologie RAGStack qui combine des modèles d'intégration et de récupération avancés.
Azam a cependant fait valoir que MongoDB était un peu différent. D’une part, il s’agit d’une base de données opérationnelle, par opposition à une base de données analytique. De plus, au lieu de simplement fournir des informations et des analyses, MongoDB permet d’alimenter les transactions et les opérations du monde réel. MongoDB est également ce que l’on appelle une « base de données de modèles de documents », dont la structure est différente de celle d’une base de données relationnelle traditionnelle. Cette structure ne repose pas sur des colonnes et des tables, qui ne sont pas particulièrement efficaces pour représenter des informations sur des données non structurées (un élément essentiel pour les applications d’IA).
« Nous sommes la seule technologie de base de données qui combine la gestion des métadonnées sur les informations d'un client, les opérations et les transactions, qui sont le cœur de ce qui se passe dans l'entreprise, ainsi que la base de la récupération - le tout avec un seul système », a déclaré Azam.
Le besoin de modèles d’intégration et de récupération extrêmement précis est encore accéléré par l’IA agentique.
« L’IA agentique a toujours besoin de méthodes de récupération, car un agent ne peut pas prendre de décisions hors contexte », a déclaré Ma. « Parfois, plusieurs composants de récupération sont utilisés dans une seule décision. »
Ma a noté que Voyage AI travaille actuellement sur des modèles spécifiques hautement personnalisés pour les cas d'utilisation de l'IA agentique. Il a expliqué que l'IA agentique peut utiliser différents types de requêtes qui peuvent encore bénéficier d'une optimisation plus poussée.
Alors que l'IA de génération se tourne de plus en plus vers des cas d'utilisation opérationnels, la nécessité d'éliminer le risque d'hallucinations est clairement primordiale. Alors que MongoDB a connu du succès avec l'IA de génération, Azam s'attend à ce que l'intégration de Voyage AI ouvre de nouveaux cas d'utilisation critiques pour la mission.
« Si nous pouvons désormais dire : « Hé, nous pouvons vous offrir une précision de plus de 90 % pour vos applications alors qu'aujourd'hui, dans certains cas, nous n'atteignons que 30 ou 60 % de précision pour les résultats », l'ouverture s'élargit en termes de types d'opportunités auxquelles les gens peuvent appliquer l'IA dans leurs applications logicielles », a déclaré Azam.
Si vous souhaitez impressionner votre patron, VB Daily a tout ce qu'il vous faut. Nous vous donnons un aperçu de ce que font les entreprises avec l'IA générative, des changements réglementaires aux déploiements pratiques, afin que vous puissiez partager vos idées pour un retour sur investissement maximal.
Lisez notre politique de confidentialité
Merci de vous être abonné. Découvrez d'autres newsletters VB ici .
Une erreur s'est produite.

venturebeat