// USE CASE IA · CAS D'USAGE IA

Chatbot IA branché sur vos contenus

Un chatbot qui répond sur vos propres documents, cite d'où vient sa réponse, et se tait quand l'information n'existe pas chez vous.

Un chatbot qui invente une réponse plausible fait plus de dégâts qu'un chatbot qui dit ne pas savoir. Le RAG part de là. L'idée tient en une phrase : avant de répondre, le modèle va lire vos documents, et il ne répond qu'avec ce qu'il y trouve. Il s'en tient à votre base, à vos règles, à votre périmètre.

Ce que veut dire « branché sur vos données »

RAG est l'acronyme de retrieval-augmented generation. En français courant : on récupère d'abord, on rédige ensuite. Quand une question arrive, le système cherche dans vos contenus les passages qui s'en rapprochent, les remet sous les yeux du modèle, et lui demande de formuler une réponse à partir de ces passages, et d'eux seuls. Le modèle de langage sert à écrire une phrase lisible. La matière, elle, vient de chez vous.

Vos données peuvent être à peu près n'importe quoi de textuel : un manuel produit, des fiches techniques, un intranet, des comptes rendus, une FAQ interne qui a grossi sans plan. Le chatbot ne remplace pas ces documents, il les rend interrogeables en langage naturel. On passe de « cherche dans le bon PDF, page 34 » à « pose ta question, l'outil retrouve la page 34 et te répond en citant la page 34 ».

Ce qui le sépare d'un chatbot générique

Un assistant généraliste répond à tout, avec aplomb, y compris quand il se trompe. C'est tenable pour rédiger un brouillon. Renseigner un client sur votre politique de retour ou un agent sur une procédure interne demande autre chose. Là, une réponse fausse coûte cher : un remboursement mal appliqué, une consigne de sécurité approximative, un délai annoncé qui n'existe pas.

Trois différences comptent. La réponse reste dans votre périmètre réel. Chaque réponse peut renvoyer à sa source, donc se vérifier d'un clic. Et quand l'information n'est pas dans vos documents, le bon comportement est de l'admettre et de rediriger vers un humain. Un chatbot RAG bien réglé refuse plus souvent qu'un assistant grand public, et c'est une qualité.

Où ça sert

Le cas le plus net : un support qui répète les mêmes réponses, déjà écrites quelque part, mais éparpillées. Le chatbot pioche dans la base existante et traite le premier niveau, l'humain garde les cas qui sortent du cadre. Côté interne, même logique pour une équipe qui passe son temps à retrouver la bonne version d'une procédure dans un espace documentaire devenu trop large pour la mémoire d'une personne.

Le signal commun, c'est le volume. La réponse existe, elle est juste, mais la retrouver prend trop de temps ou demande de connaître l'endroit exact où chercher. Quand la documentation tient sur une page et que tout le monde la connaît par cœur, le RAG n'apporte rien. On le réserve aux corpus assez gros et assez vivants pour que personne ne les ait en tête.

Comment on s'y prend

Tout commence par la matière. On rassemble vos sources, on les nettoie, on les découpe en passages de taille utile, ni trop courts pour garder le contexte, ni trop longs pour rester précis. Chaque passage est ensuite transformé en représentation que la machine sait comparer, puis rangé dans un index conçu pour retrouver vite ce qui ressemble à une question. Cette étape de préparation décide de presque tout : sur une base mal triée, aucun modèle ne rattrape le coup.

Récupérer, puis répondre

À l'usage, chaque question déclenche une recherche dans l'index, qui remonte les quelques passages les plus proches. Ces passages partent au modèle avec une consigne stricte : répondre à partir d'eux, citer la source, et signaler quand la réponse n'y figure pas. On garde le lien entre la phrase affichée et le document d'origine, pour que l'utilisateur puisse remonter au texte exact. Sans cette traçabilité, on retombe dans la boîte noire qu'on cherchait à éviter.

Le choix du modèle

Le modèle de langage n'est qu'une pièce, choisie selon vos contraintes. Mistral, un modèle frontier non européen ou un modèle open source hébergé chez vous : la décision se prend sur la sensibilité des données, le budget et l'endroit où tout cela doit tourner. Un corpus confidentiel pousse vers de l'open source qui ne sort pas de votre infrastructure. Un besoin plus standard s'accommode d'une API. Ce choix se tranche au cadrage, selon le cas.

Ce que ça ne fait pas

Le RAG ne crée pas de savoir. Si la réponse n'est écrite nulle part chez vous, le chatbot ne la devinera pas, et c'est tant mieux : on préfère un « je ne trouve pas » à une invention. Il hérite aussi de l'état de vos sources. Une documentation périmée donne des réponses périmées, présentées avec la même assurance. La mise à jour du corpus fait partie du dispositif, dès le départ.

Le risque de réponse fausse se réduit beaucoup, il ne tombe pas à zéro. Sur les sujets où une erreur engage votre responsabilité, le chatbot reste un premier niveau, jamais le dernier mot. Et avant d'ouvrir ce chantier, il faut une base assez riche et assez propre pour valoir l'effort. Quand ce n'est pas le cas, on le dit, et on commence par remettre la documentation d'aplomb. L'outil vient après, sur un socle qui tient.

// À EXPLORER

Continuer sur l'IA