Formation : Concevoir et industrialiser des architectures RAG avec les LLM

Formation pratique - 2j - 14h00 - Réf. LLR

Concevoir et industrialiser des architectures RAG avec les LLM



Nouvelle formation



INTER
INTRA
SUR MESURE

Formation pratique en présentiel ou à distance
Formation disponible en anglais, à la demande

Réf. LLR
  2j - 14h00
Nous contacter
Pauses-café et
déjeuners offerts






Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Identifier les composants clés d’une architecture RAG et analyser les usages adaptés aux besoins métier.
Mettre en œuvre un pipeline RAG intégrant ingestion documentaire, vectorisation et génération augmentée.
Concevoir une architecture RAG sécurisée en tenant compte des contraintes de gouvernance et de conformité. Optimiser et industrialiser un système RAG avec recherche hybride, Reranking et mécanismes d’évaluation.

Prérequis
Connaissances de base en développement Python ou JavaScript et compréhension générale des API web. Des notions fondamentales en intelligence artificielle, data ou traitement documentaire sont recommandées.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

1
Comprendre les fondamentaux des architectures RAG

  • Identifier les limites des LLM et les apports des architectures RAG dans les usages métier.
  • Comprendre les étapes d’un pipeline RAG : ingestion, embeddings, indexation, retrieval et génération.
  • Analyser les principes du Chunking, des Embeddings denses et Sparse et de la recherche vectorielle.
  • Comparer les approches RAG naïf, avancé et agentique selon les cas d’usage.
  • Étudier les tendances récentes : Graph RAG, multi-hop retrieval, Self-RAG et Reflexion.
Travaux pratiques
Prise en main d’un pipeline RAG simple et analyse du fonctionnement des composants.

2
Mettre en œuvre un pipeline RAG opérationnel

  • Structurer un pipeline d’ingestion documentaire pour des fichiers PDF et contenus Markdown.
  • Réaliser le découpage, la vectorisation et l’indexation de documents dans une base vectorielle.
  • Configurer les interactions entre LLM, moteur de recherche vectorielle et génération augmentée.
  • Analyser les réponses produites et identifier les mécanismes limitant les hallucinations.
  • Utiliser des bases vectorielles telles que FAISS, Chroma, Pinecone ou Weaviate.
Travaux pratiques
Développement d’un RAG fonctionnel sur un corpus documentaire métier.

3
Concevoir une architecture RAG adaptée aux besoins métier

  • Formaliser un cas d’usage métier et identifier les attentes des utilisateurs et parties prenantes.
  • Évaluer les sources documentaires, la qualité des données et les contraintes de volumétrie.
  • Choisir les modèles d’Embeddings, les stratégies de Chunking et les composants d’architecture.
  • Concevoir un pipeline d’ingestion cohérent avec les contraintes de performance et d’exploitation.
  • Intégrer les enjeux de conformité, de sécurité des données et de gestion des accès.
Travaux pratiques
Etude de cas et conception d’une architecture RAG complète répondant à un besoin métier.

4
Sécuriser et gouverner un système RAG

  • Formaliser un cas d’usage métier et identifier les attentes des utilisateurs et parties prenantes.
  • Mettre en œuvre des mécanismes de contrôle des accès et de sécurisation des données sensibles.
  • Appliquer les principes de chiffrement des données au repos et en transit dans un environnement RAG.
  • Définir des règles de gouvernance pour les usages des LLM et des données internes.
  • Évaluer les impacts réglementaires et les exigences de conformité, notamment RGPD.
Travaux pratiques
Etude de cas et conception d’une architecture RAG complète répondant à un besoin métier.

5
Optimiser les performances et la qualité du Retrieval

  • Mettre en œuvre des mécanismes de recherche hybride combinant BM25 et recherche vectorielle.
  • Exploiter les techniques de reranking avec cross-encoders pour améliorer la pertinence des réponses.
  • Utiliser les filtres de métadonnées et la gestion multi-utilisateurs dans un contexte professionnel.
  • Mesurer les performances avec Precision@k, Recall et MRR.
  • Identifier les leviers d’optimisation de la qualité et des temps de réponse.
Travaux pratiques
Optimisation d’un pipeline RAG avec recherche hybride et évaluation des résultats.

6
Industrialiser et déployer un assistant métier basé sur un RAG

  • Industrialiser un pipeline d’ingestion avec parsing avancé, nettoyage et enrichissement des données.
  • Mettre en place des mécanismes de versioning et de gestion du cycle de vie des données.
  • Comprendre les principes des agents et du tool-augmented RAG pour enrichir les interactions.
  • Préparer le déploiement et l’exploitation d’un système RAG dans un environnement professionnel.
Travaux pratiques
Construction d’un assistant documentaire métier basé sur une architecture RAG avancée.


Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.

Horaires
Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les formations de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.