Nouveau : Datasets open source gratuits disponibles !Decouvrir →
ia rag

RAG : Retrieval Augmented Generation en pratique

Lucas M. 18 août 2024 1 min de lecture 1043 vues

Le probleme du contexte

Les LLMs ont une connaissance figee a leur date d'entrainement. RAG permet de leur fournir du contexte a jour en recuperant des documents pertinents avant la generation.

Pipeline RAG

1. Indexation : decoupez vos documents en chunks, generez des embeddings, stockez dans une base vectorielle (Pinecone, Weaviate, pgvector).

2. Retrieval : pour chaque requete, trouvez les chunks les plus proches semantiquement.

3. Generation : passez les chunks recuperes comme contexte au LLM avec la question de l'utilisateur.

Optimisations

Le chunking strategy est crucial. Trop petit = perte de contexte. Trop grand = bruit. Experimentez avec des chunks de 500-1000 tokens avec overlap.

Publie le 18 août 2024

Chaque semaine, le meilleur de la tech francaise

Tendances, salaires, outils et opportunites — directement dans votre boite mail.

Gratuit. Desabonnement en un clic. Pas de spam.