RAG (Retrieval-Augmented Generation)

Arquitetura que conecta um LLM a uma base de conhecimento externa antes de gerar a resposta. Em vez de confiar só no que o modelo "decorou" no treino, você recupera trechos relevantes de documentos seus e os injeta no prompt.

O ganho não é só reduzir alucinação — é rastreabilidade. Cada afirmação pode ser ligada à fonte, o que importa em ambientes corporativos e regulados. Na prática, a qualidade de um RAG depende menos do modelo e mais da engenharia de recuperação: chunking, embeddings, busca híbrida e reranking.

Veja também Dominando RAG: Fundamentos ao RAGFlow.