← Voltar ao glossário

Chunking

O processo de quebrar documentos em pedaços ("chunks") antes de indexá-los para recuperação. É um dos pontos mais subestimados — e mais determinantes — da qualidade de um RAG.

Chunks pequenos demais perdem contexto semântico; grandes demais diluem a informação relevante e desperdiçam janela de contexto. Estratégias avançadas usam chunking semântico (quebrar por unidade de sentido) ou recursivo, em vez de cortar a cada N caracteres cegamente.