Base de Conhecimento
Estruture listas e conteúdos que o Avatar utilizará como base de conhecimento nas conversas.
A Base de Conhecimento é o lugar onde você organiza tudo o que o avatar sabe para responder bem às pessoas usuárias. Ela é composta por listas (conjuntos de conteúdos) e pelos próprios conteúdos (blocos de informação que alimentam o RAG).
Ideia central: a qualidade da Base de Conhecimento depende da forma como você organiza as listas e principalmente de como escreve cada conteúdo em blocos menores, claros e atualizados.
Como a Base de Conhecimento se conecta com os outros pilares
No modelo dos 5 Pilares da Inteligência Conversacional (Identidade & Comportamento, Conteúdos, Integrações, Internet e Automações), a Base de Conhecimento representa o pilar de Conteúdos:
- ela guarda o que o avatar sabe (fatos, regras, políticas, detalhes de produto);
- ela é usada sob demanda, quando a pergunta da pessoa usuária exige consulta;
- o conteúdo só entra na resposta se fizer sentido dentro do contexto da conversa.
Enquanto isso:
- o pilar de Identidade & Comportamento define quem o avatar é e como deve agir;
- Integrações e Automações definem o que ele consegue fazer no sistema;
- Internet (quando habilitada) amplia onde pode buscar informação externa.
Se houver conflito entre uma instrução permanente e um conteúdo da Base de Conhecimento, a Identidade & Comportamento é quem prevalece.
Entendendo a estrutura: Base, listas e conteúdos
Base de Conhecimento
Listas
Conteúdos
É o conjunto completo de todas as listas e conteúdos cadastrados. Ela representa o universo de informações que o avatar pode consultar para responder às pessoas usuárias.
- agrupa o conhecimento de múltiplas áreas do negócio;
- serve como fonte oficial de verdade para o avatar;
- é 100% armazenada, mas apenas parte dela entra em cada resposta.
Como a IA usa os conteúdos (visão prática do RAG)
A plataforma utiliza um algoritmo de RAG (Retrieval-Augmented Generation), que combina busca semântica inteligente com modelos de linguagem.
Funciona, em alto nível, assim:
- A pessoa usuária envia uma mensagem.
- O sistema analisa o contexto da conversa e procura na Base de Conhecimento quais conteúdos são mais parecidos e relevantes para aquela mensagem.
- Apenas os conteúdos mais relevantes são selecionados para compor o contexto.
- Esses conteúdos são enviados para o modelo de IA, que monta a resposta
considerando:
- o histórico da conversa,
- os blocos selecionados pelo RAG
- e o envelope de Identidade & Comportamento.
Alguns pontos importantes:
- embora a plataforma armazene 100% dos conteúdos, apenas uma pequena parte entra em cada resposta;
- conteúdos pouco relevantes para a mensagem atual nem entram no contexto, então a IA não utilizará esses dados para responder;
- o algoritmo prioriza sempre qualidade e relevância, não quantidade.
A pilha de tokens: por que tamanho do conteúdo importa
Quando o RAG seleciona os melhores conteúdos, ele empilha esses blocos para enviar ao modelo de IA. Essa pilha tem um limite aproximado entre 2.500 e 3.000 tokens.
Isso significa que:
- nunca vai todo o conteúdo da Base de Conhecimento;
- vai apenas o número de blocos que cabe nessa pilha;
- conteúdos muito grandes podem ocupar quase toda a pilha sozinhos.
Cuidado com conteúdos gigantes: mesmo que só o primeiro parágrafo seja muito relevante, se o bloco inteiro for grande, ele vai consumir boa parte da pilha de tokens e pode impedir que outros blocos importantes entrem no contexto.
Consequências práticas:
- se um conteúdo ultrapassar o limite efetivo da pilha, ele pode ser cortado ou até desconsiderado na resposta;
- conteúdos mais compactos permitem empilhar mais blocos relevantes ao mesmo tempo, enriquecendo a resposta;
- um único conteúdo enorme, se for o mais relevante, pode ocupar a pilha quase inteira e deixar outros blocos relevantes de fora.
Tamanho recomendado dos blocos de conteúdo
Para equilibrar profundidade e efetividade, usamos esta referência:
- conteúdos em torno de 1.200 caracteres costumam equivaler a algo perto de 340 tokens (varia por idioma e estilo de escrita);
- mantendo os conteúdos próximos desse tamanho, é comum que pelo menos 8 blocos relevantes sejam empilhados para construir a resposta;
- por outro lado, se existir um único bloco com 10.500 caracteres e ele for o mais relevante, é provável que só ele seja usado na resposta, deixando outros blocos importantes de fora.
Regra prática: prefira conteúdos menores e com foco em um tema específico. Quanto mais especializado for o bloco, maior a chance de ele ser escolhido e combinado com outros blocos igualmente relevantes.
Como construir bons blocos de conteúdo
Um bom conteúdo costuma seguir estas características:
- Um tema central bem definido
- Ex.: “Prazo de entrega padrão”, “Regras de troca”, “Escalação do suporte”.
- Texto enxuto e direto ao ponto
- Explique o essencial, evitando histórico, marketing ou detalhes irrelevantes.
- Estrutura visual clara para humanos
- Use parágrafos curtos, listas e subtítulos para facilitar leitura.
- Conexão explícita com outros blocos
- Quando fizer sentido, use o mesmo título ou uma convenção de nomes parecida.
Exemplo prático: partida de futebol
Imagine que você está documentando um jogo de futebol específico. Você poderia escrever um único conteúdo gigante com:
- detalhes da partida,
- informações sobre ingressos,
- escalação dos times,
- orientações de acesso ao estádio,
- regras especiais daquele evento.
Esse conteúdo seria difícil de recuperar com precisão e poderia estourar a pilha de tokens. Em vez disso, crie vários blocos menores, todos com o mesmo título principal, diferenciados por subtítulos internos ou contexto.
Por exemplo:
- Título comum de todos os blocos:
Campeonato Brasileiro 2026 - Jogo X vs Y
E então separe em vários conteúdos:
- Bloco 1 – Detalhes da partida
- Data, horário, local, competição, regras gerais do jogo.
- Bloco 2 – Informações sobre ingressos
- Lotes, preços, tipos de ingresso, política de meia-entrada.
- Bloco 3 – Escalação e elenco
- Prováveis escalações, número das camisas, comissão técnica.
- Bloco 4 – Acesso ao estádio e logística
- Portões, recomendações de chegada, itens proibidos, transporte.
Todos os blocos compartilham o mesmo título, aumentando a correlação entre eles e ajudando o RAG a entender que falam do mesmo evento. Ao mesmo tempo, cada bloco é pequeno o suficiente para caber na pilha junto com outros conteúdos relevantes.
Estrutura sugerida de um conteúdo
TÍTULO: [nome claro do tema]
IDEIA PRINCIPAL
Explique em 1 ou 2 frases diretas qual é a mensagem central deste conteúdo.
DETALHES ESSENCIAIS
- Traga os pontos que a pessoa usuária realmente precisa saber para agir.
- Evite informações laterais ou históricas que não ajudam na decisão.
EXEMPLOS PRÁTICOS
- [pergunta comum] -> [resposta esperada]
- [pergunta de borda] -> [resposta esperada]
Exemplos de conteúdos médios
TÍTULO: Prazo padrão de entrega nacional
IDEIA PRINCIPAL
Nos pedidos enviados para endereços dentro do Brasil, o prazo padrão de entrega
é de 7 a 10 dias úteis após a confirmação do pagamento.
DETALHES ESSENCIAIS
- O prazo começa a contar no próximo dia útil após a aprovação do pagamento.
- Feriados nacionais e locais podem estender o prazo em até 2 dias úteis.
- O código de rastreio é enviado por e-mail assim que o pedido é postado.
EXEMPLOS PRÁTICOS
- "Meu pedido foi aprovado ontem, quando chega?" -> Explique o prazo contando a
partir do próximo dia útil, citando a janela de 7 a 10 dias úteis.
- "Caiu em feriado na minha cidade, muda o prazo?" -> Informe que feriados podem
estender em até 2 dias úteis e oriente a acompanhar o rastreio.
Expiração de conteúdos
Nem toda informação é permanente. Para evitar respostas desatualizadas, cada conteúdo pode ter uma data de expiração:
- até a data de expiração, o conteúdo pode ser selecionado pelo RAG normalmente;
- após a expiração, o conteúdo não é mais considerado na construção da pilha de blocos, mesmo que ainda esteja armazenado na Base de Conhecimento;
- isso é especialmente útil para:
- promoções com data definida,
- regras de campanha,
- eventos pontuais (como o jogo de futebol do exemplo),
- políticas provisórias.

Definição de data de expiração de um conteúdo
Sempre que criar um conteúdo com prazo de validade claro, defina a expiração. Assim você reduz o risco da IA responder com base em informações vencidas.
O Editor de conteúdos
O editor da plataforma permite formatar o texto de forma amigável para quem está operando a Base de Conhecimento. Em geral, você pode:
- aplicar negrito, itálico e sublinhado;
- marcar trechos como
códigoou destacar termos técnicos; - escolher o tipo de bloco (parágrafo, título, lista, citação);
- inserir links clicáveis;
- adicionar imagens ilustrativas;
- criar listas com marcadores ou listas numeradas;
- montar tabelas simples para organizar dados.

Editor de conteúdos com um exemplo de bloco em tamanho médio
A IA não leva em conta itálicos, negritos ou outros aspectos visuais da formatação. Toda a formatação serve apenas para facilitar a leitura e organização para quem edita e revisa os conteúdos.
Boas práticas no uso do editor:
- use negrito e listas para destacar partes importantes para humanos;
- mantenha o texto semanticamente claro mesmo se alguém ler tudo em um bloco simples, sem formatação.
Exportar conteúdos
A tela de Exportar conteúdos permite levar as informações da Base de Conhecimento para fora da plataforma, facilitando auditoria, revisão em grupo ou integrações manuais com outros sistemas.
Ao abrir a exportação, você pode escolher:
- O que exportar
- Apenas o conteúdo atual (bloco aberto): exporta somente o bloco que está selecionado na tela.
- Todos os conteúdos do filtro atual: exporta um conjunto maior, de acordo com os filtros aplicados (por exemplo, lista selecionada, período, status).
- Formato do arquivo
- CSV: ideal para abrir em planilhas simples, fazer filtros rápidos ou integrar com ferramentas que aceitam esse formato.
- Excel (XLSX): recomendado para análises mais ricas em planilhas, com tabelas dinâmicas e filtros avançados.
- PDF: útil para compartilhamento estático (por exemplo, enviar para aprovação de áreas internas ou guardar como registro).
Alguns usos práticos da exportação:
- revisar tamanhos de conteúdos e identificar blocos gigantes que precisam ser quebrados;
- checar quais blocos estão próximos da expiração;
- compartilhar a Base de Conhecimento com outras áreas para validação;
- apoiar migrações e auditorias de informação.
Checklist antes de salvar um conteúdo
Antes de publicar ou atualizar um bloco na Base de Conhecimento, confirme:
- O conteúdo trata de apenas um tema principal.
- O texto está claro para alguém que não conhece o assunto.
- O tamanho está adequado (evitando blocos gigantes).
- Existem limites e exceções explícitos, quando necessário.
- A data de revisão está preenchida e faz sentido.
- O conteúdo não contradiz outros blocos da mesma lista.
- O assunto realmente pertence à Base de Conhecimento, e não ao Comportamento ou às Automações.
Se a resposta para todas as perguntas for “sim”, você provavelmente tem um conteúdo bem estruturado para ajudar o avatar a responder com mais precisão.