A Base de Conhecimento é o lugar onde você organiza tudo o que o avatar sabe para responder bem às pessoas usuárias. Ela é composta por listas (conjuntos de conteúdos) e pelos próprios conteúdos (blocos de informação que alimentam o RAG).

Ideia central: a qualidade da Base de Conhecimento depende da forma como você organiza as listas e principalmente de como escreve cada conteúdo em blocos menores, claros e atualizados.

Como a Base de Conhecimento se conecta com os outros pilares

No modelo dos 5 Pilares da Inteligência Conversacional (Identidade & Comportamento, Conteúdos, Integrações, Internet e Automações), a Base de Conhecimento representa o pilar de Conteúdos:

  • ela guarda o que o avatar sabe (fatos, regras, políticas, detalhes de produto);
  • ela é usada sob demanda, quando a pergunta da pessoa usuária exige consulta;
  • o conteúdo só entra na resposta se fizer sentido dentro do contexto da conversa.

Enquanto isso:

  • o pilar de Identidade & Comportamento define quem o avatar é e como deve agir;
  • Integrações e Automações definem o que ele consegue fazer no sistema;
  • Internet (quando habilitada) amplia onde pode buscar informação externa.

Se houver conflito entre uma instrução permanente e um conteúdo da Base de Conhecimento, a Identidade & Comportamento é quem prevalece.

Entendendo a estrutura: Base, listas e conteúdos

  • Base de Conhecimento

  • Listas

  • Conteúdos

É o conjunto completo de todas as listas e conteúdos cadastrados. Ela representa o universo de informações que o avatar pode consultar para responder às pessoas usuárias.

  • agrupa o conhecimento de múltiplas áreas do negócio;
  • serve como fonte oficial de verdade para o avatar;
  • é 100% armazenada, mas apenas parte dela entra em cada resposta.

Como a IA usa os conteúdos (visão prática do RAG)

A plataforma utiliza um algoritmo de RAG (Retrieval-Augmented Generation), que combina busca semântica inteligente com modelos de linguagem.

Funciona, em alto nível, assim:

  1. A pessoa usuária envia uma mensagem.
  2. O sistema analisa o contexto da conversa e procura na Base de Conhecimento quais conteúdos são mais parecidos e relevantes para aquela mensagem.
  3. Apenas os conteúdos mais relevantes são selecionados para compor o contexto.
  4. Esses conteúdos são enviados para o modelo de IA, que monta a resposta considerando:
    • o histórico da conversa,
    • os blocos selecionados pelo RAG
    • e o envelope de Identidade & Comportamento.

Alguns pontos importantes:

  • embora a plataforma armazene 100% dos conteúdos, apenas uma pequena parte entra em cada resposta;
  • conteúdos pouco relevantes para a mensagem atual nem entram no contexto, então a IA não utilizará esses dados para responder;
  • o algoritmo prioriza sempre qualidade e relevância, não quantidade.

A pilha de tokens: por que tamanho do conteúdo importa

Quando o RAG seleciona os melhores conteúdos, ele empilha esses blocos para enviar ao modelo de IA. Essa pilha tem um limite aproximado entre 2.500 e 3.000 tokens.

Isso significa que:

  • nunca vai todo o conteúdo da Base de Conhecimento;
  • vai apenas o número de blocos que cabe nessa pilha;
  • conteúdos muito grandes podem ocupar quase toda a pilha sozinhos.

Cuidado com conteúdos gigantes: mesmo que só o primeiro parágrafo seja muito relevante, se o bloco inteiro for grande, ele vai consumir boa parte da pilha de tokens e pode impedir que outros blocos importantes entrem no contexto.

Consequências práticas:

  • se um conteúdo ultrapassar o limite efetivo da pilha, ele pode ser cortado ou até desconsiderado na resposta;
  • conteúdos mais compactos permitem empilhar mais blocos relevantes ao mesmo tempo, enriquecendo a resposta;
  • um único conteúdo enorme, se for o mais relevante, pode ocupar a pilha quase inteira e deixar outros blocos relevantes de fora.

Tamanho recomendado dos blocos de conteúdo

Para equilibrar profundidade e efetividade, usamos esta referência:

  • conteúdos em torno de 1.200 caracteres costumam equivaler a algo perto de 340 tokens (varia por idioma e estilo de escrita);
  • mantendo os conteúdos próximos desse tamanho, é comum que pelo menos 8 blocos relevantes sejam empilhados para construir a resposta;
  • por outro lado, se existir um único bloco com 10.500 caracteres e ele for o mais relevante, é provável que só ele seja usado na resposta, deixando outros blocos importantes de fora.

Regra prática: prefira conteúdos menores e com foco em um tema específico. Quanto mais especializado for o bloco, maior a chance de ele ser escolhido e combinado com outros blocos igualmente relevantes.

Como construir bons blocos de conteúdo

Um bom conteúdo costuma seguir estas características:

  1. Um tema central bem definido
    • Ex.: “Prazo de entrega padrão”, “Regras de troca”, “Escalação do suporte”.
  2. Texto enxuto e direto ao ponto
    • Explique o essencial, evitando histórico, marketing ou detalhes irrelevantes.
  3. Estrutura visual clara para humanos
    • Use parágrafos curtos, listas e subtítulos para facilitar leitura.
  4. Conexão explícita com outros blocos
    • Quando fizer sentido, use o mesmo título ou uma convenção de nomes parecida.

Exemplo prático: partida de futebol

Imagine que você está documentando um jogo de futebol específico. Você poderia escrever um único conteúdo gigante com:

  • detalhes da partida,
  • informações sobre ingressos,
  • escalação dos times,
  • orientações de acesso ao estádio,
  • regras especiais daquele evento.

Esse conteúdo seria difícil de recuperar com precisão e poderia estourar a pilha de tokens. Em vez disso, crie vários blocos menores, todos com o mesmo título principal, diferenciados por subtítulos internos ou contexto.

Por exemplo:

  • Título comum de todos os blocos: Campeonato Brasileiro 2026 - Jogo X vs Y

E então separe em vários conteúdos:

  1. Bloco 1 – Detalhes da partida
    • Data, horário, local, competição, regras gerais do jogo.
  2. Bloco 2 – Informações sobre ingressos
    • Lotes, preços, tipos de ingresso, política de meia-entrada.
  3. Bloco 3 – Escalação e elenco
    • Prováveis escalações, número das camisas, comissão técnica.
  4. Bloco 4 – Acesso ao estádio e logística
    • Portões, recomendações de chegada, itens proibidos, transporte.

Todos os blocos compartilham o mesmo título, aumentando a correlação entre eles e ajudando o RAG a entender que falam do mesmo evento. Ao mesmo tempo, cada bloco é pequeno o suficiente para caber na pilha junto com outros conteúdos relevantes.

Estrutura sugerida de um conteúdo

TÍTULO: [nome claro do tema]

IDEIA PRINCIPAL
Explique em 1 ou 2 frases diretas qual é a mensagem central deste conteúdo.

DETALHES ESSENCIAIS
- Traga os pontos que a pessoa usuária realmente precisa saber para agir.
- Evite informações laterais ou históricas que não ajudam na decisão.

EXEMPLOS PRÁTICOS
- [pergunta comum] -> [resposta esperada]
- [pergunta de borda] -> [resposta esperada]

Exemplos de conteúdos médios

TÍTULO: Prazo padrão de entrega nacional

IDEIA PRINCIPAL
Nos pedidos enviados para endereços dentro do Brasil, o prazo padrão de entrega
é de 7 a 10 dias úteis após a confirmação do pagamento.

DETALHES ESSENCIAIS
- O prazo começa a contar no próximo dia útil após a aprovação do pagamento.
- Feriados nacionais e locais podem estender o prazo em até 2 dias úteis.
- O código de rastreio é enviado por e-mail assim que o pedido é postado.

EXEMPLOS PRÁTICOS
- "Meu pedido foi aprovado ontem, quando chega?" -> Explique o prazo contando a
  partir do próximo dia útil, citando a janela de 7 a 10 dias úteis.
- "Caiu em feriado na minha cidade, muda o prazo?" -> Informe que feriados podem
  estender em até 2 dias úteis e oriente a acompanhar o rastreio.

Expiração de conteúdos

Nem toda informação é permanente. Para evitar respostas desatualizadas, cada conteúdo pode ter uma data de expiração:

  • até a data de expiração, o conteúdo pode ser selecionado pelo RAG normalmente;
  • após a expiração, o conteúdo não é mais considerado na construção da pilha de blocos, mesmo que ainda esteja armazenado na Base de Conhecimento;
  • isso é especialmente útil para:
    • promoções com data definida,
    • regras de campanha,
    • eventos pontuais (como o jogo de futebol do exemplo),
    • políticas provisórias.
Exemplo da tela de configuração de data de expiração do conteúdo, mostrando as opções 'Nunca expirar' e 'Definir data de expiração' com seleção de data e horário.

Definição de data de expiração de um conteúdo

Sempre que criar um conteúdo com prazo de validade claro, defina a expiração. Assim você reduz o risco da IA responder com base em informações vencidas.

O Editor de conteúdos

O editor da plataforma permite formatar o texto de forma amigável para quem está operando a Base de Conhecimento. Em geral, você pode:

  • aplicar negrito, itálico e sublinhado;
  • marcar trechos como código ou destacar termos técnicos;
  • escolher o tipo de bloco (parágrafo, título, lista, citação);
  • inserir links clicáveis;
  • adicionar imagens ilustrativas;
  • criar listas com marcadores ou listas numeradas;
  • montar tabelas simples para organizar dados.
Tela do editor de conteúdos mostrando um exemplo de conteúdo médio com título, ideia principal, detalhes essenciais e exemplos práticos.

Editor de conteúdos com um exemplo de bloco em tamanho médio

A IA não leva em conta itálicos, negritos ou outros aspectos visuais da formatação. Toda a formatação serve apenas para facilitar a leitura e organização para quem edita e revisa os conteúdos.

Boas práticas no uso do editor:

  • use negrito e listas para destacar partes importantes para humanos;
  • mantenha o texto semanticamente claro mesmo se alguém ler tudo em um bloco simples, sem formatação.

Exportar conteúdos

A tela de Exportar conteúdos permite levar as informações da Base de Conhecimento para fora da plataforma, facilitando auditoria, revisão em grupo ou integrações manuais com outros sistemas.

Ao abrir a exportação, você pode escolher:

  • O que exportar
    • Apenas o conteúdo atual (bloco aberto): exporta somente o bloco que está selecionado na tela.
    • Todos os conteúdos do filtro atual: exporta um conjunto maior, de acordo com os filtros aplicados (por exemplo, lista selecionada, período, status).
  • Formato do arquivo
    • CSV: ideal para abrir em planilhas simples, fazer filtros rápidos ou integrar com ferramentas que aceitam esse formato.
    • Excel (XLSX): recomendado para análises mais ricas em planilhas, com tabelas dinâmicas e filtros avançados.
    • PDF: útil para compartilhamento estático (por exemplo, enviar para aprovação de áreas internas ou guardar como registro).

Alguns usos práticos da exportação:

  • revisar tamanhos de conteúdos e identificar blocos gigantes que precisam ser quebrados;
  • checar quais blocos estão próximos da expiração;
  • compartilhar a Base de Conhecimento com outras áreas para validação;
  • apoiar migrações e auditorias de informação.

Checklist antes de salvar um conteúdo

Antes de publicar ou atualizar um bloco na Base de Conhecimento, confirme:

  • O conteúdo trata de apenas um tema principal.
  • O texto está claro para alguém que não conhece o assunto.
  • O tamanho está adequado (evitando blocos gigantes).
  • Existem limites e exceções explícitos, quando necessário.
  • A data de revisão está preenchida e faz sentido.
  • O conteúdo não contradiz outros blocos da mesma lista.
  • O assunto realmente pertence à Base de Conhecimento, e não ao Comportamento ou às Automações.

Se a resposta para todas as perguntas for “sim”, você provavelmente tem um conteúdo bem estruturado para ajudar o avatar a responder com mais precisão.