O manual do operador para sair do 0 ao 1 com um agente telefônico ao vivo, pronto para produção, e escalá-lo a partir daí.
Três anos atrás, colocar um agente de voz com IA funcionando em um número de telefone real era um projeto de engenharia de seis meses. Você precisava de dois desenvolvedores, uma integração com a Twilio, um pipeline caseiro para fala-para-texto e texto-para-fala, um LLM ajustado por você mesmo e a paciência para impedir que tudo isso desmoronasse sob a própria latência. A maioria das equipes desistia. As que não desistiam acabavam com algo que conseguia ler um roteiro, mas não conseguia de fato sustentar uma conversa.
Esse mundo acabou. O gargalo passou da engenharia para o produto. Hoje, a pergunta não é "conseguimos construir isto?". É "o que queremos que ele diga?". Se você consegue escrever uma descrição de cargo clara para uma nova contratação e clicar por um dashboard, você consegue colocar um agente de voz no ar antes do almoço.
Este é o manual. Ao final dele, você vai ter um agente de IA ao vivo atendendo um número de telefone real, fazendo um trabalho útil e aprendendo com cada chamada. Vamos usar a Retell AI como exemplo porque a experiência de construção realmente cabe em 30 minutos, mas os princípios se traduzem para qualquer plataforma moderna.
Pule esta parte e o seu agente vai soar genérico. Gaste cinco minutos nela e o seu agente vai soar como você. Comece pelo trabalho. Uma frase, e quanto mais específica, melhor. "Cuidar do atendimento ao cliente" é amplo demais para ser útil. "Atender chamadas recebidas depois das 18h, capturar nome e número de retorno, e agendar compromissos não urgentes na nossa agenda do Cal.com" é algo que um agente de fato consegue fazer. Um agente estreito bem construído vai vencer um agente amplo mal construído em todas as vezes.
Em seguida, anote o que você diria a uma nova contratação no primeiro dia. Quem está ligando, o que querem, quais respostas você dá em 90 por cento das vezes, quando você passaria para um humano e que tom você quer que o agente adote. Isso se torna o seu prompt. Já que está nisso, encontre a URL da sua página de FAQ ou o PDF do seu cardápio de serviços. Isso se torna a sua base de conhecimento. E decida para onde a chamada vai quando o agente desistir: um celular, um ramal, uma fila. Não resolva isto às 23h na noite do lançamento. Essa é a preparação. Se você tem essas quatro coisas, está pronto.
Vá até dashboard.retellai.com e crie uma conta. Contas novas recebem US$ 10 em créditos gratuitos — o suficiente para cerca de 90 minutos de conversa em uma configuração padrão. Sem cartão de crédito. Sem contrato anual. (Detalhes de preços)
Assim que entrar, você será solicitado a escolher um tipo de agente. São três, e a escolha importa mais do que as pessoas imaginam:
A nossa escolha para o seu primeiro agente: Prompt Único. Você sempre pode migrar para o Fluxo de Conversa depois, e você vai aprender mais sobre os seus padrões reais de conversa em dois dias de chamadas ao vivo do que em duas semanas de design de fluxo.
O prompt é o agente. Não complique demais, mas também não faça nas coxas. Aqui está um template que produz agentes fortes de forma consistente — copie, preencha os colchetes, coloque no ar.
# IdentidadeVocê é a [Maya], uma [recepcionista de telefone] [calorosa, calma, profissional]da [Northside Family Dentistry], um [consultório odontológico familiar emAustin, TX, com 4 dentistas atendendo cerca de 8.000 pacientes].# Estilo- Fale com naturalidade. Contrações são boas. Palavras de apoio como "claro" e "entendi" são boas. Sermões longos são ruins.- Mantenha as respostas em 1-2 frases, a menos que peçam mais.- Espelhe o ritmo de quem liga. Se estiver com pressa, seja eficiente. Se for conversador, seja caloroso.- Nunca diga "como uma IA" ou "sou uma assistente de IA". Se perguntarem diretamente se você é uma pessoa, diga: "Sou a Maya, a assistente virtual da recepção da Northside. Fico feliz em ajudar — ou posso te conectar a um colega, se preferir."# O que você pode fazer1. Responder perguntas comuns (horários, localização, convênios aceitos, processo para novos pacientes) — veja a base de conhecimento.2. Agendar ou remarcar uma limpeza de rotina usando a função book_appointment.3. Anotar um pedido de retorno e avisar a equipe pela função send_callback.# O que você NÃO faz- Dar orientação clínica. Para dor, inchaço, sangramento, trauma ou qualquer coisa que pareça urgente, transfira para a linha de plantão imediatamente usando transfer_to_oncall.- Cotar preços de procedimentos que não sejam limpezas (US$ 150 para quem não tem convênio). Para qualquer outra coisa, ofereça um retorno.- Prometer cobertura de convênio. Se perguntarem, diga que vamos verificar e retornar a ligação.# Regras de conversa- Abra com: "Obrigada por ligar para a Northside Family Dentistry, aqui é a Maya — como posso ajudar?"- Sempre confirme nomes e números de telefone soletrados de volta a quem liga.- Encerre as chamadas com: "Posso ajudar com mais alguma coisa hoje?" e em seguida uma despedida calorosa.- Se quem liga estiver chateado, reconheça antes de resolver: "Eu te entendo, e sinto muito por isso — deixe eu ver o que posso fazer."
Algumas notas sobre o que faz isso funcionar:
A identidade vem primeiro. O modelo vai passar a chamada inteira inferindo quem ele é. Diga isso explicitamente. Quanto mais textura na identidade ("familiar, 8.000 pacientes, Austin"), mais naturalmente ele adota a voz.
As regras de estilo são curtas. "Fale com naturalidade. Use contrações. Mantenha as respostas curtas." Cinco linhas vencem cinquenta. Os modelos seguem instruções de estilo diretas e simples muito melhor do que as longas.
As capacidades são listadas. Isto é o que o agente pode fazer — referenciando as funções que você vai conectar no passo 5.
As anticapacidades são listadas mais alto. O que ele não vai fazer é igualmente importante. A razão número um de os agentes iniciais saírem dos trilhos é que eles tentam ser prestativos em um domínio onde a prestatividade é perigosa (orientação clínica, jurídica, financeira).
O andaime conversacional é explícito. Frase de abertura, comportamento de confirmação, frase de encerramento. Sem isso, você vai descobrir o seu agente improvisando aberturas a cada chamada. Com isso, a sua marca se mantém consistente.
A Retell te dá um menu de LLMs e provedores de TTS, com preço por minuto. Para o seu primeiro agente, ignore a tentação de otimizar:
O que de fato move o ponteiro na qualidade percebida é a latência, não o exotismo da voz. A stack da Retell roda a cerca de 600ms de tempo de resposta de ponta a ponta — abaixo do limiar em que quem liga registra um "atraso" entre falar e receber resposta. Benchmarks independentes a colocaram repetidamente na frente do grupo nessa métrica, e essa é a maior razão isolada para um agente da Retell parecer uma pessoa enquanto um mais lento parece um chatbot lendo falas.
Escolha uma voz. Ouça uma amostra de 5 segundos. Se ela não te fizer torcer o nariz, siga em frente.
O prompt cuida de como o seu agente fala. A base de conhecimento cuida do que ele sabe.
Nas configurações do agente, clique em Base de Conhecimento → Criar. Três formas de alimentá-la:
A Retell usa RAG em streaming (geração aumentada por recuperação) a cada turno. Tradução: o agente busca o trecho certo durante a conversa, em tempo real, sem que você tenha de antecipar cada pergunta. Adicione uma nova entrada de FAQ numa terça à tarde e o agente já sabe na próxima chamada.
Dica profissional: Se o seu agente vai receber as mesmas cinco perguntas cem vezes por dia, coloque essas cinco respostas diretamente no prompt, não só na base de conhecimento. O conteúdo do prompt é sempre mais rápido e sempre disponível, sem viagem de ida e volta de recuperação. Use a base de conhecimento para a cauda longa.
É aqui que a maioria das demos de "IA de voz" silenciosamente desmorona. Falar é fácil. Fazer é o pulo do gato. Uma recepcionista que não consegue de fato agendar o compromisso é só uma caixa postal cara.
A Retell tem funções predefinidas para as coisas de que 80% dos agentes precisam:
Para o nosso exemplo odontológico, queremos três:
book_appointment — a integração com o Cal.com. Conecte em dois cliques. Passe patient_name, phone, preferred_time. (Recurso de agendar compromissos)send_callback — uma função personalizada apontada para um webhook do Zapier ou Make que joga o pedido no Slack da sua equipe e no seu CRM. (Integração com Make)transfer_to_oncall — a transferência de chamada da Retell, apontada para o celular do dentista de plantão. (Recurso de transferência de chamada)No prompt, você vai referenciar essas funções pelo nome (já fizemos isso, no Passo 2). O modelo vai inferir quando chamá-las com base na conversa e nas descrições de função que você fornecer. Nenhuma lógica condicional para escrever. Nenhuma máquina de estados para manter. O modelo decide; a plataforma executa.
O ponto mais profundo: as funções transformam a IA de voz de um bot de FAQ em um sistema operacional. Cada chamada que o seu agente resolve de ponta a ponta sem uma transferência é uma chamada que não queimou o tempo de um agente, não ficou numa fila, não foi abandonada no quarto minuto. É aí que a conta do ROI fecha.
Não conecte um número de telefone até ter conversado com o seu agente pelo menos vinte vezes no simulador.
No dashboard, clique em Testar → Chamada Web. Você agora está falando com o seu agente pelo microfone do seu notebook, em tempo real, exatamente do jeito que quem liga vai falar. Percorra:
Para um rigor maior, use o Teste de Simulação — a Retell vai rodar dezenas de quem-liga sintéticos pelo seu agente em paralelo, com prompts que você define, e avaliar as saídas contra os seus critérios. (Visão geral de testes) Na primeira vez que rodamos num agente finalizado, ele revelou seis bugs em onze minutos. Vale a pena.
Você está procurando três coisas: consistência de tom, precisão na chamada de funções e falha graciosa. Se o agente consegue manter o personagem sob pressão, chamar as funções certas nos momentos certos e recuar para um humano quando as coisas ficam estranhas, você está pronto.
Dois caminhos:
Faça uma chamada de teste do seu celular. Ouça. Sorria. Envie o número a um colega e peça para tentar quebrá-lo.
Essa é a construção. O agente está no ar.
A prova está nos operadores que já fizeram isso. A Pine Park Health, um grupo de atenção primária atendendo comunidades de moradia para idosos, estava se afogando em jogo de telefone e vendo horários de profissionais ficarem vazios. Eles construíram um agente de voz na Retell para cuidar de agendamento, confirmações e remarcações. O NPS de agendamento subiu 38 por cento e a equipe clínica parou de gastar metade do dia no telefone.
A SWTCH, uma empresa de recarga de veículos elétricos, tinha um problema que o dinheiro não resolvia facilmente: quando um motorista está parado num carregador quebrado, "retornamos em 24 horas" não é uma resposta. Eles implantaram o Lucas, um agente da Retell que atende em segundos e guia os motoristas por uma solução urgente de problemas 24 horas por dia. Os custos de suporte caíram mais de 50 por cento e as margens de SaaS se moveram junto.
A Medical Data Systems é o estudo de caso que encerra a conversa sobre o que a IA de voz consegue lidar. A cobrança de dívidas é regulada, sensível no tom e implacável quando as conversas dão errado. Eles colocaram agentes da Retell nas chamadas recebidas e agora lidam com 100 por cento do volume de entrada com apenas 30 por cento de taxa de transferência, arrecadando cerca de US$ 280.000 por mês sem sacrificar a confiança dos pacientes que é todo o propósito do negócio.
O fio comum entre os três é algo que a maioria dos artigos sobre IA de voz erra. Nenhum deles tentou substituir a central de atendimento no primeiro dia. Cada um escolheu um único trabalho doloroso, colocou no ar um agente focado, ouviu chamadas reais e iterou. Eles resolveram um problema de seis dígitos no primeiro mês e continuaram construindo a partir daí.
O seu primeiro agente está no ar, e a tentação é imediatamente criar os agentes dois ao dez. Mas segure. Gaste 72 horas só ouvindo as chamadas reais que chegam. Os padrões que você vai encontrar, as perguntas que você não antecipou, as construções de frase que confundem o modelo, os momentos em que quem liga hesita, valem mais do que qualquer recurso que você possa lançar nessa janela.
Depois de ouvir, a alavancagem se acumula rapidamente. Inclua o teste de simulação no seu processo de release, para que as mudanças de prompt sejam testadas sob estresse antes de chegarem à produção. Ative os guardrails e a ocultação de PII, que juntos custam cerca de um centavo por minuto e te dão segurança de nível empresarial da noite para o dia. Use o versionamento e o teste A/B da Retell para dividir o tráfego entre o Prompt A e o Prompt B, e deixe a conversão de agendamento ou a taxa de transferência escolher o vencedor em vez do seu instinto. Ative o Controle de Qualidade por IA, que é o mais próximo de ter um gerente de QA ouvindo 100 por cento das suas chamadas sem pagar por um.
Depois, parta para a saída. Assim que o seu agente de entrada estiver estável, as chamadas em lote destravam uma categoria de alavancagem inteiramente diferente: lembretes de compromisso, requalificação de leads, reativação de clientes inativos, pesquisas de NPS. Adicione a Identificação de Chamada com Marca para que o seu nome e logo apareçam no telefone do destinatário, e as taxas de atendimento sobem de forma material. Se 12 por cento das suas chamadas são em espanhol, troque a configuração de idioma e a voz de TTS e você melhorou esses 12 por cento da sua experiência do cliente em uma tarde.
Construa o agente número dois em seguida, mas faça-o fazer um trabalho diferente. Se o seu primeiro agente é uma recepcionista de fora do horário, o seu segundo é um confirmador de compromissos de saída. Se o seu primeiro qualifica leads de entrada, o seu segundo liga de volta para os antigos. Trabalhos diferentes, métricas diferentes, ROI diferente que você consegue atribuir de forma limpa. As equipes com os maiores ganhos não são as que têm prompts mágicos. São as que revisam cinco chamadas por dia e apertam algo toda semana.
Algumas armadilhas que afundam os agentes iniciais, na ordem de quão frequentemente as vemos. Tentar construir a central de atendimento inteira no primeiro dia. Escrever um prompt de 4.000 palavras porque mais deve ser melhor (não é). Pular o teste de simulação porque "tentei cinco vezes e funcionou" parece suficiente (não é). Esquecer de desenhar o repasse para um humano, o que transforma uma saída de emergência graciosa em uma responsabilidade. Otimizar o custo antes da qualidade, o que é tentador até o seu agente cotar com confiança a sua política de reembolso errada e você comer um estorno. E talvez o erro mais comum de todos: tratar o agente como uma implantação de uma vez só em vez de um sistema que melhora toda semana se você deixar.
A construção de 30 minutos é o piso, não o teto. O teto é operar cada conversa baseada em telefone do seu negócio com um sistema que atende mais rápido do que o seu humano mais rápido, roda o tempo todo, custa cerca de US$ 0,11 por minuto em vez de US$ 0,50 e melhora toda semana em vez de rodar a cada trimestre.
Esse teto está mais perto do que a maioria dos operadores imagina. As empresas que tratam a IA de voz como um problema de 2027 vão acordar em 2027 e descobrir que os seus concorrentes lidaram com seis meses de chamadas recebidas sem contratar um único representante novo, e usaram o orçamento de quadro de pessoal economizado para baixar o preço delas na margem.
Construa o seu primeiro agente hoje. Ouça vinte chamadas esta semana. Construa o segundo na semana que vem. O ritmo a partir daqui é seu para definir.
Cadastre-se grátis em dashboard.retellai.com, ou agende uma demonstração e mapeamos um lançamento para o seu volume de chamadas e casos de uso específicos. Se você prefere ouvir antes de construir, ligue para a nossa linha de demonstração ao vivo e fale com um agente da Retell você mesmo.
Veja quanto seu negócio poderia economizar ao migrar para agentes de voz com IA.
Total Human Agent Cost
AI Agent Cost
Estimated Savings
Um número de telefone de demonstração do consultório da Retell Clinic

Start building smarter conversations today.


.avif)
.avif)