Não acredite no hype por trás das calculadoras de ROI para voice AI. O modelo real é mais simples e mais honesto.
A maioria dos operadores subconta o custo de uma chamada telefônica pela metade. O erro é ancorar no salário do agente e parar aí.
Comece com o salário. Um agente de central de atendimento baseado nos EUA ganha algo em torno de US$ 18-US$ 22 por hora em 2026. Esse é o número na carta de oferta. Não é o número que atinge o P&L. Adicione benefícios, impostos sobre a folha e tempo livre remunerado (digamos 25-35% sobre a base). Adicione substituição por atrição, porque os papéis de central de atendimento rotacionam a 30-45% anualmente e substituir um único agente custa US$ 5.000-US$ 10.000 em recrutamento, onboarding e ramp. Adicione custos indiretos de gerenciamento (um supervisor por 8-12 agentes) e o especialista de QA auditando gravações. Adicione imóveis ou ferramentas de trabalho remoto, licenças de software, headsets e o programa de treinamento exigido para manter o piso atual sobre mudanças de política.
Quando esses itens de linha se acertam, o custo totalmente onerado de um agente dos EUA roda cerca de US$ 29-US$ 42 por hora, de acordo com o benchmarking de central de contato de 2026. Os provedores nearshore no Caribe e na América Latina entram em torno de US$ 8-US$ 18 por hora, com trade-offs previsíveis em adequação de idioma, retenção e consistência de marca. O onshore australiano chega ao máximo perto de US$ 65 por hora.
Agora traduza isso para um número por chamada. O benchmark da indústria para custo por chamada entre grandes operações fica entre US$ 2,70 e US$ 5,60, dependendo do vertical e da complexidade da chamada. Esse é o número a usar, porque ele captura a carga real.
A voice AI moderna é precificada quase como o inverso da economia de central de contato legada. Sem taxa de plataforma. Sem contrato anual. Sem licença por assento. Você paga por minuto de conversa, e é isso.
Em uma configuração atual da Retell com GPT 4.1 como o LLM, vozes da plataforma Cartesia ou Retell para TTS e telefonia padrão, a taxa tudo-incluído é cerca de US$ 0,11 por minuto. Uma chamada de quatro minutos custa US$ 0,44. Um milhão de minutos por mês custa US$ 110.000.
Compare isso ao equivalente humano. Um milhão de minutos (assumindo chamadas com média de cinco minutos, então 200.000 chamadas) na ponta baixa do benchmark de custo por chamada da indústria roda US$ 540.000. Na ponta alta, US$ 1,12 milhão. A IA é mais barata em 5-10x antes de você contar qualquer coisa que não seja mão de obra direta.
A construção empresarial realista é um pouco mais rica. Adicione uma base de conhecimento (+US$ 0,005/min), guardrails (+US$ 0,005/min), redação de PII (+US$ 0,01/min) e garantia de qualidade com IA revisando cada chamada (+US$ 0,10/min após as primeiras 100 grátis). Mesmo totalmente onerada, a taxa por minuto permanece abaixo de US$ 0,25. A conta ainda ganha bastante significativamente.
É aqui que o modelo fica interessante. O custo de uma chamada perdida raramente aparece em uma planilha mas deveria. Os dados da indústria consistentemente mostram que 20-30% das chamadas de negócio de entrada ficam não atendidas ou são abandonadas na fila. Para uma empresa de serviços residenciais cotando tickets médios de US$ 400, cada chamada perdida é uma perda de valor esperado de US$ 400 multiplicada pela taxa de conversão. Para um consultório odontológico, cada chamada perdida é uma reserva que foi embora. Para uma equipe de SaaS liderada por vendas lidando com demos de entrada, cada chamada perdida é o valor de tempo de vida de um cliente que você não consegue mais fechar.
Os agentes de voz com IA eliminam a linha de abandono porque eles atendem cada chamada imediatamente, em paralelo, sem limite de concorrência prático. Esses 20-30% de receita que costumavam ir embora agora permanecem.
Há um segundo efeito na saída. A pesquisa de resposta a lead consistentemente mostra que ligar para um lead de entrada fresco dentro de cinco minutos converte a múltiplos da taxa de ligar uma hora depois. A maioria das equipes não consegue ter pessoal para isso. A IA consegue, e rotineiramente faz. A iSpeedToLead, uma operação de marketing de performance, usou um parceiro certificado Retell para escalar para cobertura de lead 24/7 e derrubou os tempos de resposta diretamente no ponto ideal de conversão.
Adicione a linha de recuperação de chamada perdida e a linha de velocidade de resposta a lead ao seu modelo e a conta frequentemente fica dramática. As economias de custo por minuto começam a parecer a metade menor da história.
Você precisa de cinco números e duas fórmulas. As cinco entradas: volume de chamada de entrada mensal (N), tempo de tratamento médio em minutos (T), custo por minuto de chamadas tratadas por humano (Cₕ, padrão US$ 0,55), custo por minuto de chamadas tratadas por IA (Cₐ, padrão US$ 0,11), taxa de contenção de IA (R, padrão 65%), taxa atual de chamadas perdidas (M, padrão 25%) e valor de receita médio por chamada de entrada convertida (E, coloque o seu próprio).
As duas fórmulas: 1) Economia de custo direto por mês = N × T × R × (Cₕ − Cₐ)
2) Receita recuperada por mês = N × M × E
Rode isso em uma operação de médio porte: 20.000 chamadas de entrada por mês, tempo de tratamento médio de 5 minutos, custo de linha de base de US$ 0,55 por minuto, custo de IA de US$ 0,11 por minuto, 65% de contenção, 25% atualmente perdidas, US$ 40 de receita média por chamada de entrada.
Economia direta: 20.000 × 5 × 0,65 × US$ 0,44 = US$ 28.600 por mês.
Receita recuperada: 20.000 × 0,25 × US$ 40 = US$ 200.000 por mês.
Custo de rodar a IA: 20.000 × 5 × US$ 0,11 = US$ 11.000 por mês.
Impacto mensal líquido: cerca de US$ 217.000. Anualizado, US$ 2,6 milhões.
O piloto se paga dentro da primeira semana de operação. Esse é todo o modelo. Coloque os seus números reais, teste sob estresse as suposições com que você está nervoso e apresente-o. A forma da resposta não muda muito quando você testa a sensibilidade das entradas. Corte a taxa de chamadas perdidas pela metade. Corte a receita média por chamada pela metade. Corte a taxa de contenção para 50%. O número ainda é muito grande.
O modelo é teórico até você ver operadores rodando-o. A Sunshine Loans lida com mais de 700.000 aplicações mensais em toda a operação de crédito dela. Antes da Retell, o suporte ao cliente não conseguia acompanhar e as taxas de abandono estavam comendo diretamente o volume aprovado. Após a implantação, o abandono caiu para 5% e a equipe escalou o suporte sem escalar proporcionalmente o número de pessoas. A economia de crédito vive e morre na conclusão do funil. Eles moveram a linha.
A Anker, a marca de eletrônicos de consumo que a maioria das pessoas conhece de produtos de carregamento, substituiu uma rede fragmentada de fornecedores de suporte regionais por agentes Retell lidando com suporte ao cliente global em voz de qualidade humana. A economia na consolidação de fornecedores é real. A maior vitória é a consistência. Cada chamada agora soa como a Anker, em qualquer idioma, a qualquer hora.
A Everise roda operações de service desk interno para clientes empresariais, o tipo de fluxo de ticket de TI e RH sem glamour que consome uma fortuna silenciosa em empresas de mid-market. A implantação Retell deles agora contém 65% dos tickets de service desk interno sem um humano sequer atender. Essa é uma taxa de contenção que transforma um centro de custo em um item de linha de orçamento que os executivos param de notar.
A GiftHealth, uma plataforma de entrega de prescrição de saúde, alcançou 4x de eficiência operacional rodando chamadas de coordenação de paciente e farmácia por meio de agentes Retell. Em um negócio onde cada handoff coordenado entre prescritor, farmácia e paciente custa mão de obra, um multiplicador de 4x é a diferença entre escalar e empacar.
Há um padrão recorrente entre essas empresas. Construa o modelo, rode o piloto, observe os números se moverem.
Há algumas exceções aqui que vale a pena notar. Se o seu volume de chamada é genuinamente minúsculo (abaixo de algumas centenas de minutos por mês), as economias não vão financiar um projeto significativo. O custo fixo de rodar o experimento não é zero. Espere até o volume justificar a atenção.
Se as suas chamadas são excepcionalmente complexas e exigem julgamento humano em cada turno (triagem clínica avançada, underwriting multi-apólice complexo, aconselhamento legal de alto risco), a taxa de contenção de IA cai para 20-30% e o modelo fica menos atraente. A IA ainda ajuda como uma camada de triagem e intake, mas as economias são modestas e o design precisa ser cuidadoso.
Se o seu negócio é construído sobre a chamada telefônica ser a experiência (hospitalidade de luxo, concierge de altíssimo contato, vendas white-glove de negócios de US$ 1M+), automatizá-la é a decisão errada. Nem todo negócio está resolvendo o mesmo problema. Para todo o resto (e "todo o resto" é a vasta maioria do trabalho baseado em telefone em 2026) a conta está fechada.
O ROI dos agentes de voz com IA não é um pitch. É um modelo de cinco entradas com duas fórmulas, conectado aos seus números reais, verificado contra benchmarks da indústria. Construa-o. Teste-o sob estresse. Rode um piloto no seu tipo de chamada mais doloroso e deixe os dados defenderem o caso para o segundo.
Cadastre-se de graça em dashboard.retellai.com e experimente a calculadora de ROI com o seu próprio volume. Ou agende uma demo e vamos conectar os seus números ao modelo ao vivo e lançar um piloto funcional dentro de duas semanas.
Fontes:
Veja quanto seu negócio poderia economizar ao migrar para agentes de voz com IA.
Total Human Agent Cost
AI Agent Cost
Estimated Savings
Um número de telefone de demonstração do consultório da Retell Clinic

Start building smarter conversations today.


