A sua equipe assinou um contrato de seis meses com um fornecedor de IA conversacional, construiu o agente e o lançou em 200 linhas de entrada. Na terceira semana, 14% das chamadas caíam no meio da frase, as transferências falhavam silenciosamente, e o seu provedor de trunk SIP culpava a plataforma de IA enquanto a plataforma de IA culpava o trunk SIP. Segundo a pesquisa do Gartner, a IA conversacional vai reduzir os custos de mão de obra de central de atendimento em US$ 80 bilhões em 2026, mas apenas para as equipes que acertam a camada de telefonia.
Este guia te conduz pela avaliação de fornecedores de IA conversacional especificamente quanto à gestão da infraestrutura de telefonia, para que você possa evitar as falhas de integração que descarrilam a maioria das primeiras implantações. Ao final, você vai ter uma lista curta de fornecedores pontuada e um plano de testes que verifica o atendimento de chamadas sob condições reais de produção usando a Retell AI como benchmark.
Um framework estruturado de avaliação de fornecedores que testa plataformas de IA conversacional contra os critérios de telefonia que determinam se os seus agentes sobrevivem ao tráfego telefônico real.
Ao final deste tutorial, a sua avaliação vai:
Antes de começar, você vai precisar de:
Você não consegue avaliar as capacidades de telefonia de um fornecedor sem saber a que está conectando. Documente a sua infraestrutura telefônica existente em uma única folha de referência.
Registre o seu provedor de trunk SIP (Twilio, Telnyx, Vonage ou PBX on-premises), o número de caminhos de chamada simultâneos, os seus volumes de chamada médio e de pico, e os codecs que o seu sistema suporta. Anote se você precisa manter os seus números atuais, se usa E911 e se as chamadas roteiam por uma plataforma de central de atendimento como Genesys ou Five9. Inclua os seus requisitos de conformidade: HIPAA, SOC 2, PCI-DSS, TCPA ou regulações específicas de cada estado. A FCC confirmou em 2024 que as vozes geradas por IA caem sob as restrições do TCPA, então todo fornecedor que você avaliar deve suportar a gestão de consentimento e a divulgação de IA no nível da chamada.
Você deve ter agora um documento de uma página do ambiente de telefonia que toda avaliação de fornecedor referencia.
Sem um scorecard estruturado, as demos dos fornecedores degeneram em passeios de recursos que obscurecem os critérios que importam em produção.
Construa uma matriz de avaliação ponderada cobrindo oito categorias: compatibilidade de trunk SIP (o fornecedor consegue conectar ao seu trunk existente sem substituí-lo), latência de resposta (medida de ponta a ponta, não só a inferência do LLM), estabilidade de chamadas simultâneas (desempenho sob o seu volume de pico), confiabilidade da transferência de chamada (repasse assistido com contexto), portabilidade e provisionamento de números, certificações de conformidade combinando com o seu setor, acesso a dados pós-chamada (transcrições, análise, metadados estruturados) e transparência de preços (detalhamento por minuto sem sobretaxas de telefonia ocultas). Pondere cada categoria com base no seu ambiente. Uma organização de saúde rodando agendamento de entrada vai ponderar o HIPAA e a transferência de chamada mais alto. Uma equipe de vendas de saída vai ponderar a capacidade de chamadas simultâneas e a vazão de chamadas em lote mais alto.
Você deve ter agora uma planilha com oito critérios ponderados pronta para pontuar cada fornecedor.
A maioria das falhas de avaliação de fornecedores acontece aqui. Uma plataforma que funciona em demos pode falhar quando conectada à sua infraestrutura de telefonia real.
Solicite um ambiente de teste de cada fornecedor. Conecte o seu trunk SIP existente e rode 50 chamadas de teste cobrindo: atendimento de chamada de entrada (meça o tempo do toque à resposta do agente), iniciação de chamada de saída, tratamento de DTMF no meio da chamada e negociação de codecs. A Retell AI suporta trunking SIP direto a qualquer provedor, então o seu Twilio, Vonage, Telnyx ou PBX on-premises existente conecta sem substituir a sua stack atual. Fornecedores que exigem que você porte números para a telefonia proprietária deles ou não conseguem aceitar um SIP INVITE padrão são uma bandeira vermelha. Teste com o seu trunk real, não com um número de sandbox que o fornecedor fornece, porque o comportamento de SIP em produção difere dos ambientes de demo.
Você deve ter agora resultados de compatibilidade SIP mostrando as taxas de sucesso de conexão e quaisquer problemas de configuração por fornecedor.
Quem liga desliga quando as pausas excedem dois segundos. Um fornecedor que responde em 800ms durante uma demo pode chegar a 3 segundos sob 50 chamadas simultâneas.
Configure um teste de carga simulando o seu volume simultâneo de pico. Meça a latência de ponta a ponta: o tempo de quem liga terminar uma frase até o agente de voz com IA começar a resposta dele. Rode testes a 25%, 50%, 75% e 100% do seu volume de pico. A plataforma contra a qual você está fazendo benchmark deve manter latência abaixo de um segundo em todos os níveis de carga. A arquitetura da Retell AI entrega aproximadamente 600ms de latência de ponta a ponta com alternância de turnos proprietária que inclui recuperação de interrupção e tratamento de barge-in. Registre se a latência degrada linearmente ou desmorona em um limiar. As plataformas com infraestrutura compartilhada muitas vezes degradam de forma não linear, ou seja, o desempenho é aceitável a 30 chamadas simultâneas e inutilizável a 50.
Você deve ter agora uma curva de latência por fornecedor mostrando o desempenho em toda a sua faixa de volume.
As transferências falhas são o evento de telefonia de maior risco. Quem liga e é desconectado durante um escalonamento não vai ligar de volta.
Teste três cenários de transferência por fornecedor: transferência assistida para um agente humano com o contexto completo da conversa passado, transferência fria para um número externo, e transferência para uma fila de roteamento baseada em departamento. Verifique se o agente que recebe vê um resumo do que quem liga discutiu, não uma tela em branco. Teste o que acontece quando o alvo da transferência não atende em 30 segundos: quem liga é retornado ao agente de IA, jogado na caixa postal ou desconectado? Teste também os fluxos de agendar compromissos onde a IA precisa segurar a linha enquanto verifica uma API de calendário externa durante a conversa. A chamada de função da Retell AI executa chamadas HTTP em tempo real durante a conversa, então as verificações de calendário e as escritas no CRM acontecem enquanto quem liga ainda está na linha.
Você deve ter agora as taxas de sucesso de transferência e o comportamento de falha documentados para cada fornecedor.
Um fornecedor que marca uma caixa de conformidade em um slide pode não aplicá-la na camada de telefonia onde a exposição de dados acontece.
Verifique as certificações com documentação, não com alegações de marketing. Para implantações de saúde, confirme a conformidade com HIPAA com um BAA em autoatendimento (não um guardião do tipo "fale com vendas"). Para serviços financeiros, confirme se os relatórios de auditoria SOC 2 Type II estão atuais. Para chamadas de saída, verifique a gestão de consentimento em conformidade com o TCPA, os mecanismos de divulgação de identidade de IA, o suporte a STIR/SHAKEN e a integração de lista DNC. Verifique a residência de dados: onde as gravações de chamada são armazenadas, quem tem acesso e qual é a política de retenção? Teste a ocultação de PII rodando chamadas que incluem números de seguridade social, números de cartão de crédito ou informações de saúde, e verifique se as transcrições ocultam os dados sensíveis. A plataforma deve suportar retenção de dados configurável e controles de acesso baseados em função.
Você deve ter agora uma matriz de verificação de conformidade mostrando quais fornecedores atendem aos seus requisitos regulatórios específicos com prova documentada.
As páginas de preços dos fornecedores mostram tarifas iniciais. O seu custo real depende da duração da chamada, da concorrência, das taxas de telefonia e dos recursos que podem estar restritos atrás de tiers enterprise.
Construa um modelo de custo total usando os seus dados reais de chamada: média de chamadas por mês, duração média de chamada, chamadas simultâneas de pico e requisitos de recursos (transferências, consultas à base de conhecimento, análise). Solicite um detalhamento de custo item por item de cada fornecedor que separe o processamento de IA, a telefonia e as taxas de plataforma. Fique atento a custos ocultos: sobretaxas por transferência, taxas de consulta à base de conhecimento, cobranças de dashboard de análise ou penalidades de compromisso mínimo. A Retell AI cobra a partir de US$ 0,07/min sem taxas de plataforma, sem sobretaxas por recurso e com US$ 10 em créditos de uso gratuitos no cadastro. Compare isso com fornecedores cotando contratos enterprise começando em US$ 150.000/ano que empacotam recursos de que você não precisa. O objetivo é o custo por chamada resolvida, não o custo por minuto, porque um agente mais rápido com maior contenção custa menos por resultado.
Você deve ter agora uma projeção de custo de 12 meses por fornecedor com base no seu volume real.
Um piloto de duas semanas em tráfego ao vivo revela problemas que nenhuma demo ou teste de carga consegue simular.
Implante o seu fornecedor com a maior pontuação (e um backup paralelo se o orçamento permitir) em um subconjunto do seu tráfego de chamadas ao vivo, entre 10-20% do volume de entrada. Configure dashboards de análise pós-chamada acompanhando: taxa de conclusão de chamada, latência média, taxa de sucesso de transferência, taxa de contenção e sentimento de quem liga. Revise as transcrições diariamente durante a primeira semana. Procure: chamadas em que a IA entendeu mal quem liga, conversas que repetiram sem resolução, transferências que perderam o contexto e casos extremos que os seus cenários de teste não cobriram. Defina um limiar de seguir/não seguir antes de o piloto começar (por exemplo, 85% de contenção, latência abaixo de 1 segundo, 95% de sucesso de transferência). Planeje um período de ajuste de 2 semanas: a maioria das equipes vê 70-80% de contenção na primeira semana, melhorando para 85-95% após ajustar o conteúdo da base de conhecimento e as regras de escalonamento.
Você deve ter agora dados de desempenho de produção de chamadas ao vivo para fazer uma seleção final de fornecedor.
Os números de teste fornecidos pelo fornecedor contornam exatamente os pontos de integração que falham em produção: negociação de codecs, travessia de NAT e timeouts de registro do trunk. Conecte a sua infraestrutura SIP existente durante a avaliação para ver o comportamento real, não as condições de demo. Se um fornecedor não consegue conectar ao seu trunk na fase de trial, ele também não vai conectar de forma confiável em produção.
Uma plataforma com capacidades avançadas de LLM e telefonia instável vai perder mais chamadas do que uma plataforma com atendimento de chamadas sólido e IA adequada. Ao pontuar os fornecedores, dê aos critérios de telefonia (latência, concorrência, confiabilidade de transferência) pelo menos 40% do seu peso total. Recursos como análise de sentimento e vozes personalizadas importam, mas apenas depois de a chamada permanecer conectada.
Um fornecedor de US$ 0,05/min com taxas de plataforma de US$ 500/mês, cobranças por transferência e adicionais de análise custa mais do que um fornecedor de US$ 0,07/min sem taxas de plataforma e com análise incluída. Construa um modelo de TCO de 12 meses com o seu volume real antes de comparar as ofertas. Inclua o custo do tempo de engenharia para a integração, porque as plataformas que exigem configuração SIP personalizada adicionam semanas de configuração que a telefonia gerenciada pelo fornecedor elimina.
Se o seu volume de chamadas excede 10.000 chamadas por mês, rode dois fornecedores em paralelo em segmentos de chamada separados durante a fase de piloto. Isso te dá dados de comparação direta sob condições idênticas e um fallback se a camada de telefonia de um fornecedor falhar. O custo incremental de um segundo piloto é pequeno em comparação com o risco de uma falha de produção de fornecedor único.
As equipes muitas vezes selecionam um fornecedor com base em quão natural a IA soa em uma demo web, depois descobrem que a plataforma derruba 8% das chamadas quando conectada ao trunk SIP deles. A qualidade da IA não significa nada se a chamada não permanece conectada. Sempre teste a estabilidade da telefonia antes de avaliar a qualidade da conversa.
"Compatível com SIP" na página de recursos de um fornecedor pode significar qualquer coisa, de gestão de trunk SIP nativa a um gateway de terceiros que adiciona 200ms de latência. Pergunte especificamente: a plataforma gerencia o trunking SIP nativamente, ou depende de um intermediário? Os gateways intermediários adicionam pontos de falha e latência que degradam a experiência de quem liga.
Uma plataforma que lida com 5 chamadas de teste simultâneas perfeitamente pode degradar a 50. A maioria dos processos de avaliação de fornecedores testa sequencialmente, uma chamada por vez. Se o seu ambiente de produção exige 20 ou mais chamadas simultâneas, teste nesse volume antes de assinar. Toda conta da Retell AI inclui 20 chamadas simultâneas gratuitas, escaláveis para mais em implantações enterprise.
As equipes testam se as transferências têm sucesso mas raramente testam o que acontece quando elas falham. Quem liga é desconectado? O sistema tenta de novo? O agente de IA retoma a conversa? O comportamento de falha de transferência sob condições extremas (alvo ocupado, alvo inalcançável, timeout de rede) separa as plataformas de nível de produção das de nível de demo.
Os fornecedores que exigem que você porte todos os números para o sistema telefônico proprietário deles criam aprisionamento e adicionam semanas de risco de migração. Priorize as plataformas que conectam à sua telefonia existente via trunking SIP padrão. O seu sistema telefônico não deveria mudar porque você adicionou IA para atender as chamadas.
A Medical Data Systems implantou agentes de voz com IA para o atendimento de chamadas de entrada na operação de cobrança deles. O resultado: 100% das chamadas de entrada atendidas por IA com apenas 30% de taxa de transferência, arrecadando aproximadamente US$ 280.000 por mês escalando sem infraestrutura de telefonia adicional.
A SWTCH, uma empresa de recarga de veículos elétricos, implantou um agente de voz com IA para o suporte ao cliente. O agente deles atende chamadas em segundos, cortou os custos de suporte em mais de 50% e melhorou significativamente as margens de SaaS ao lidar com o suporte urgente a motoristas de veículos elétricos em escala em todo o seu sistema telefônico existente.
A Matic Insurance automatizou os fluxos de trabalho de chamada para a triagem de sinistros. Eles atenderam mais de 8.000 chamadas no 1º trimestre de 2025, mantiveram um NPS de 90 e reduziram o tempo de atendimento de sinistros de 12,4 para 5,8 minutos, uma redução de 53%, sem substituir a sua infraestrutura de telefonia existente.
Você precisa ou de um trunk SIP de qualquer provedor (Twilio, Telnyx, Vonage ou on-premises) ou da capacidade de atribuir novos números de telefone pelo fornecedor. A Retell AI suporta ambos: conecte o seu trunk existente via URA com IA ou provisione números diretamente pela plataforma. Nenhum hardware proprietário é necessário.
Meça três métricas durante um piloto: latência de resposta de ponta a ponta (abaixo de 1 segundo é a meta), taxa de conclusão de chamada (porcentagem de chamadas que terminam normalmente versus serem derrubadas) e qualidade de alternância de turnos (como o agente lida com interrupções, conversas cruzadas e pausas). Teste todas as três sob carga simultânea combinando com o seu volume de pico.
Os modelos de preço variam significativamente. As plataformas por minuto variam de US$ 0,07 a US$ 0,15/min dependendo dos recursos. Os fornecedores de contrato enterprise começam em US$ 150.000/ano ou mais. A Retell AI começa em US$ 0,07/min sem taxas de plataforma, sem mínimos e com US$ 10 de crédito gratuito no cadastro. Sempre modele o custo total usando o seu volume real de chamadas, não a tarifa "a partir de" do fornecedor.
Para a maioria das equipes, sim. Montar componentes separados de STT, LLM, TTS e telefonia exige recursos de engenharia para manter a latência, lidar com failovers e depurar problemas entre fornecedores. Uma plataforma com gestão de telefonia integrada, como a Retell AI, cuida do trunking SIP, da síntese de voz e do roteamento de chamadas em uma única stack, reduzindo a complexidade da integração e a latência total.
Verifique se o fornecedor suporta: divulgação de identidade de IA no início de cada chamada, rastreamento de consentimento e gestão de revogação, autenticação de chamada STIR/SHAKEN, integração de lista DNC e gravação de chamada com retenção configurável. A decisão de 2024 da FCC classifica as vozes geradas por IA como "artificiais" sob o TCPA, então toda chamada de telemarketing com IA ou de saída exige consentimento prévio expresso.
Com plataformas baseadas em SIP, sim. Os seus números existentes permanecem com o seu provedor de trunk atual. A plataforma de IA conecta ao seu trunk e atende chamadas nesses números sem portar. Fornecedores que exigem portabilidade de números adicionam risco de migração e criam aprisionamento. Faça esta pergunta cedo na avaliação: ela revela se o fornecedor trata a telefonia como uma camada aberta ou uma dependência proprietária.
Planeje 2-3 semanas de avaliação estruturada (scorecard, teste de SIP, teste de carga, piloto) seguidas de um período de ajuste de produção de 2 semanas. O construtor de agentes no-code na Retell AI significa que você pode começar a testar fluxos de chamada em horas após o cadastro, mas a validação minuciosa de telefonia e o ajuste do atendente virtual com IA exigem 4-5 semanas no total antes da implantação completa em produção.
Pergunte a cada fornecedor sobre a arquitetura de failover deles: eles suportam reroteamento automático para um trunk de backup, fallback para caixa postal ou encaminhamento para agentes humanos durante interrupções? Verifique o SLA de uptime deles. A Retell AI se compromete com 99,99% de uptime com failovers automáticos entre provedores de LLM e TTS. Fornecedores sem SLAs de uptime publicados ou comportamento de failover documentado são um risco que você não deveria aceitar para o atendimento de chamadas em produção.
Os requisitos de telefonia diferem por fluxo de trabalho. A qualificação de leads prioriza a capacidade de chamadas de saída, a identificação de chamada com marca e a integração de CRM. O suporte ao cliente com IA prioriza a velocidade de atendimento de chamadas de entrada, a precisão da base de conhecimento e a confiabilidade da transferência. Avalie os fornecedores contra o fluxo de trabalho que representa o seu maior volume de chamadas primeiro, depois expanda.
Você agora tem um framework estruturado para avaliar fornecedores de IA conversacional sobre os critérios de telefonia que determinam o sucesso em produção: compatibilidade SIP, latência, concorrência, confiabilidade de transferência, conformidade e custo total.
Para iniciar a sua avaliação, cadastre-se na Retell AI e conecte o seu trunk SIP existente para fazer o benchmark da qualidade de chamada, latência e comportamento de transferência contra outros fornecedores da sua lista curta. A partir daí, estenda o mesmo agente para lidar com fluxos de trabalho de automação de central de atendimento ou implante a IA conversacional em linhas telefônicas adicionais.
Comece a construir grátis com US$ 10 em créditos de uso em retellai.com.
Veja quanto seu negócio poderia economizar ao migrar para agentes de voz com IA.
Total Human Agent Cost
AI Agent Cost
Estimated Savings
Um número de telefone de demonstração do consultório da Retell Clinic

Start building smarter conversations today.


.avif)
.avif)