AIがどのように発信者のインテントを検出し、音声エージェントがニーズを特定し、適切なワークフローをトリガーし、解決までの時間を短縮できるようにするのかを探りましょう。
AIインテント検出(AI Intent Detection)は、AI音声エージェントに、発信者の発言の背後にある目的を特定するよう教えるプロセスです。これによりエージェントは、言葉そのものだけでなく、その意味を理解できます。予約を変更したいのか、価格について尋ねたいのか、問題を報告したいのかを。
インテント検出は、ユーザーの話された入力や入力されたテキストを、あらかじめ定義されたカテゴリ(インテント)に分類する自然言語モデルによって支えられています。それは、音声エージェントがボタン操作のメニューや硬直したスクリプトに頼ることなく、実際の会話を交わせるようにするための決定的な構成要素です。
自動化された発信環境では、インテントがすべてです。それがなければ、AIエージェントは応答をパーソナライズしたり、適切なアクションをトリガーしたり、ユーザーが何を望んでいるかを理解したりすらできません。インテント検出が不十分だと、会話は破綻します。
うまく行えば、インテント検出はAIエージェントが次のことを可能にします。
通話を賢くルーティングする:誰が、あるいは何が要求を処理すべきか——人間かAIか——を見極めます。
より速く解決する:状況把握を省いて、解決へ直行します。
大規模にパーソナライズする:発信者が一言一句どう言うかではなく、何を必要としているかに基づいてフローを調整します。
発信者の発話を取り込む
エージェントが、ASR(自動音声認識)を使って話された入力をテキストに書き起こします。
NLPでインテントを分類する
特定のインテントカテゴリを認識するよう学習された大規模言語モデルによって、テキストが分析されます。
応答またはワークフローをトリガーする
インテントが認識されると、AIエージェントは通話をルーティングし、情報を取得し、次の最善のアクションを開始します。
フィードバックループで磨き上げる
取りこぼした、あるいは曖昧なインテントは記録され、時間とともにモデルを改善するために使われます。
発信者が「もしもし、先月二重に請求された気がするんです」と言います。エージェントはこれを請求の異議インテントと特定し、発信者の本人確認を行い、これ以上の確認を求めることなく即座に取引のサマリーを提供します。
従来のインテント検出は自然言語処理(NLP)モデルと硬直した分類システムに大きく依存していましたが、最新のAI音声エージェントは、はるかに柔軟でニュアンスのある理解を実現するために、ますます大規模言語モデル(LLM)を使っています。LLMは多様な言い回し、文脈、シナリオにわたってインテントを検出し、最終的にAI音声エージェントシステムの限界を減らし、会話能力を広げます。
LLMがなぜインテント検出の様相を再定義しているのかを深く掘り下げるには、RetellのNLP対LLMの比較をご覧ください。