コールセンターでの音声認識サービス活用 メリット・選定ポイントも解説
AI技術が進化する中で、音声認識技術も実用化が進んでいます。コールセンターにおいては、通話内容のテキスト化による業務の高度化・省力化を目的とした活用がすでに始まっています。
この記事では、音声認識サービスの概要のほか、導入メリット・選定ポイント・主なサービスなど、コールセンターへの導入を検討する際に必要となる情報について解説します。
目次
音声認識サービスとは
音声認識サービスとは、AIによる音声認識技術と言語解析技術を用いて、音声データをテキストに変換するもののことです。これまで音声認識の精度は低く、活用できる範囲は限定的でした。しかしながら、ディープラーニングをはじめとする関連技術の発展により、近年では利用シーンの幅が広がってきています。音声認識は画像認識と並び、AI技術の中でも一層の実用化が期待される分野として注目を集めているのです。
こうした状況の中、会議音声からの議事録の自動作成や、コールセンターの録音データの書き起こしなど、多くの分野でサービス化が進んでいます。
コールセンターに導入するメリット
コールセンターに音声認識サービスを導入するメリットは以下のとおりです。
通話内容の効率的な確認
応対品質向上やクレーム対応、VOC(顧客の声)の収集のために通話内容を確認するケースがありますが、生の音声データを聴くのでは時間がかかります。また、その中から特定のキーワードが含まれている会話を抽出することも困難です。
音声認識サービスを使って通話内容をテキスト化することで、通話内容の確認作業が大幅に効率化できるとともに、キーワードによる検索が可能となります。
コンプライアンス強化
オペレーターの対応に問題が発生していないか確認するにあたって、テキスト化された通話データを活用することができます。
例えば、会話中にNGワードを使っていないか、マニュアルで定められている本人確認等の対応に不備がないかなどを、効率的にチェックできます。
事後での調査はもちろん、リアルタイムで会話をテキスト化するサービスを使うことで、問題のある応対をその場で検知することも可能です。
履歴入力業務の効率化
従来であれば、オペレーターは通話が終了した後に会話内容をまとめ、システム等に入力する必要がありました。音声をテキスト化することで、こうした入力にかかる作業が大幅に削減できます。さらに、音声認識サービスによっては会話内容の要約も可能です。
オペレーターの負荷軽減や、ACW(平均後処理時間)の短縮による応答率の向上といった成果につなげることができます。
音声認識サービスの選定ポイント
それでは、コールセンターに音声認識サービスを導入する際には、どのような点に気を付ければよいのでしょうか。ここでは、選定時のポイントについて解説します。
認識精度
当然ながら、認識率は最も重要なポイントです。100%正確に変換することは困難であるものの、できるだけ精度が高いサービスを選定するべきでしょう。
しかし、音声認識サービスによってはトライアルの時点で費用が発生することも少なくなく、認識率を事前に比較することは難しいといえます。また、実務に合わせたチューニングを施し、自社の通話データを読み込ませてみて、初めて精度がわかるものです。
製品の評判を事前に確認しつつ、コストを勘案しながらPoC(目的の効果・効能が得られるかの実験)を行い、どれくらい精度が出るのか検証するといった取り組みが有効といえます。
データの検索・分析機能
せっかく音声をテキストデータに変換しても、簡単に利用できなければ意味がありません。データ活用の機能が充実している音声認識サービスを選ぶべきでしょう。
とくに、会話内容のモニタリングや検索といった使う頻度が高くなりそうな機能については、自社の求める要件を満たしているかチェックすることをおすすめします。
また、分析に用いることができる機能にどのようなものがあるかも選定のポイントです。例えば、顧客・オペレーター双方の感情分析や、クレームなどの自動抽出ができるサービスも存在します。
主な音声認識サービスの比較
以下では、主なコールセンター向け音声認識サービスを紹介します。
AmiVoice
AmiVoiceは、議事録作成やコールセンター支援などの幅広い分野に活用できる音声認識サービスです。大手企業への導入実績が多く、コールセンターシステムやCRMなどの外部システムとの連携性が高いことも特徴です。
コンタクトセンター向けのパッケージである「AmiVoice Communication Suite」では、会話内容から特定のキーワードを検出してリアルタイムでSVにアラートを通知したり、全通話に対して応対品質の自動採点が行えたりと、業務を効率化するさまざまな機能が用意されています。
Omnis
Omnisは、Google Cloudの機械学習エンジンを利用した音声認識サービスです。世界中のGoogleユーザが音声認識エンジンを利用することで精度の向上が日々行われるため、Omnisを導入した企業側でチューニングをする必要がないという特徴があります。
音声データのテキスト化という基本機能に加え、感情分析や自動要約、会話内容に応じてFAQをポップアップさせる機能などを搭載しており、さまざまな効率化が実現します。例えば会話内容の自動要約機能を用いることで、応対履歴の登録作業にかかる時間が大幅に削減できます。
AI Dig
AI Digは、オペレーターを支援する充実の機能を備えた音声認識サービスです。応対中にリアルタイムで音声データがテキスト化できることに加え、予め登録したFAQの中から顧客の質問への回答候補を提示することが可能です。
また、オペレーターの平均通話時間やNGワードの発言率を集計して応対傾向を可視化したり、顧客との通話に含まれるワードの出現数や増減の推移を分析して、よくある問い合わせの把握やトークスクリプトの見直しに利用できたりと、教育にも活用することができます。
BIZTELコールセンターは音声認識サービスと連携可能
BIZTELコールセンターでは、上述したAmiVoice・Omnis・AI Digなどと連携して通話内容のテキスト化を実現することができます。
応対中にリアルタイムで会話内容をテキスト化できるため、通話内容の確認やコンプライアンス強化にも有効です。さらに、連携する音声認識サービスの機能を用いることで、顧客の感情分析やFAQの自動表示といったオペレーターの支援も実現できます。
また、BIZTELでは独自の音声認識サービスとして、管理画面上に通話のテキストデータを表示するオプションも提供しています。機能はシンプルであるものの低コストで利用できるため、音声認識をライトに使い始めたいセンターに適しています。
こうした音声認識サービスの活用は、コールセンター業務の改善・効率化を検討されている企業におすすめといえるでしょう。
まとめ
この記事では、コールセンターにおける音声認識サービスの概要のほか、導入メリット・選定ポイント・主なサービスなどについて解説しました。
AI技術の発展もあり、コールセンターでの音声認識の活用は十分に検討できるものとなりました。業務の改善にあたり、活用を検討してみてはいかがでしょうか。