内容 |
音声分析や音声ガイド機能を搭載したコンピュータは、SF小説に繰り返し登場するテーマである。映画「2001年宇宙の旅」のHAL9000や、テレビの「スタートレック」シリーズを思い浮かべて欲しい。登場人物は始終ごく普通の会話口調でコンピュータと対話している。
音声認識技術の開発は数十年も前から続けられているが、処理能力の限界や精度の悪さ、お粗末な信頼性などが商品化を阻んできた。とは言え高速処理が可能なプセッサ、音声認識システム内蔵型のサーバー、記憶装置のコストダウン、インターネットのブロードバンド接続が実現したおかげで、ここ10年ほどで音声認識技術の能力と可能性は大幅に飛躍している。電話から利用できるボイスポータル、音声操作が可能なカスタマーコールセンター、自動車用のテレマティックスなど、商業利用の例も出てきた。またソフト開発や音声認識サービスを手がける企業が幅広い分野でこの技術を応用し、既にさまざまなサービス提供を開始している。
どの産業でも、企業向け・個人向けの音声利用サービスに対する需要は大きい。これは、費用効率に優れたリューションである、データアクセスのインターフェースとしてきわめて使いやすい、顧客に常に一貫したメッセージを発信できる、といったメリットがあるためだろう。
ただし企業は、音声認識技術が創出する商機だけでなく、限界の方もわきまえなければならない。確かにこの技術はコスト削減、カスタマー・リレーションシップの改善データ/情報への高速かつ広範なアクセスを実現するが、目的や使い方を誤れば、技術的な問題を超えた面倒を引き起こしかねない。このレポートは音声認識技術の現状を概観し、今後の発展を展望する。 (16ぺージ)(著者:Martin Schwirn) |