セイコーエプソンは2011年12月、雑音環境においても高い音声認識率を実現した音声認識/再生用IC「S1V50300」を発売した。同社が音声認識機能を搭載したICを製品化するのは、今回が初めて。炊飯器や給湯器、エアコン、調理家電といった白物家電の他、エレベータや住宅設備、業務用モバイル端末といった産業用機器の用途に向ける。既にサンプル出荷を開始しており、サンプル価格は2200円(税別)。評価ボードの提供も開始した(図1)。2012年3月には量産を始める予定である。
人の発話によって機器を制御する際に用いられる音声認識機能は、電子カルテ作成や議事録作成、玩具といった一部の分野で使われているものの、白物家電への採用はなかなか広がっていない。セイコーエプソンによれば、これまで音声の認識率が高くなかったのが、採用が進まなかった要因の1つだという。
この課題の改善を目指したのが、同社の音声認識/再生用ICである。S1V50300を使うときは、「電源オン」や「電源オフ」といった機器の制御動作に対応した幾つかのフレーズやシナリオ(認識させる手順)をあらかじめ設定しておく。機器の利用者がこれらのフレーズやシナリオに従って発話すると、S1V50300はホストマイコンに制御動作を実行するための信号を送信する。
前述の通り雑音環境においても音声認識率が高いことが特徴で、同社の評価環境における認識率は98%である。具体的には、音声と雑音のS/N比(信号対雑音比)が26〜42dBの静かな環境、S/N比が16〜25dBのリビング環境、5〜15dBの浴室/車内のいずれの場所でも98%を超える認識率だったという。この高い認識率は、独自の雑音抑制機能と音声認識機能を組み合わせることで実現した。
その他の仕様は以下の通り。ホストマイコンとはシリアルインタフェースを介して接続する。ホストマイコンからコマンドによって音声認識/再生用ICを制御するので、既存のシステムを大きく変更することなく音声認識/再生機能を追加できるという。
幾つかの階層を作って音声を認識させることができ、あらかじめ設定するフレーズ数は1階層当たり50以下を推奨している。登録可能な語彙(ごい)数はメモリ容量に依存する。音声再生機能のサンプリング周波数は16kHz、対応するビットレートは16kビット/秒、24kビット/秒、32kビット/秒、40kビット/秒。音声再生フレーズは最大64フレーズまで設定できる。電源電圧はコア部が1.8V、周辺回路部が3.3V。パッケージは10mm角の64端子QFPである。
Copyright © ITmedia, Inc. All Rights Reserved.