統計分析環境 R 専門検索エンジン seekR に音声入力機能を追加した

Google Chrome 11 で、HTML5？の音声入力機能がサポートされたとのことで、早速、seekR を音声入力に対応させてみました。

Google Chrome 11 以降では、下図のようなマイクのアイコンが表示され、そこをクリックすると、ダイアログが表示されます。

何か言葉をしゃべると自動的に音声認識が行われ、認識結果が入力されます。 (もちろん、従来通りのキーボードによる入力も可能です)

他の商用/オープンソースの音声認識エンジンと比較して、Google の音声認識では、自動音声区間検出 (VAD) が行われており、その精度が高いがすごいですね。(発話している間、ボタンを押したままにしなくて良い)

具体的な HTML の書き方は、下記の通りです。input タグの中に、speech x-webkit-speech の属性を指定するだけです。

XHTML 1.1 の例

<input type="text" name="****" value="****" />
↓
<input type="text" name="****" value="****" speech="speech" x-webkit-speech="x-webkit-speech" />

HTML5 ではこのような書き方ができます。

<input type="text" name="****" value="****">
↓
<input type="text" name="****" value="****" speech x-webkit-speech >

MacBook Pro にはマイクが内蔵されているので、USB ヘッドセットを接続する手間が省けてとても良いですね。

hiratake55 の作業メモ