hiratake55 の作業メモ

R, Javascript, Python, Linux and Hadoop

統計分析環境 R 専門検索エンジン seekR に音声入力機能を追加した

Google Chrome 11 で、HTML5?の音声入力機能がサポートされたとのことで、早速、seekR を音声入力に対応させてみました。

Google Chrome 11 以降では、下図のようなマイクのアイコンが表示され、そこをクリックすると、ダイアログが表示されます。

何か言葉をしゃべると自動的に音声認識が行われ、認識結果が入力されます。 (もちろん、従来通りのキーボードによる入力も可能です)

他の商用/オープンソース音声認識エンジンと比較して、Google音声認識では、自動音声区間検出 (VAD) が行われており、その精度が高いがすごいですね。(発話している間、ボタンを押したままにしなくて良い)

HTML の書き方

具体的な HTML の書き方は、下記の通りです。input タグの中に、speech x-webkit-speech の属性を指定するだけです。

ソースの例

XHTML 1.1 の例

<input type="text" name="****" value="****" /><input type="text" name="****" value="****" speech="speech" x-webkit-speech="x-webkit-speech" />

HTML5 ではこのような書き方ができます。

<input type="text" name="****" value="****"><input type="text" name="****" value="****" speech x-webkit-speech >