nomuran's diary

野村直之のはてな日記(後継ブログ)です

Windows8 さりげなく音声認識が実用的に!

新年早々、びっくりしました。

3300円で、Windows8の期間限定アップグレードをしたマシン(本体1万円のサーバ機)に、USBヘッドセット780円也を付けて楽しく音声機能を使っていたのですが、なにげなくコントロールパネルの、アクセッシビリティという普段は全然使わない設定をクリックしたところ、どんどんメニューが進んで、音声認識が実用的に使えるようになっちゃいました。

下記画面は、簡単な話者適合を行って、日本語で1文喋ったのが正しく認識された結果です。

この他、ブラウザのタブの切り替えや、メニュー、ボタンの隠れたままのアプリの画面を1つ開いたり、などが、音声認識で便利に行えます。
 
実は、職場の MacBookAir のOSを、「山獅子」にアップグレードし、高速タイピングにつかれたときや、文字認識の精度が低くて困ったときなどに読み上げ、dictationの入力を時々実用に使っていたところでした。これからは、Windowsでも普通にできるようになった感じです。

音声入力は、メタデータ社で出している対話ロボットとは抜群に相性が良いです。
こんな風にできます:
http://www.youtube.com/watch?v=MaOUuqN0IyY
Web受付嬢に音声で話しかけて回答得たり指示します MacOS 10.8.2 Mountain Lion

機械翻訳と同様、音声入力も「古くて新しい技術」。
その不幸な歴史は、恣意的に目標精度数値を設定し「この認識率になったら使います」と各分野でやられてしまい、かな漢字変換のように、とにかく使いこなすことをMUSTとして、UIや簡単な学習機能を、少しずつ少しずつ、現場の小さな工夫の積み上げでカイゼンしていく、というサイクルがなかなか怒らなかったことによる、といえましょう。

しかし、こんどこそ、わかっている人には十分使えるようになった、と確信させられる出来事でした。