聞き取り

■ 概要

 本エディタでは、聞き取り(音声でのテキスト入力)を行なうことができます。 また、スクリプトで、聞き取りを操作することができます。 但し、それには、必要なシステム環境を、 整えておく必要があります。

 「聞き取り」は、初期環境では、メインメニューの「ツール」下の「スクリプト集」から 実行できます。これを実行すると、音声認識エンジンが起動されます。 また、その際、聞き取りの状況を示すダイアログボックスが表示されます。 このあと、しばらく待つと、「準備完了」の状態になります。 以降、マイクに向かって何か話すと、それがテキストとして、 現カーソル位置に挿入されます。

 例えば、英語の音声認識エンジンを使った場合、マイクに "good morning" と話すと、 現カーソル位置に、"good morning" という文字列が挿入されます。 また、日本語の場合、「こんにちわ」と話すと、「今日は」や「こんにちは」が 挿入されます。

■「聞き取り」ダイアログボックス

 本エディタから、音声認識エンジンを起動して、聞き取りを開始すると、 その状況を示すダイアログボックスが表示されます。この中にある各項目について、 次に説明します。

●状態
 ここには、音声認識エンジンの現在の状態が表示されます。この状態には、 以下の種類があります。
・準備中...最初の起動から初期設定が完了するまでの間
・準備完了 起動後初めて音声入力の受付けが可能になった時
・音声開始 音声入力の1区切りの開始を認識した時
・音声終了 音声入力の1区切りの終了を認識した時
・認識中...音声認識の処理中、1つの仮説を得た時
・認識成功 音声認識に成功した時(次の音声入力待ち)
・認識失敗 音声認識に失敗した時(次の音声入力待ち)
・音声認識
 エンジン不備!
エンジンが未搭載または動作不良等で、 正常に機能していない時
●認識内容
 ここには、音声認識に成功した時の結果や、仮説段階の文字列が、表示されます。
●マイク入力レベル
 ここには、マイクに入力された音声のレベル(大きさ)が、棒グラフで表示されます。 もし、ここに何も表示されなければ、マイクに音声が入っていないことになります。 また、このレベルが最大になる場合は、音声が大き過ぎることを示します。
●一時休止
 このチェックボックスの ON/OFF で、音声入力の受付けを、禁止/解除できます。 音声認識を終了しないで、一時的に休止したい時に、このスイッチを使います。
●終了
 このボタンを押すと、音声認識が終了します。その際、本ダイアログボックスも閉じます。
■ 聞き取りに必要なシステム環境

 本エディタで、聞き取りを行なうには、Windows の SAPI 5 ( Speech API version 5 ) に 対応した音声認識エンジンがインストールされている必要があります。 また、Internet Explorer version 5.5 以上(のコンポーネント)が必要です。

 Windows Vista では、SAPI 5 対応の日本語の音声認識エンジンが、標準で搭載されています。 それ以前の Windows では、別途インストールする必要があります。 但し、Windows 95, NT3.5 では、できません。

 SAPI 5 対応の英語と日本語の音声認識エンジンは、Microsoft 社の ダウンロードセンター 内の
   Speech SDK 5.1
のサイトから、無償で入手できます。

 また、各種のサードパーティ製の音声認識エンジンも利用できます。そのなかで、 Julius(ユリウス)という 定評の高いフリーの音声認識システムがあります。これは本来、SAPI 対応では ありませんが、その派生版の
   Julius for SAPI
が利用できます。但し、これは、かなりボリュームがあり、起動にそこそこ時間がかかります。

 SAPI 5 に準拠していれば、複数のエンジンの登録が可能です。 エンジンの切り換えや調整等は、コントロールパネルから行なえます。

■ 聞き取り関数

 聞き取りには、MikoScriptApsalyオブジェクト のメンバー関数を 使います。それは、次の関数です。

 この関数を使えば、いろいろな聞き取りのアプリケーションが作成できます。 本エディタに搭載している Dictate.mc と いうスクリプトも、この関数を使って、標準的な聞き取りを行なうようになっています。

 「スクリプトの実行」ダイアログボックス内の「実行コマンド」に、 この関数を、次のように書いて、直接実行させることもできます。
  /! ::Apsaly.Dictate(2);
メインメニューの「ツール」下の「スクリプト集」内の「聞き取り」は、 この形態で実行されます。

 なお、この関数は、ご寄付を頂いた方への「特典」になっています。特典がないと、本エディタの起動後、 この関数を使うスクリプトの起動回数が3回を超えると、 この関数は、無効になります。

■ 補説

 音声認識の精度は、音声認識エンジンの性能と、マイクやサウンドボード等の ハードウェアの性能に、大きく依存します。また、周囲のノイズにも、影響されます。 通常、音声認識エンジンでは、特定の話者用に訓練したり、あるいは、認識対象の語句を 限定/追加することで、認識精度を上げることができるようになっています。 最善の環境では、認識率が 90% を超えるエンジンもあるようですが、 普通の環境では、そこまでは期待できないようです。