聞き取り

　本エディタでは、聞き取り（音声でのテキスト入力）を行なうことができます。また、スクリプトで、聞き取りを操作することができます。但し、それには、必要なシステム環境を、整えておく必要があります。

　「聞き取り」は、初期環境では、メインメニューの「ツール」下の「スクリプト集」から実行できます。これを実行すると、音声認識エンジンが起動されます。また、その際、聞き取りの状況を示すダイアログボックスが表示されます。このあと、しばらく待つと、「準備完了」の状態になります。以降、マイクに向かって何か話すと、それがテキストとして、現カーソル位置に挿入されます。

　例えば、英語の音声認識エンジンを使った場合、マイクに "good morning" と話すと、現カーソル位置に、"good morning" という文字列が挿入されます。また、日本語の場合、「こんにちわ」と話すと、「今日は」や「こんにちは」が挿入されます。

■「聞き取り」ダイアログボックス

　本エディタから、音声認識エンジンを起動して、聞き取りを開始すると、その状況を示すダイアログボックスが表示されます。この中にある各項目について、次に説明します。

●状態

　ここには、音声認識エンジンの現在の状態が表示されます。この状態には、以下の種類があります。

●認識内容

　ここには、音声認識に成功した時の結果や、仮説段階の文字列が、表示されます。

●マイク入力レベル

　ここには、マイクに入力された音声のレベル（大きさ）が、棒グラフで表示されます。もし、ここに何も表示されなければ、マイクに音声が入っていないことになります。また、このレベルが最大になる場合は、音声が大き過ぎることを示します。

●一時休止

　このチェックボックスの ON／OFF で、音声入力の受付けを、禁止／解除できます。音声認識を終了しないで、一時的に休止したい時に、このスイッチを使います。

●終了

　このボタンを押すと、音声認識が終了します。その際、本ダイアログボックスも閉じます。

■ 聞き取りに必要なシステム環境

　本エディタで、聞き取りを行なうには、Windows の SAPI 5 ( Speech API version 5 ) に対応した音声認識エンジンがインストールされている必要があります。また、Internet Explorer version 5.5 以上（のコンポーネント）が必要です。

　Windows Vista では、SAPI 5 対応の日本語の音声認識エンジンが、標準で搭載されています。それ以前の Windows では、別途インストールする必要があります。但し、Windows 95, NT3.5 では、できません。

　SAPI 5 対応の英語と日本語の音声認識エンジンは、Microsoft 社のダウンロードセンター内の
　　 Speech SDK 5.1
のサイトから、無償で入手できます。

　また、各種のサードパーティ製の音声認識エンジンも利用できます。そのなかで、 Julius（ユリウス）という定評の高いフリーの音声認識システムがあります。これは本来、SAPI 対応ではありませんが、その派生版の
　　　Julius for SAPI
が利用できます。但し、これは、かなりボリュームがあり、起動にそこそこ時間がかかります。

　SAPI 5 に準拠していれば、複数のエンジンの登録が可能です。エンジンの切り換えや調整等は、コントロールパネルから行なえます。

■ 聞き取り関数

　この関数を使えば、いろいろな聞き取りのアプリケーションが作成できます。本エディタに搭載している Dictate.mc というスクリプトも、この関数を使って、標準的な聞き取りを行なうようになっています。

　「スクリプトの実行」ダイアログボックス内の「実行コマンド」に、この関数を、次のように書いて、直接実行させることもできます。
　　/! ::Apsaly.Dictate(2);
メインメニューの「ツール」下の「スクリプト集」内の「聞き取り」は、この形態で実行されます。

　なお、この関数は、ご寄付を頂いた方への「特典」になっています。特典がないと、本エディタの起動後、この関数を使うスクリプトの起動回数が３回を超えると、この関数は、無効になります。

■ 補説

　音声認識の精度は、音声認識エンジンの性能と、マイクやサウンドボード等のハードウェアの性能に、大きく依存します。また、周囲のノイズにも、影響されます。通常、音声認識エンジンでは、特定の話者用に訓練したり、あるいは、認識対象の語句を限定／追加することで、認識精度を上げることができるようになっています。最善の環境では、認識率が 90% を超えるエンジンもあるようですが、普通の環境では、そこまでは期待できないようです。

・準備中...	最初の起動から初期設定が完了するまでの間
・準備完了	起動後初めて音声入力の受付けが可能になった時
・音声開始	音声入力の１区切りの開始を認識した時
・音声終了	音声入力の１区切りの終了を認識した時
・認識中...	音声認識の処理中、１つの仮説を得た時
・認識成功	音声認識に成功した時（次の音声入力待ち）
・認識失敗	音声認識に失敗した時（次の音声入力待ち）
・音声認識　エンジン不備！	エンジンが未搭載または動作不良等で、正常に機能していない時