本エディタでは、聞き取り(音声でのテキスト入力)を行なうことができます。 また、スクリプトで、聞き取りを操作することができます。
「聞き取り」は、初期環境では、メインメニューの「ツール」下の「スクリプト集」から 実行できます。これを実行すると、音声認識エンジンが起動されます。 また、その際、聞き取りの状況を示すダイアログボックスが表示されます。 このあと、しばらく待つと、「準備完了」の状態になります。 以降、マイクに向かって何か話すと、それがテキストとして、 現カーソル位置に挿入されます。
例えば、日本語の音声認識エンジンを使った場合、マイクに「こんにちわ」と話すと、 「今日は」や「こんにちは」という文字列が、現カーソル位置に挿入されます。 また、英語の音声認識エンジンを有効にしている場合、 "good morning" と話すと、"good morning" が挿入されます。
本エディタから、音声認識エンジンを起動して、聞き取りを開始すると、 その状況を示すダイアログボックスが表示されます。この中にある各項目について、 次に説明します。
・準備中... | 最初の起動から初期設定が完了するまでの間 |
・準備完了 | 起動後初めて音声入力の受付けが可能になった時 |
・音声開始 | 音声入力の1区切りの開始を認識した時 |
・音声終了 | 音声入力の1区切りの終了を認識した時 |
・認識中... | 音声認識の処理中、1つの仮説を得た時 |
・認識成功 | 音声認識に成功した時(次の音声入力待ち) |
・認識失敗 | 音声認識に失敗した時(次の音声入力待ち) |
・音声認識 エンジン不備! | エンジンが未搭載または動作不良等で、 正常に機能していない時 |
本エディタで、聞き取りを行なうには、Windows の SAPI 5 ( Speech API version 5 ) に 対応した音声認識エンジンがインストールされている必要があります。 Windows 7 以降では、SAPI 5 対応の日本語の音声認識エンジンが、標準で搭載されるPCも多いようです。 搭載されていないPCでは、別途インストールする必要があります。
聞き取りには、MikoScript の Epsalyオブジェクト のメンバー関数を 使います。それは、次の関数です。
この関数を使えば、いろいろな聞き取りのアプリケーションが作成できます。 本エディタに搭載している Dictate.mc という スクリプトも、この関数を使って、標準的な聞き取りを行なうようになっています。
「スクリプトの実行」ダイアログボックス内の「実行コマンド」に、
この関数を、次のように書いて、直接実行させることもできます。
/! ::Epsaly.Dictate(2);
音声認識の精度は、音声認識エンジンの性能と、マイクやサウンドボード等の ハードウェアの性能に、大きく依存します。また、周囲のノイズにも、影響されます。 通常、音声認識エンジンでは、特定の話者用に訓練したり、あるいは、認識対象の語句を 限定/追加することで、認識精度を上げることができるようになっています。 最善の環境では、認識率が 90% を超えるエンジンもあるようですが、 普通の環境では、そこまでは期待できないようです。