本エディタでは、聞き取り(音声でのテキスト入力)を行なうことができます。 また、スクリプトで、聞き取りを操作することができます。 但し、それには、必要なシステム環境を、 整えておく必要があります。
「聞き取り」は、初期環境では、メインメニューの「ツール」下の「スクリプト集」から 実行できます。これを実行すると、音声認識エンジンが起動されます。 また、その際、聞き取りの状況を示すダイアログボックスが表示されます。 このあと、しばらく待つと、「準備完了」の状態になります。 以降、マイクに向かって何か話すと、それがテキストとして、 現カーソル位置に挿入されます。
例えば、英語の音声認識エンジンを使った場合、マイクに "good morning" と話すと、 現カーソル位置に、"good morning" という文字列が挿入されます。 また、日本語の場合、「こんにちわ」と話すと、「今日は」や「こんにちは」が 挿入されます。
本エディタから、音声認識エンジンを起動して、聞き取りを開始すると、 その状況を示すダイアログボックスが表示されます。この中にある各項目について、 次に説明します。
・準備中... | 最初の起動から初期設定が完了するまでの間 |
・準備完了 | 起動後初めて音声入力の受付けが可能になった時 |
・音声開始 | 音声入力の1区切りの開始を認識した時 |
・音声終了 | 音声入力の1区切りの終了を認識した時 |
・認識中... | 音声認識の処理中、1つの仮説を得た時 |
・認識成功 | 音声認識に成功した時(次の音声入力待ち) |
・認識失敗 | 音声認識に失敗した時(次の音声入力待ち) |
・音声認識 エンジン不備! | エンジンが未搭載または動作不良等で、 正常に機能していない時 |
本エディタで、聞き取りを行なうには、Windows の SAPI 5 ( Speech API version 5 ) に 対応した音声認識エンジンがインストールされている必要があります。 また、Internet Explorer version 5.5 以上(のコンポーネント)が必要です。
Windows Vista では、SAPI 5 対応の日本語の音声認識エンジンが、標準で搭載されています。 それ以前の Windows では、別途インストールする必要があります。 但し、Windows 95, NT3.5 では、できません。
SAPI 5 対応の英語と日本語の音声認識エンジンは、Microsoft 社の ダウンロードセンター 内の
Speech SDK 5.1
のサイトから、無償で入手できます。
また、各種のサードパーティ製の音声認識エンジンも利用できます。そのなかで、
Julius(ユリウス)という
定評の高いフリーの音声認識システムがあります。これは本来、SAPI 対応では
ありませんが、その派生版の
Julius for SAPI
が利用できます。但し、これは、かなりボリュームがあり、起動にそこそこ時間がかかります。
SAPI 5 に準拠していれば、複数のエンジンの登録が可能です。 エンジンの切り換えや調整等は、コントロールパネルから行なえます。
聞き取りには、MikoScript の Apsalyオブジェクト のメンバー関数を 使います。それは、次の関数です。
この関数を使えば、いろいろな聞き取りのアプリケーションが作成できます。 本エディタに搭載している Dictate.mc と いうスクリプトも、この関数を使って、標準的な聞き取りを行なうようになっています。
「スクリプトの実行」ダイアログボックス内の「実行コマンド」に、
この関数を、次のように書いて、直接実行させることもできます。
/! ::Apsaly.Dictate(2);
メインメニューの「ツール」下の「スクリプト集」内の「聞き取り」は、
この形態で実行されます。
なお、この関数は、ご寄付を頂いた方への「特典」になっています。特典がないと、本エディタの起動後、 この関数を使うスクリプトの起動回数が3回を超えると、 この関数は、無効になります。
音声認識の精度は、音声認識エンジンの性能と、マイクやサウンドボード等の ハードウェアの性能に、大きく依存します。また、周囲のノイズにも、影響されます。 通常、音声認識エンジンでは、特定の話者用に訓練したり、あるいは、認識対象の語句を 限定/追加することで、認識精度を上げることができるようになっています。 最善の環境では、認識率が 90% を超えるエンジンもあるようですが、 普通の環境では、そこまでは期待できないようです。