本エディタでは、インターネット上の辞書検索だけでなく、
オフラインでのローカル辞書検索も行なえます。それには、現状、次の種類があります。
・和英辞書検索
・英和辞書検索
・郵便番号検索
また、次の辞書検索では、語句入力の手間なく、英和/和英、オフライン/オンラインの辞書選択が
自動的に行なわれます。
・マウスポインタ位置の語句の辞書検索
なお、これらの辞書検索では、それぞれの辞書ファイルを、準備しておく必要があります。
本エディタの和英辞書検索は、単に見出し語の検索だけでなく、前方一致、後方一致、部分一致などの
検索や、本文(訳文)内の検索なども行なえます。この検索の際には、「語句」と「検索形態」と「検索範囲」を
指定します。
語句には、検索する語句を入力します。
ここには、あらかじめ初期文字列として、現編集テキスト内の選択文字列が入っています。
選択範囲が無い時は、現カーソル位置にある単語等が入ります。それがなければ、空になります。
なお、語句の入力の際には今までの履歴も参照できます。
検索形態は、次の三者の中から1つを選びます。
・単独 | 「語句」自身(その前後に何も付かない語句)を検索 |
・ワイルド カード |
「語句」内に * と . のメタ文字が使えます。
* は0字以上の任意の文字列に一致し、. は任意の1字に一致します。
これを使えば、いろいろな検索が行なえます。例えば、 「環境*」は「環境」を先頭に含む語句(前方一致) 「*環境」は「環境」を末尾に含む語句(後方一致) 「*環境*」は「環境」をどこかに含む語句(部分一致) |
・正規表現 | 「語句」は正規表現として扱われ、これに一致する語句が検索されます。 |
・見出し語 | 検索は見出し語に対して行なわれます。 |
・本文(訳文) | 検索は本文(訳文)に対して行なわれます。 この場合、本文(訳文)内に「語句」に一致する部分がある項目が抽出されます。 この使い方は「和英」というよりも「英和」的になります。 |
・読み | 検索は見出し語の読みかなに対して行なわれます。 見出し語は漢字を含む場合が多いので、その読みかなで検索したい時に指定します。 |
さて、和英辞書検索は、次のようにして実行します。
(1) | 「和英辞書検索」という項目が、ツールボックス内と、メインメニュー の「ツール」→「スクリプト集」にあります(初期環境の場合)。この項目を実行すると、 和英辞書検索のダイアログボックスが表示されます。 |
(2) | ここで、検索する「語句」と「検索形態」と「検索範囲」を指定します。 |
(3) | 「検索」ボタンをクリックするか、改行キーを押すと、検索が開始されます。 以降、それに該当する項目が、レポートウィンドウに表示されます。 この該当項目には、その見出し語、読みかな、品詞、英訳の単語、英文などが含まれています。 |
なお、この和英辞書検索は、SearchWaei.mc というスクリプトで実現しています。
本辞書検索では、EDICT という辞書ファイルを、使わせて頂いています。この詳細は、
The EDICT Dictionary File
というサイトをご覧ください。さて、本辞書検索に必要な実行環境を整えるには、次のようにします。
(1) | 上記サイトから、EDICT 辞書ファイル( edict.zip )を ダウンロードしてきます。 |
(2) | その書庫ファイルを解凍して、そのうちの edict という ファイルを、本エディタで開きます。このファイルのテキストは、文字コードが EUC-JP で、 サイズは、10MB 以上あります。 |
(3) | このテキストを、本エディタのインストールフォルダー内 の Dict フォルダーに、edict.txt というファイル名で、UTF-16(LE) に変えて、保存します。 なお、改行コードは、LF のままにしておいてください( CR+LF に変更してはいけません)。 |
本エディタの英和辞書検索は、単に見出し語の検索だけでなく、前方一致、後方一致、部分一致などの
検索や、本文(訳文)内の検索なども行なえます。この検索の際には、「語句」と「検索形態」と「検索範囲」を
指定します。
語句には、検索する語句を入力します。
ここには、あらかじめ初期文字列として、現編集テキスト内の選択文字列が入っています。
選択範囲が無い時は、現カーソル位置にある単語等が入ります。それがなければ、空になります。
なお、語句の入力の際には今までの履歴も参照できます。
検索形態は、次の三者の中から1つを選びます。
・単独 | 「語句」自身(その前後に何も付かない語句)を検索 |
・ワイルド カード |
「語句」内に * と . のメタ文字が使えます。
* は0字以上の任意の文字列に一致し、. は任意の1字に一致します。
これを使えば、いろいろな検索が行なえます。例えば、 「for*」は「for」を先頭に含む語句(前方一致) 「*ment」は「ment」を末尾に含む語句(後方一致) 「*side*」は「side」をどこかに含む語句(部分一致) |
・正規表現 | 「語句」は正規表現として扱われ、これに一致する語句が検索されます。 |
・見出し語 | 検索は見出し語に対して行なわれます。 |
・本文(訳文) | 検索は本文(訳文)に対して行なわれます。 この場合、本文(訳文)内に「語句」に一致する部分がある項目が抽出されます。 この使い方は「英和」というよりも「和英」的になります。 |
・用例 | 検索は用例に対して行なわれます。 |
さて、英和辞書検索は、次のようにして実行します。
(1) | 「英和辞書検索」という項目が、ツールボックス内と、メインメニュー の「ツール」→「スクリプト集」にあります(初期環境の場合)。この項目を実行すると、 英和辞書検索のダイアログボックスが表示されます。 |
(2) | ここで、検索する「語句」と「検索形態」と「検索範囲」を指定します。 |
(3) | 「検索」ボタンをクリックするか、 改行キーを押すと、その語句の検索が開始されます。 以降、それに該当する項目が、レポートウィンドウに表示されます。 この該当項目には、その見出しの英単語と日本語の訳文があります。 |
なお、この和英辞書検索は、SearchEiwa.mc というスクリプトで実現しています。
本辞書検索では、GENE95 という辞書ファイルを、使わせて頂いています。この詳細は、
GENE95 辞書
というサイトをご覧ください。さて、本辞書検索に必要な実行環境を整えるには、次のようにします。
(1) | 上記サイトから、GENE95 辞書ファイル( gene95.lzh )を ダウンロードしてきます。 |
(2) | その書庫ファイルのなかにある GENE.TXT というファイルを、 本エディタのインストールフォルダー内の Dict フォルダーに、そのファイル名のままで、 格納します。ちなみに、このファイルのサイズは、2.6 MB 程度あります。 |
(3) | GENE.TXT の文字コードと改行コードは元々、 Shift-JIS, CR+LF になっていますが、ここでは、UTF-16(LE), LF に変更しておく必要があります。 それには、このファイルを本エディタで開いて、「名前を付けて保存」を実行し、 文字コード系として UTF-16(LE) を、改行コードとして LF を選んで、「保存」します。 |
郵便番号検索は、次のようにして行ないます。
(1) | 「郵便番号検索」という項目が、ツールボックス内と、メインメニュー の「ツール」→「スクリプト集」にあります(初期環境の場合)。 この項目を実行すると、検索語句を入力するダイアログボックスが表示されます。 |
(2) | ここで、検索語句を入力します。 なお、ここにはあらかじめ、初期文字列として、現編集テキスト内の選択文字列が入っています。 選択範囲が無い時は、現カーソル位置の単語等が入っているか、空になっています。 |
(3) | 郵便番号から住所を検索する場合は、検索語句に、その郵便番号の7桁の数字(半角)を続けて 入力します(例:1100006)。入力文字が数字だけの場合には、その3桁目と4桁目の間に、 ハイフン(マイナス記号)を入れても構いません(例:110-0006)。 郵便番号の7桁のうちのどれかの桁が分からない時は、その桁を「\d」として入力します。 例えば、3桁目が分からない時は、「11\d0006」と入力します。また、 3桁目と7桁目が分からない時は、「11\d000\d」と入力します。 そうすれば、「\d」の桁はどんな数字であっても、その該当候補として列挙されます。 そのほか正規表現を使えば、いろいろな検索ができます。 |
(4) | 住所から郵便番号を検索する場合は、検索語句に、その住所を入力します。 この場合、まず、全国に唯一その地名しかない場合(例えば「秋葉原」等)は、 それだけの入力で済みます。しかし、全国にその地名が多数ある場合は、若干面倒ですが、 その「都道府県名」や「市区町名」を「.*」という記号で区切って入力します。 例えば、「東京都.*千代田区.*一番町」のように入力します。 但し、これをもう少し簡略して、例えば、「東京.*一番」とすることもできます。 その場合、東京に「一番」を含む地名が他にあれば、それも候補に挙がります。 |
(5) | 検索語句の入力後、OKボタンをクリックするか、 改行キーを押すと、その語句の検索が開始されます。 以降、それに該当する各項目の郵便番号、住所、住所の読みが、レポートウィンドウに 表示されます。次に、この検索結果の例を示します。 |
郵便番号検索: 1100006 〒110-0006 東京都 台東区 秋葉原( トウキョウト タイトウク アキハバラ ) 郵便番号検索: 11\d0006 〒112-0006 東京都 文京区 小日向( トウキョウト ブンキョウク コヒナタ ) 〒110-0006 東京都 台東区 秋葉原( トウキョウト タイトウク アキハバラ ) 郵便番号検索: 東京.*一番 〒102-0082 東京都 千代田区 一番町( トウキョウト チヨダク イチバンチョウ ) 〒190-0033 東京都 立川市 一番町( トウキョウト タチカワシ イチバンチョウ )
本検索に必要な郵便番号のデータは、次のようにして準備します。
(1) | 日本郵便の「郵便番号データダウンロード」サイト内にある 「全国一括」から、ken_all.lzh というファイルを、ダウンロードしてきます。 |
(2) | その書庫ファイルのなかの KEN_ALL.CSV というファイルを、 本エディタのインストールフォルダー内の Dict フォルダーに、そのファイル名のままで、 格納します。ちなみに、このファイルのサイズは、12 MB 近くあります。 |
(3) | KEN_ALL.CSV の文字コードと改行コードは元々、 Shift-JIS, CR+LF になっていますが、ここでは、UTF-16(LE), LF に変更しておく必要があります。 それには、このファイルを本エディタで開いて、「名前を付けて保存」を実行し、 文字コード系として UTF-16(LE) を、改行コードとして LF を選んで、「保存」します。 |
この辞書検索では、例えば、英語の文章を本エディタで表示して読んでいるときに、
意味の分からない単語があると、そこにマウスポインタを合わせて、マウスの中央ボタンを押せば、
その単語の意味が即時に表示されます。このように、ごく簡単な操作で辞書が引けるので、
軽快に英文を読み進めていけます。
また、この辞書検索では、日本語の単語にマウスポインタを合わせて、マウスの中央ボタンを押すと、
その英語訳が即時に表示されるようになっています。
複数の単語(熟語)を検索する場合は、その範囲を選択してから、マウスの中央ボタンを押します。
それ以外の場合でも、とにかく選択範囲があれば、マウスポインタの位置に関係なく、
その範囲の語句が検索されます。
この検索では、前述の辞書(英和辞書は GENE.TXT、和英辞書は edict.txt )が使われます。 検索対象の語句が、この辞書で見つかれば、その内容が、レポートウィンドウに表示されます。 その語句が見つからない時や、そもそもこれらの辞書が使えるようになっていない時には、 インターネット上の weblib というサイトで検索した結果が、 インターネット・ブラウザーで表示されます。
この辞書検索は、DictLookup.mc というスクリプトで実現しています。 このスクリプトは、本エディタの Ver.1.20 以降の初期環境では、 マウスの中央ボタンのクリックで、起動されるように設定されています。
上記の辞書検索は、全て MikoScript で実現しています。
これらのソースコードは、すべて公開されているので、必要に応じて自由に変更して頂けます。
また、上記の辞書データは、どれもテキストファイルなので、自由に追加/修正できます。
これらのスクリプトや辞書データは、それ以外の種類の辞書を検索する機能を開発する時に、
非常に参考になります。例えば、
・同類語検索
・反対語検索
・英語や日本語の例文検索
・人名地名検索
・専門用語検索
などの辞書検索は、その辞書データを自作またはインターネット等から入手して、
スクリプトを少し変更すれば、比較的容易に実現できます。