辞書検索

 本エディタでは、インターネット上の辞書検索だけでなく、 オフラインでのローカル辞書検索も行なえます。それには、現状、次の種類があります。
  ・和英辞書検索
  ・英和辞書検索
  ・郵便番号検索
なお、これらの辞書検索では、それぞれの辞書ファイルを、準備しておく必要があります。

■和英辞書検索

 本エディタの和英辞書検索は、単に見出し語の検索だけでなく、前方一致、後方一致、部分一致などの 検索や、本文(訳文)内の検索なども行なえます。この検索の際には、「語句」と「検索形態」と「検索範囲」を 指定します。
 語句には、検索する語句を入力します。 ここには、あらかじめ初期文字列として、現編集テキスト内の選択文字列が入っています。 選択範囲が無い時は、現カーソル位置にある単語等が入ります。それがなければ、空になります。 なお、語句の入力の際には今までの履歴も参照できます。
 検索形態は、次の三者の中から1つを選びます。
・単独 「語句」自身(その前後に何も付かない語句)を検索
・ワイルド
  カード
「語句」内に * と . のメタ文字が使えます。 * は0字以上の任意の文字列に一致し、. は任意の1字に一致します。 これを使えば、いろいろな検索が行なえます。例えば、
 「環境*」は「環境」を先頭に含む語句(前方一致)
 「*環境」は「環境」を末尾に含む語句(後方一致)
 「*環境*」は「環境」をどこかに含む語句(部分一致)
・正規表現 「語句」は正規表現として扱われ、これに一致する語句が検索されます。
 検索範囲は、次の三者から1つ以上を指定します。
・見出し語検索は見出し語に対して行なわれます。
・本文(訳文)検索は本文(訳文)に対して行なわれます。 この場合、本文(訳文)内に「語句」に一致する部分がある項目が抽出されます。 この使い方は「和英」というよりも「英和」的になります。
・読み検索は見出し語の読みかなに対して行なわれます。 見出し語は漢字を含む場合が多いので、その読みかなで検索したい時に指定します。

 さて、和英辞書検索は、次のようにして実行します。
(1)「和英辞書検索」という項目が、ツールボックス内と、メインメニュー の「ツール」→「スクリプト集」にあります(初期環境の場合)。この項目を実行すると、 和英辞書検索のダイアログボックスが表示されます。
(2) ここで、検索する「語句」と「検索形態」と「検索範囲」を指定します。
(3) 「検索」ボタンをクリックするか、改行キーを押すと、検索が開始されます。 以降、それに該当する項目が、レポートウィンドウに表示されます。 この該当項目には、その見出し語、読みかな、品詞、英訳の単語、英文などが含まれています。

 なお、この和英辞書検索は、SearchWaei.mc というスクリプトで実現しています。

辞書ファイル:

 本辞書検索では、EDICT という辞書ファイルを、使わせて頂いています。この詳細は、
    The EDICT Dictionary File
というサイトをご覧ください。さて、本辞書検索に必要な実行環境を整えるには、次のようにします。

(1)上記サイトから、EDICT 辞書ファイル( edict.zip )を ダウンロードしてきます。
(2)その書庫ファイルを解凍して、そのうちの edict という ファイルを、本エディタで開きます。このファイルのテキストは、文字コードが EUC-JP で、 サイズは、10MB 以上あります。
(3)このテキストを、本エディタのインストールフォルダー内 の Dict フォルダーに、edict.txt というファイル名で、Shift-JIS コードに変えて、保存します。 なお、改行コードは、LF のままにしておいてください( CR+LF に変更してはいけません)。
これで準備はOKです。これ以降、もとの辞書ファイルは不要です。 要するに、EDICT の辞書ファイルのテキストを、Shift-JIS コード に変換して、 本エディタの Dict フォルダー内に、edict.txt というファイル名で、 格納するだけです。

■英和辞書検索

 本エディタの英和辞書検索は、単に見出し語の検索だけでなく、前方一致、後方一致、部分一致などの 検索や、本文(訳文)内の検索なども行なえます。この検索の際には、「語句」と「検索形態」と「検索範囲」を 指定します。
 語句には、検索する語句を入力します。 ここには、あらかじめ初期文字列として、現編集テキスト内の選択文字列が入っています。 選択範囲が無い時は、現カーソル位置にある単語等が入ります。それがなければ、空になります。 なお、語句の入力の際には今までの履歴も参照できます。
 検索形態は、次の三者の中から1つを選びます。
・単独 「語句」自身(その前後に何も付かない語句)を検索
・ワイルド
  カード
「語句」内に * と . のメタ文字が使えます。 * は0字以上の任意の文字列に一致し、. は任意の1字に一致します。 これを使えば、いろいろな検索が行なえます。例えば、
 「for*」は「for」を先頭に含む語句(前方一致)
 「*ment」は「ment」を末尾に含む語句(後方一致)
 「*side*」は「side」をどこかに含む語句(部分一致)
・正規表現 「語句」は正規表現として扱われ、これに一致する語句が検索されます。
 検索範囲は、次の三者から1つ以上を指定します。
・見出し語検索は見出し語に対して行なわれます。
・本文(訳文)検索は本文(訳文)に対して行なわれます。 この場合、本文(訳文)内に「語句」に一致する部分がある項目が抽出されます。 この使い方は「英和」というよりも「和英」的になります。
・用例検索は用例に対して行なわれます。

 さて、英和辞書検索は、次のようにして実行します。
(1)「英和辞書検索」という項目が、ツールボックス内と、メインメニュー の「ツール」→「スクリプト集」にあります(初期環境の場合)。この項目を実行すると、 英和辞書検索のダイアログボックスが表示されます。
(2) ここで、検索する「語句」と「検索形態」と「検索範囲」を指定します。
(3)「検索」ボタンをクリックするか、 改行キーを押すと、その語句の検索が開始されます。 以降、それに該当する項目が、レポートウィンドウに表示されます。 この該当項目には、その見出しの英単語と日本語の訳文があります。

 なお、この和英辞書検索は、SearchEiwa.mc というスクリプトで実現しています。

辞書ファイル:

 本辞書検索では、GENE95 という辞書ファイルを、使わせて頂いています。この詳細は、
    GENE95 辞書
というサイトをご覧ください。さて、本辞書検索に必要な実行環境を整えるには、次のようにします。

(1)上記サイトから、GENE95 辞書ファイル( gene95.lzh )を ダウンロードしてきます。
(2)その書庫ファイルのなかにある GENE.TXT というファイルを、 本エディタのインストールフォルダー内の Dict フォルダーに、そのファイル名のままで、 格納します。ちなみに、このファイルのサイズは、2.6 MB 程度あります。
(3)GENE.TXT の改行コードは元々、CR+LF になっていますが、 ここでは LF に変更しておく必要がます。それには、このファイルを本エディタで 開いて、「名前を付けて保存」を実行し、改行コードとして LF を選んで、「保存」します。
 これで準備はOKです。これ以降、もとの書庫ファイルは不要です。

■郵便番号検索

 郵便番号検索は、次のようにして行ないます。
(1)「郵便番号検索」という項目が、ツールボックス内と、メインメニュー の「ツール」→「スクリプト集」にあります(初期環境の場合)。 この項目を実行すると、検索語句を入力するダイアログボックスが表示されます。
(2)ここで、検索語句を入力します。 なお、ここにはあらかじめ、初期文字列として、現編集テキスト内の選択文字列が入っています。 選択範囲が無い時は、現カーソル位置の単語等が入っているか、空になっています。
(3) 郵便番号から住所を検索する場合は、検索語句に、その郵便番号の7桁の数字(半角)を続けて 入力します(例:1100006)。入力文字が数字だけの場合には、その3桁目と4桁目の間に、 ハイフン(マイナス記号)を入れても構いません(例:110-0006)。 郵便番号の7桁のうちのどれかの桁が分からない時は、その桁を「\d」として入力します。 例えば、3桁目が分からない時は、「11\d0006」と入力します。また、 3桁目と7桁目が分からない時は、「11\d000\d」と入力します。 そうすれば、「\d」の桁はどんな数字であっても、その該当候補として列挙されます。 そのほか正規表現を使えば、いろいろな検索ができます。
(4) 住所から郵便番号を検索する場合は、検索語句に、その住所を入力します。 この場合、まず、全国に唯一その地名しかない場合(例えば「秋葉原」等)は、 それだけの入力で済みます。しかし、全国にその地名が多数ある場合は、若干面倒ですが、 その「都道府県名」や「市区町名」を「.*」という記号で区切って入力します。 例えば、「東京都.*千代田区.*一番町」のように入力します。 但し、これをもう少し簡略して、例えば、「東京.*一番」とすることもできます。 その場合、東京に「一番」を含む地名が他にあれば、それも候補に挙がります。
(5)検索語句の入力後、OKボタンをクリックするか、 改行キーを押すと、その語句の検索が開始されます。 以降、それに該当する各項目の郵便番号、住所、住所の読みが、レポートウィンドウに 表示されます。次に、この検索結果の例を示します。

郵便番号検索: 1100006
〒110-0006  東京都 台東区 秋葉原( トウキョウト タイトウク アキハバラ )

郵便番号検索: 11\d0006
〒112-0006  東京都 文京区 小日向( トウキョウト ブンキョウク コヒナタ )
〒110-0006  東京都 台東区 秋葉原( トウキョウト タイトウク アキハバラ )

郵便番号検索: 東京.*一番
〒102-0082  東京都 千代田区 一番町( トウキョウト チヨダク イチバンチョウ )
〒190-0033  東京都 立川市 一番町( トウキョウト タチカワシ イチバンチョウ )

辞書ファイル:

 本検索に必要な郵便番号のデータは、次のようにして準備します。

(1) 日本郵便の「郵便番号データダウンロード」サイト内にある 「全国一括」から、ken_all.lzh というファイルを、ダウンロードしてきます。
(2)その書庫ファイルのなかの KEN_ALL.CSV というファイルを、 本エディタのインストールフォルダー内の Dict フォルダーに、そのファイル名のままで、 格納します。ちなみに、このファイルのサイズは、12 MB 近くあります。
 これで準備はOKです。これ以降、もとの書庫ファイルは不要です。

■補足説明

 上記の辞書検索は、全て MikoScript で実現しています。 これらのソースコードは、すべて公開されているので、自由に変更できます。 また、上記の辞書データは、どれもテキストファイルなので、自由に追加/修正できます。 これらのスクリプトや辞書データは、それ以外の種類の辞書を検索する機能を開発する時に、 非常に参考になります。例えば、
  ・同類語検索
  ・反対語検索
  ・英語や日本語の例文検索
  ・人名地名検索
  ・専門用語検索
などの辞書検索は、その辞書データを自作またはインターネット等から入手して、 スクリプトを少し変更すれば、比較的容易に実現できます。