MS-IMEの辞書のチューニング

 以前ダウンロードしたCanada式辞書のファイルを探してみると、med_dic_2002.lzhが見つかった。Mac OS Xへのポーティングというか、辞書データを活用させていただくには、こちらがおおいに参考になるであろう。96,295語を収集し、3.12 MBとなる。出力ファイル(こちらは""なしのタブ区切りファイル)をざっと眺めてみたら品詞の種類がやたらに多い。{名詞|さ変名詞|{あわ行〜ら行}五段|一段動詞|形容動詞|形容詞|接頭語|慣用句|冠数詞|助数詞|連体詞|副詞|接続詞|接尾語|固有名詞|人名|名|姓|組織|国|町|地名その他|数詞|短縮よみ|単漢字}。このあたり、マージにあたっては気になるところである。ただし、ことえりのヘルプによれば品詞の種類は、『「ことえり単語登録」の画面にある 8 種類に加え、「JIS X 4062:1998 仮名漢字変換辞書交換形式」で定義されたものも使うことができます。』とのこと。「名詞」を「普通名詞」に直すくらいでinterchangeableになりそうである。[WinXP]

本ブログではamazon associate広告を利用しています。