userdic - 日本語入力ユーザー辞書変換スクリプト

[ サイトトップ | 上へ | 編集 | 一覧・作成 ]

あらまし

各社の日本語入力システムのユーザー辞書を相互変換するスクリプトです。以下のシステムに対応しますが動作実績のないものもあります。実行にRuby 2.0以降が必要です。

名称出力コード備考
MozcUTF-8
Google日本語入力UTF-8Mozcと同じ
AnthyUTF-8
ATOKUTF-16 (LE)未検証旧形式の入力にも一応対応
MS-IMEUTF-16 (LE)未検証
Wnn4EUC-JP未検証
CannaEUC-JP未検証品詞情報はAnthyと同じ
macOS (10.11〜)UTF-8plist形式、品詞情報なし

ダウンロード

書式

ruby userdic <変換元> <変換先> < 変換元ファイル名 > 変換先ファイル名

<変換元> <変換先> には mozc, google, anthy, atok, msime, wnn, canna, apple を指定します。

例: Anthyのユーザー辞書を Google日本語にインポートする場合。

ruby userdic anthy google < private_words_default > google.txt

品詞の対応表

ライセンス

ライセンスを言うほどのものではありませんが、免責目的としてGPL2を指定します。

連絡先

@dtanakにTwitterでmention投げてください。

各社の日本語入力システムの品詞情報

Anthy/CannaDic

ATOK

MS-IMEとAnthyの対応

Wnn6