2007年5月20日 / 薄明日記

2007年5月20日 (日)

天気がいい

乙女高原あたりにでも行ってみようか。

[FreeBSD] ユーザー辞書の移行

かんなから Anthy にユーザー辞書を移行した。面倒なので箇条書き。

Anthy の辞書管理には kasumi (霞) というコマンドを使う。 ports で ja-scim-anthy をインストールすると同時に導入される。また、コマンドラインで一括登録するときは、anthy-dic-tool を使う。
ただし、kasumi-2.2 には anthy の特定バージョンとの組み合わせでクラッシュするバグがあるようだ。パッチを作成
単語を一括で登録するには anthy-dic-tool が適しているようだが、ファイル形式が特殊なのでいろいろ調べてみる...
Anthy のユーザー辞書は ~/.anthy/private_words_default。このファイルは実はかんな形式の辞書で、ただし UTF-8 で格納されている。
そこで、catdic user | nkf -w > ~/.anthy/private_words_default としてみたが、変換候補には出てこない。
ツールパレットから霞を起動すると書き込んだユーザ辞書の一覧は表示される。GUI 上でちょこっと変更して保存すると今度は移行した単語が変換候補にでるようになる。しかし問題がふたつ。
その壱。かんなの辞書のマルチエントリ (『あきこ #T35*1 朗子聡子章子』みたいなの)を解体してくれない。分解して各1行になるような前処理をして対応。(splitword で。)
その弐。JIS X 0212 文字が下駄になってしまう。こちらはそのまま。UTF-8 化が進んでいるようなのでそのうち使えるようになるだろう。

% catdic user | anthy-dic-tool --import-cannadic

とかできると楽だ。

これを使えばよかったのか...

コメント: 0件

メーリングリスト

anthy-dev と scim-imengine-dev の ML に参加してみよう。

コメント: 0件

乙女高原

乙女高原と瑞牆山に行ってきた。実にきれいに晴れていた。ふたご座の真ん中に陣どった月と金星が美しい。

コメント: 0件

[FreeBSD] scim-anthy 1.3.0+

UTF-8 を使うために (というか JIS X 0212 の漢字を使うために) 開発版を CVS から取ってきてインストールしてみた。設定パネルの「辞書のエンコーディング」に UTF-8 が追加されており、これを選択すると旧版で下駄になっていた JIS X 0212 漢字が入力できるようになった。

ついでに kasumi も UTF-8 を通すように改造。といってもエンコード変換を削除して、辞書とのインターフェイスを UTF-8 で行うように宣言しただけ。パッチはこれ。

コメント: 0件