2017年08月 / 07月≪ 12345678910111213141516171819202122232425262728293031≫09月

--.--.-- (--)

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
--:--  |  スポンサー広告  |  EDIT  |  Top↑

2010.11.06 (Sat)

[Java] Sen のインストールとエラー [LINUX]

UTF-8 環境の Debian LINUX に Sen をインストールしてみた。
しかし、どうもうまく動かない。
どのような文字列を入力しても、全て未知語だけになってしまう。
もちろん、正しく分割されていない。
これでは使いものにならない。


原因は、

   SEN_HOME/dic/dictionary.properties

の設定が間違っていた。
このファイルの中には2箇所文字コードを指定する部分があり、一つが辞書の文字コード、もうひとつが(たぶん) sen で使うための文字コードである。
そのため、 sen.charset の方だけシステムと同じものに変更する。
dic.charset はそのままにしておく。

   dic.charset=EUC_JP
   sen.charset=UTF-8

sen.charset だけ書き換え、SEN_HOME/dic 内で ant を実行したら、未知語だらけになっていたものが正しく動作するようになった。

テーマ : Linux ジャンル : コンピュータ

21:51  |  LINUX  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑

*Comment

コメントを投稿する

URL
COMMENT
PASS  編集・削除するのに必要
SECRET  管理者だけにコメントを表示  (非公開コメント投稿可能)
 

▲PageTop

*Trackback

この記事のトラックバックURL

→http://gasser.blog114.fc2.com/tb.php/462-8f0bdd9d

この記事にトラックバックする(FC2ブログユーザー)

この記事へのトラックバック

▲PageTop

 | BLOGTOP | 

 
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。