buntu14.04で日本語形態素解析システムJUMANのインストール方法をお伝えする。
JUMAN単体では次のコマンドで簡単にインストールできる。


$ sudo apt-get install juman

しかし、この方法では、日本語構文・格・照応解析システムKNPのインストール時にjuman.hが見つからないと言われてKNPがインストールできないため、KNPも合わせてインストールする場合は、ソースからインストールする必要がある。

そのため、以下はソースからインストールする方法である。

まずはJUMAN – KUROHASHI-KAWAHARA LABより最新のJUMANをダウンロードしておく。
今回はJUMAN Ver.7.01をダウンロードした。
ダウンロードしたあと、端末を開いてダウンロードしたディレクトリに移動しておく。
あとは、次のコマンドを順に実行すればインストールは完了する。


# tar.bz2の解凍
$ bzip2 -dc juman-7.01.tar.bz2 | tar xvf -

# カレントディレクトリの移動
$ cd juman-7.01/

# JUMANのインストール
$ ./configure
$ make
$ sudo make install

これでインストールは完了したが、パスが通っていないため、このままではjumanコマンドは使えない。
ここでは全ユーザーが共通して使えるように設定しておく。
まずは次のファイルを開く。


$ sudo vim /etc/ld.so.conf

開いたファイルに次を追加したあと、保存して閉じる。


include /usr/local/lib

これで、パスの設定が終わったので、パスを読み込み直す。


# パスを読み込み直す
$ sudo ldconfig

実際に、パスが通っているか確認するためバージョンを出力してみる


$ juman -v

juman 7.01

最後に、簡単にJUMANを試してみる。


$ echo "今日は晴れです。" | juman

今日 きょう 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/きょう カテゴリ:時間"
@ 今日 こんにち 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/こんにち カテゴリ:時間"
は は は 助詞 9 副助詞 2 * 0 * 0 NIL
晴れ はれ 晴れる 動詞 2 * 0 母音動詞 1 基本連用形 8 "代表表記:晴れる/はれる 自他動詞:他:晴らす/はらす 反義:動詞:曇る/くもる"
です です だ 判定詞 4 * 0 判定詞 25 デス列基本形 27 NIL
。 。 。 特殊 1 句点 1 * 0 * 0 NIL
EOS
Ubuntu 日本語形態素解析システムJUMANのインストール方法