buntu14.04で日本語形態素解析システムJUMANのインストール方法をお伝えする。
JUMAN単体では次のコマンドで簡単にインストールできる。


$ sudo apt-get install juman

しかし、この方法では、日本語構文・格・照応解析システムKNPのインストール時にjuman.hが見つからないと言われてKNPがインストールできないため、KNPも合わせてインストールする場合は、ソースからインストールする必要がある。

そのため、以下はソースからインストールする方法である。

まずはJUMAN – KUROHASHI-KAWAHARA LABより最新のJUMANをダウンロードしておく。
今回はJUMAN Ver.7.01をダウンロードした。
ダウンロードしたあと、端末を開いてダウンロードしたディレクトリに移動しておく。
あとは、次のコマンドを順に実行すればインストールは完了する。


# tar.bz2の解凍
$ bzip2 -dc juman-7.01.tar.bz2 | tar xvf -

# カレントディレクトリの移動
$ cd juman-7.01/

# JUMANのインストール
$ ./configure
$ make
$ sudo make install

これでインストールは完了したが、パスが通っていないため、このままではjumanコマンドは使えない。
ここでは全ユーザーが共通して使えるように設定しておく。
まずは次のファイルを開く。


$ sudo vim /etc/ld.so.conf

開いたファイルに次を追加したあと、保存して閉じる。


include /usr/local/lib

これで、パスの設定が終わったので、パスを読み込み直す。


# パスを読み込み直す
$ sudo ldconfig

実際に、パスが通っているか確認するためバージョンを出力してみる


$ juman -v

juman 7.01

最後に、簡単にJUMANを試してみる。


$ echo "今日は晴れです。" | juman

今日 きょう 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/きょう カテゴリ:時間"
@ 今日 こんにち 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/こんにち カテゴリ:時間"
は は は 助詞 9 副助詞 2 * 0 * 0 NIL
晴れ はれ 晴れる 動詞 2 * 0 母音動詞 1 基本連用形 8 "代表表記:晴れる/はれる 自他動詞:他:晴らす/はらす 反義:動詞:曇る/くもる"
です です だ 判定詞 4 * 0 判定詞 25 デス列基本形 27 NIL
。 。 。 特殊 1 句点 1 * 0 * 0 NIL
EOS

関連する記事

  • 経営戦略に使えるRFM分析の基礎知識と活用法経営戦略に使えるRFM分析の基礎知識と活用法 RFM分析とは、ある一定期間の購買履歴データを用いて、顧客を分類することにより様々な示唆を得るための分析手法である。分類の仕方は、顧客を直近購買時期・購入頻度・購買額の3つの軸で分類し、各軸ごとにランク分けをする。このことにより、顧客が現在どの位置にいて、それがどのくらいの人数なのかを把握することができる。 あなたは、このような分類をすることにどのようなメリットがあるの […]
  • R言語 CRAN Task View:時空間データの処理と分析R言語 CRAN Task View:時空間データの処理と分析 CRAN Task View: Handling and Analyzing Spatio-Temporal Dataの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Edzer Pebesma Contact: edzer.pebesma at […]
  • Windows上のMariaDBでサービスの開始・停止を行う方法Windows上のMariaDBでサービスの開始・停止を行う方法 Windows上のMariaDBでサービスの開始・停止を行う方法をお伝えいたします。 一般的なアプリケーションは、立ち上げて何か操作し閉じるというサイクルを持ちます。一方、MariaDBは、他のアプリケーションからアクセスされるまで待機しており、アクセスされる度にアプリケーションへ応答を返します。この間、MariaDBはずっと稼働中となります。そのため、MariaDBは […]
  • matplotlibで箱ひげ図を表示する方法matplotlibで箱ひげ図を表示する方法 Python3でmatplotlibを用いて、箱ひげ図を表示する方法をお伝えする。 Ubuntu14.04環境で動作することを確認している。 一つ注意点として、日本語に対応させるために、ここでは「IPAexGothic」を用いている。 import matplotlib as mpl import matplotlib.pyplot as […]
  • R言語 CRAN Task View:多変量統計R言語 CRAN Task View:多変量統計 CRAN Task View: Multivariate Statisticsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Paul Hewson Contact: Paul.Hewson at […]
Ubuntu 日本語形態素解析システムJUMANのインストール方法