buntu14.04で日本語形態素解析システムJUMANのインストール方法をお伝えする。
JUMAN単体では次のコマンドで簡単にインストールできる。


$ sudo apt-get install juman

しかし、この方法では、日本語構文・格・照応解析システムKNPのインストール時にjuman.hが見つからないと言われてKNPがインストールできないため、KNPも合わせてインストールする場合は、ソースからインストールする必要がある。

そのため、以下はソースからインストールする方法である。

まずはJUMAN – KUROHASHI-KAWAHARA LABより最新のJUMANをダウンロードしておく。
今回はJUMAN Ver.7.01をダウンロードした。
ダウンロードしたあと、端末を開いてダウンロードしたディレクトリに移動しておく。
あとは、次のコマンドを順に実行すればインストールは完了する。


# tar.bz2の解凍
$ bzip2 -dc juman-7.01.tar.bz2 | tar xvf -

# カレントディレクトリの移動
$ cd juman-7.01/

# JUMANのインストール
$ ./configure
$ make
$ sudo make install

これでインストールは完了したが、パスが通っていないため、このままではjumanコマンドは使えない。
ここでは全ユーザーが共通して使えるように設定しておく。
まずは次のファイルを開く。


$ sudo vim /etc/ld.so.conf

開いたファイルに次を追加したあと、保存して閉じる。


include /usr/local/lib

これで、パスの設定が終わったので、パスを読み込み直す。


# パスを読み込み直す
$ sudo ldconfig

実際に、パスが通っているか確認するためバージョンを出力してみる


$ juman -v

juman 7.01

最後に、簡単にJUMANを試してみる。


$ echo "今日は晴れです。" | juman

今日 きょう 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/きょう カテゴリ:時間"
@ 今日 こんにち 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/こんにち カテゴリ:時間"
は は は 助詞 9 副助詞 2 * 0 * 0 NIL
晴れ はれ 晴れる 動詞 2 * 0 母音動詞 1 基本連用形 8 "代表表記:晴れる/はれる 自他動詞:他:晴らす/はらす 反義:動詞:曇る/くもる"
です です だ 判定詞 4 * 0 判定詞 25 デス列基本形 27 NIL
。 。 。 特殊 1 句点 1 * 0 * 0 NIL
EOS

関連する記事

  • Ubutnu,R topicmodelsパッケージのインストールの方法Ubutnu,R topicmodelsパッケージのインストールの方法 Ubuntu14.04上のRで「topicmodels」をインストールする方法をお伝えする。 R上で、install.package("topicmodels")を実行すると、次のようなエラーが出てイントールできない。 > install.packages("topicmodels") ctm.c:29:25: fatal error: […]
  • R言語 CRAN Task View:欠損データR言語 CRAN Task View:欠損データ CRAN Task View: Missing Dataの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Julie Josse, Nicholas Tierney, Nathalie Vialaneix (r-miss-tastic […]
  • 平均的に分類する方法の考察(1)平均的に分類する方法の考察(1) ある定量データが与えられたとき、それを平均的に分類するための方法を考えてみる。 ここで言う平均的に分類するというのは、分類された各グループのデータ数がほぼ等しく、かつ、分類された各グループの平均値が定量データ全体の平均値にほぼ等しくなるように分類するということである。 具体的には、学生のクラス替えを行う際に、100人の学生を3つのクラスに振り分けたいが、その場合、各ク […]
  • UbuntuにRStudioをインストールするための手順UbuntuにRStudioをインストールするための手順 Ubuntuにデスクトップ版のRStudioをインストールするための手順をお伝えする。 まず、Ubuntuが32bitか64bitかを確認するため、端末を起動させ(ショートカットキー:Ctrl+Alt+t)、以下のコマンドを実行する。 i686、i386と表示されれば32bit、x86_64、amd64と表示されれば64bitということである。 $ […]
  • なぜマイナス×マイナス=プラスとなるのかなぜマイナス×マイナス=プラスとなるのか 先日、ある人と話しているときに、私が大学で数学を学んだことを告げると、「なぜ、マイナス×マイナス=プラスとなるのか」と質問を受けた。 どうやら、「マイナス×マイナス=プラス」はルールとして覚えているようだった。 この質問を受けたとき、正直に言うと「すばらしい」と思った。なぜそう思ったのかというと、すでに当たり前として組み込まれている「マイナス×マイナス=プラス」に対し […]
Ubuntu 日本語形態素解析システムJUMANのインストール方法