buntu14.04で日本語形態素解析システムJUMANのインストール方法をお伝えする。
JUMAN単体では次のコマンドで簡単にインストールできる。


$ sudo apt-get install juman

しかし、この方法では、日本語構文・格・照応解析システムKNPのインストール時にjuman.hが見つからないと言われてKNPがインストールできないため、KNPも合わせてインストールする場合は、ソースからインストールする必要がある。

そのため、以下はソースからインストールする方法である。

まずはJUMAN – KUROHASHI-KAWAHARA LABより最新のJUMANをダウンロードしておく。
今回はJUMAN Ver.7.01をダウンロードした。
ダウンロードしたあと、端末を開いてダウンロードしたディレクトリに移動しておく。
あとは、次のコマンドを順に実行すればインストールは完了する。


# tar.bz2の解凍
$ bzip2 -dc juman-7.01.tar.bz2 | tar xvf -

# カレントディレクトリの移動
$ cd juman-7.01/

# JUMANのインストール
$ ./configure
$ make
$ sudo make install

これでインストールは完了したが、パスが通っていないため、このままではjumanコマンドは使えない。
ここでは全ユーザーが共通して使えるように設定しておく。
まずは次のファイルを開く。


$ sudo vim /etc/ld.so.conf

開いたファイルに次を追加したあと、保存して閉じる。


include /usr/local/lib

これで、パスの設定が終わったので、パスを読み込み直す。


# パスを読み込み直す
$ sudo ldconfig

実際に、パスが通っているか確認するためバージョンを出力してみる


$ juman -v

juman 7.01

最後に、簡単にJUMANを試してみる。


$ echo "今日は晴れです。" | juman

今日 きょう 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/きょう カテゴリ:時間"
@ 今日 こんにち 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/こんにち カテゴリ:時間"
は は は 助詞 9 副助詞 2 * 0 * 0 NIL
晴れ はれ 晴れる 動詞 2 * 0 母音動詞 1 基本連用形 8 "代表表記:晴れる/はれる 自他動詞:他:晴らす/はらす 反義:動詞:曇る/くもる"
です です だ 判定詞 4 * 0 判定詞 25 デス列基本形 27 NIL
。 。 。 特殊 1 句点 1 * 0 * 0 NIL
EOS

関連する記事

  • R言語 CRAN Task View:極値解析R言語 CRAN Task View:極値解析 CRAN Task View: Extreme Value Analysisの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Christophe Dutang, Kevin Jaunatre Contact: Christophe.Dutang at […]
  • 基本統計量基本統計量 [latexpage] 基本統計量とは、データの基本的な特徴を表す値のことで、代表値と散布度に区分できる。代表値とは、データを代表するような値のことで、例えば、平均値、最大値、最小値などがある。散布度とは、データの散らばり度合いを表すような値のことで、例えば、分散、標準偏差などがある。 平均値 […]
  • RStudioのエディタテーマ一覧RStudioのエディタテーマ一覧 RStudio(ver 1.0.153)のエディタテーマの一覧をご紹介します。 Ambiance Chaos Chrome Clouds Midnight Clouds Cobalt Crimson Editor Dawn Dreamweaver Eclipse Idle Fingers Katzenmilch Kr […]
  • R言語 CRAN Task ViewsR言語 CRAN Task Views CRANに登録されているパッケージ数は膨大です。そこで、いくつかのグループにパッケージを分類し整理されたCRAN Tack Views というサイトがあります。ここでは、英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Bayesian(日本語訳) Bayesian […]
  • R実装と解説 母平均の検定(母分散未知) [latexpage] 母分散が未知の場合の母平均の検定とは、母集団が正規分布に従い、母分散が未知のときに母平均が標本平均と「異なる」または「大きい」、「小さい」かどうかを、検定統計量がt分布に従うことを利用して検定します。 統計的検定の流れ 検定の大まかな流れを確認しておきます。 帰無仮説H0と対立仮設H1をたてます […]
Ubuntu 日本語形態素解析システムJUMANのインストール方法