buntu14.04で日本語形態素解析システムJUMANのインストール方法をお伝えする。
JUMAN単体では次のコマンドで簡単にインストールできる。


$ sudo apt-get install juman

しかし、この方法では、日本語構文・格・照応解析システムKNPのインストール時にjuman.hが見つからないと言われてKNPがインストールできないため、KNPも合わせてインストールする場合は、ソースからインストールする必要がある。

そのため、以下はソースからインストールする方法である。

まずはJUMAN – KUROHASHI-KAWAHARA LABより最新のJUMANをダウンロードしておく。
今回はJUMAN Ver.7.01をダウンロードした。
ダウンロードしたあと、端末を開いてダウンロードしたディレクトリに移動しておく。
あとは、次のコマンドを順に実行すればインストールは完了する。


# tar.bz2の解凍
$ bzip2 -dc juman-7.01.tar.bz2 | tar xvf -

# カレントディレクトリの移動
$ cd juman-7.01/

# JUMANのインストール
$ ./configure
$ make
$ sudo make install

これでインストールは完了したが、パスが通っていないため、このままではjumanコマンドは使えない。
ここでは全ユーザーが共通して使えるように設定しておく。
まずは次のファイルを開く。


$ sudo vim /etc/ld.so.conf

開いたファイルに次を追加したあと、保存して閉じる。


include /usr/local/lib

これで、パスの設定が終わったので、パスを読み込み直す。


# パスを読み込み直す
$ sudo ldconfig

実際に、パスが通っているか確認するためバージョンを出力してみる


$ juman -v

juman 7.01

最後に、簡単にJUMANを試してみる。


$ echo "今日は晴れです。" | juman

今日 きょう 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/きょう カテゴリ:時間"
@ 今日 こんにち 今日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:今日/こんにち カテゴリ:時間"
は は は 助詞 9 副助詞 2 * 0 * 0 NIL
晴れ はれ 晴れる 動詞 2 * 0 母音動詞 1 基本連用形 8 "代表表記:晴れる/はれる 自他動詞:他:晴らす/はらす 反義:動詞:曇る/くもる"
です です だ 判定詞 4 * 0 判定詞 25 デス列基本形 27 NIL
。 。 。 特殊 1 句点 1 * 0 * 0 NIL
EOS

関連する記事

  • R言語 CRAN Task View:ケモメトリックスと計算物理学R言語 CRAN Task View:ケモメトリックスと計算物理学 CRAN Task View: Chemometrics and Computational Physicsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Katharine Mullen Contact: katharine.mullen at […]
  • R言語 CRAN Task View:自然言語処理R言語 CRAN Task View:自然言語処理 CRAN Task View: Natural Language Processingの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Fridolin Wild, Performance Augmentation Lab (PAL), Oxford Brookes University, […]
  • Ubuntu16.04でElectronの配布アプリケーションを作成する方法Ubuntu16.04でElectronの配布アプリケーションを作成する方法 Ubuntu16.04を用いて開発したElectronアプリケーションを配布に適したファイル群で出力する方法をお伝えします。 ここでは、サンプルアプリケーションとして、electron-quick-startを利用させていただき、配布のための環境構築からWindows用アプリケーションとして実行しているところまでをご紹介します。 環境 今回の作業環境を確認し […]
  • R言語 CRAN Task View:経験的ファイナンスR言語 CRAN Task View:経験的ファイナンス CRAN Task View: Empirical Financeの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Dirk Eddelbuettel Contact: Dirk.Eddelbuettel at […]
  • R ggpartyパッケージを用いた決定木の可視化R ggpartyパッケージを用いた決定木の可視化 決定木の可視化において、とても柔軟性が高いggpartyパッケージをご紹介します。 ggpartyパッケージは、ggplot2の機能をpartykitに拡張し、partyクラスのツリーオブジェクトのために明瞭に構造化され、高度にカスタマイズ可能なビジュアライゼーションを作成するために必要なツールを提供します。 ggpartyパッケージを用いると、ノードやエッジに対 […]
Ubuntu 日本語形態素解析システムJUMANのインストール方法