Ubuntu14.04環境で、Python3と日本語構文・格・照応解析システムKNPを用いて係る語と受ける語のペアを抽出する方法をご紹介する。 係り受け構造を抽出するPython3のソースコードは次である。 from p
Ubuntu 日本語構文・格・照応解析システムKNPをpythonから使えるようにする
Ubuntu14.04で日本語構文・格・照応解析システムKNPをpythonから使えるようにする方法をお伝えする。 Python2系 まずはKNP – KUROHASHI-KAWAHARA LABよりpykn
Ubuntu 日本語構文・格・照応解析システムKNPのインストール方法
Ubuntu14.04で日本語構文・格・照応解析システムKNPのインストール方法をお伝えする。 あらかじめ、JUMANをインストールしておく(参照「Ubuntu 日本語形態素解析システムJUMANのインストール方法」)。
Ubuntu 日本語形態素解析システムJUMANのインストール方法
buntu14.04で日本語形態素解析システムJUMANのインストール方法をお伝えする。 JUMAN単体では次のコマンドで簡単にインストールできる。 $ sudo apt-get install juman しかし、この
matplotlibで箱ひげ図を表示する方法
Python3でmatplotlibを用いて、箱ひげ図を表示する方法をお伝えする。 Ubuntu14.04環境で動作することを確認している。 一つ注意点として、日本語に対応させるために、ここでは「IPAexGothic」
Ubuntu14.04とPython3でMeCabを使う方法
MeCabは各種スクリプト言語(perl、ruby、python、Java)から、各言語バイディングで利用できるようになっている。 しかし、Pythonで用意されているのはPython2系のもので、残念ながらPython
Ubuntu14.04でPython3に対応したmatplotlibを使用するための手順
Ubuntu14.04でPython3に対応したmatplotlibを使用するための手順をご紹介する。 1. matplotlibのインストール Ubuntuには、Python3関係の主要なパッケージが標準のリポジトリに
Wikipediaのデータファイルをプレーンテキストに変換する
Wikipediaのデータファイルをプレーンテキストに変換する方法を備忘記録として記しておく。 Wikipedia日本語版のデータファイルは以下のサイトからダウンロードできる。 ウィキペディア日本語版 Wikipedia
Python CaboChaを用いて係り受け構造を抽出する方法
Pythonと日本語係り受け解析器であるCaboChaを用いて係る語と受ける語のペアを抽出する方法をご紹介する。 環境:Ubuntu14.04 Pythonツールのインストール PythonからCaboChaを扱うために
Ubuntuに日本語係り受け解析器CaboChaをインストールする手順
日本語のテキストデータを解析する際に、係り受けを抽出したいときがある。係り受けを行うことができるフリーのソフトウェアの一つにCaboChaがある。CaboChaは, Support Vector Machinesに基づく