pythonのインストール
% sudo aptitude install python2.7 % sudo aptitude install python3 % sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 2 % sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 1
Python3を選ぶ
% sudo update-alternatives --config python
Python3用のpipのインストール
% sudo aptitude install python3-pip
NLTKのインストール
installing NLTKに従いインストールする。
% sudo pip install --upgrade pip % sudo pip install -U nltk % sudo pip install -U numpy % sudo pip install -U bs4
MeCabのインストール
パッケージでインストールする。
% sudo apt-get install mecab libmecab-dev mecab-ipadic % sudo apt-get install mecab-ipadic-utf8 % sudo pip install mecab-python3
確かめる
% python
Python 3.5.2 (default, Nov 17 2016, 17:05:23)
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import MeCab
>>> mecab = MeCab.Tagger("-Ochasen")
>>> print(mecab.parse("今日の天気は晴れです。"))
今日 キョウ 今日 名詞-副詞可能
の ノ の 助詞-連体化
天気 テンキ 天気 名詞-一般
は ハ は 助詞-係助詞
晴れ ハレ 晴れ 名詞-一般
です デス です 助動詞 特殊・デス 基本形
。 。 。 記号-句点
EOS
>>>
cabochaのインストール
CRF++: Yet Another CRF toolkitからダウンロードしてコンパイルする。
% tar xvfz CRF++-0.58.tar.gz % cd CRF++-0.58 % ./configure |& tee configure.log % make |& tee make.log % sudo make install % sudo ldconfig
CaoboCha: Yet Another Japanese Dependency Structure Analyzerからダウンロードしてコンパイルする。
% tar xvfj cabocha-0.69.tar.bz2 % cd cabocha-0.69 % ./configure --with-charset=UTF8 | & tee configure.log % make |& tee make.log % sudo make install % cd python % sudo python setup.py build_ext % sudo python setup.py install % sudo ldconfig
動作を確かめる。
% python
Python 3.5.2 (default, Nov 17 2016, 17:05:23)
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import CaboCha
>>> c = CaboCha.Parser()
>>> print(c.parseToString(sent))
国境の---D
長い-D
トンネルを-D
抜けると-D
雪国であった。-----D
夜の-D |
底が-D
白くなった。-----D
信号所に---D
汽車が-D
止まった。
EOS