Ubuntuでmecabのインストールがうまくいかない
目次
この記事で書くこと
Ubutnでmecabをaptインストール
Qiita記事にも紹介されているが、aptで3行のコマンドでインストールが完了する。
で、mecabは動作するのだが、ここで問題が発生する。
それは「辞書ディレクトリパスはどこ?」という問題だ。
この問題はmecab-juman辞書やmecab-neologdを使いたいときに問題になる。
mecab-configを打ち込んでみると、存在しないパスを返す。
1 2 3 4 |
$ mecab-config --dicdir /usr/lib/x86_64-linux-gnu/mecab/dic $ ls /usr/lib/x86_64-linux-gnu/mecab/dic ls: cannot access '/usr/lib/x86_64-linux-gnu/mecab/dic': No such file or directory |
じゃあ、辞書はどこにあるのか?
辞書ディレクトリを探してみる。
1 2 3 4 5 6 7 8 9 10 11 |
$ find / -name "mecab*" | less 省略 /usr/share/doc/mecab/mecab_8h.html /usr/share/doc/mecab-ipadic-utf8 /usr/share/doc/mecab-utils /usr/share/doc/mecab-ipadic /usr/share/doc/mecab-jumandic /usr/share/doc/mecab-jumandic-utf8 /var/lib/mecab 省略 |
/usr/share/doc/ にあるらしい。でも、この中身を覗いてみると・・・実は辞書ファイルの実体が存在しない!
おそらくaptで辞書をインストールするときになにか問題があるのだろう。
じゃあ、どうするのか? ソースからコンパイル!
結局のところ、ソースからインストールするのが一番はやい。参考Qiita記事。
これで問題なく使えるようになった。
ちなみに・・・
私が公開しているpythonパッケージJapaneseTokenizerでは、こんな操作ができる。
例えば・・・mecab-configパスが環境変数から参照できない場合
1 |
mecab_wrapper = MecabWrapper(dictType='ipadic', path_mecab_config='/opt/mecab/bin') |
例えば・・・辞書パスが環境変数から参照できない場合
1 |
mecab_wrapper = MecabWrapper(dictType='ipadic', path_dictionary='[辞書パス]') |
ディスカッション
コメント一覧
まだ、コメントがありません