たけっぱ横丁

the technical document for Vim(Editor), Natural Language Proecssing(NLP) tools and Programming(Python, Ruby, C++ etc).

Python

Python3対応のMeCab(using subprocess)

Python3対応のMeCab 言語処理をされているかたならば,ご存知のMeCabですが 公式で配布されているパッケージがPython3に対応していなくて困ったことになります. 以下の記事では, python2のパッケージをpython3用に書きなおして pipで配布されているようです.…

pyenv+virtualenvでPythonの仮想環境を作る

Pythonでの開発と仮想環境 開発者ならば至極当然のように使っている仮想環境. この記事では,なぜ仮想環境を利用するのかを始めとして, Pythonでの仮想開発環境を導入まで述べたいと思います. なぜ仮想環境なのか 簡潔に言うと, こっちのマシンでは動いたけ…

Pythonで末尾再帰最適化

末尾再帰最適化 Pythonでは本来, 末尾再帰最適化は行われないのですが デコレータを使うことによって一発で末尾再帰化を行ってくれるようになります. 今日は,そんな末尾再帰最適化について紹介します. 末尾再帰 そもそも末尾再帰ってなんだろう ってことで…

言語処理のための例外処理

経緯 私,自然言語処理に携わる研究を行っているのですが 必然と大規模なテキストデータを扱います. (恐らく大半の言語処理のプログラムを書いている方に訪れるであろう)鬼門が どれだけ網羅しようともテキストデータに例外が存在する ということです. 自然…

PythonでGram-Schmidt(グラム-シュミット)正規直交化をする

pythonはC/C++と違って 何やるにしても十分にツールが充実しているのがすばらしいですね ということで、今日はpythonでGram-Schmidt正規直交化を紹介します! 正規直交化っていうのは、いくつかのベクトル列から 正規直交(大きさ1, 直交なベクトルの内積は必…