python-mecabで名詞のみを抽出する 0



下記のような関数を実装しようとしたものの、
scriptっぽく走らせようとしたら失敗しました。

via NAL研卒業研究ノート:: 名詞の抽出.



いろいろ調べた結果、encodingに問題があって、pythonはunicodeで日本語を扱うことが多くて
unicode関数を使って変換してからじゃないとErrorが起きやすいとのことでした。

unicode関数は以下のように使います。

via PythonにおけるUnicodeとUTF-8の相互変換 – CtrlShift.net.

なので、実際に書いたのが下記のコード。

file読み込みのすぐ後にunicodeに変換、
また、printする直前もunicodeに変換。
これにより、文字の型の違いによるErrorを避けました。

とかって打って使います。

Thank you for reading the article! Please do either share the post or click ads on this site, which will be greate help for me. Thanks in advance!

読んでいただきありがとうございました。役に立った!と思った方は記事をシェアするか、
広告をクリックして投げ銭していただけると大変助かります。
収益はサーバー維持費に充てたいと思います。


Leave a Reply

Your email address will not be published. Required fields are marked *