python-mecabで名詞のみを抽出する 0



下記のような関数を実装しようとしたものの、
scriptっぽく走らせようとしたら失敗しました。

via NAL研卒業研究ノート:: 名詞の抽出.

いろいろ調べた結果、
encodingに問題があって、
pythonはunicodeで日本語を扱うことが多くて
unicode関数を使って変換してからじゃないと
Errorが起きやすいとのことでした。
下記のようにunicode関数を使います。

via PythonにおけるUnicodeとUTF-8の相互変換 – CtrlShift.net.

なので、実際に書いたのが下記のコード。

file読み込みのすぐ後にunicodeに変換、
また、printする直前もunicodeに変換。
これにより、文字の型の違いによるErrorを避けました。

とかって打って使います。

こちらも合わせてどうぞ:

wordpressに「あとで読む」を追加する| TowardSomethingNew

Railsバグ出すぎだ、このやろう[3hours passed…] | TowardSomethingNew


Leave a Reply

Your email address will not be published. Required fields are marked *