« True Blue / DJ Takumi | main | トリンプ 新作ブラ »

形態素解析

ちょっと前にUSAの歴代大統領のスピーチをタグクラウド化したサイトがあったが、日本の首相でやるのは面倒だろうなあ形態素解析がいるだろうし、大体データどっかにあるんだろうか。などと考えていたら早速出来ていた。ツールとしてはMecab、プログラミングインターフェースとしてPerl/Text::MeCab、他にHTML::Treebuilder、HTML::TagCloudらしい。ああ確かに公開データはあるんだな
このテクノロジは面白い。
マッシュアップとしてInternet Archiveと組み合わせたらもっと面白いんじゃないか。

トラックバック

このエントリーのトラックバックURL:
http://polog.org/mt-tb.cgi/221

コメントを投稿

Powered by
Movable Type 3.34