ちょっと前にUSAの歴代大統領のスピーチをタグクラウド化したサイトがあったが、日本の首相でやるのは面倒だろうなあ形態素解析がいるだろうし、大体データどっかにあるんだろうか。などと考えていたら早速出来ていた。ツールとしてはMecab、プログラミングインターフェースとしてPerl/Text::MeCab、他にHTML::Treebuilder、HTML::TagCloudらしい。ああ確かに公開データはあるんだな。
このテクノロジは面白い。
マッシュアップとしてInternet Archiveと組み合わせたらもっと面白いんじゃないか。