polog cloud
ゴミが取りきれてませんがもう飽きた。
エクスポートしたファイルから本文だけパースして、Text::MeCabで形態素解析、さらに名詞だけ取り出してHTML::TagCloudでタグクラウド化。多分これ系をやってる人たちと大体手法は同じ筈。
MeCabよりエンコード関係で難儀したなあ。日本語を触るPerlを書いたのはほぼ初めてなので。
エロ系ワードが多いのは当然として、"Д"がでか過ぎてワラタ。
(追記)
こいつのせいか!笑
以下メモ。
これで分詞マルコフ作ってバロウズ完成〜ってやりたかったんだけど、モデル自体は有向グラフだしhierarchicに可視化したら新しい文脈可視化で面白いかな。と思ったけど絶対もう誰かやってる。
コメント (4)
ちょうおもしろい.
ちょうひまだなおまえ.
俺今日の一限の授業で単位くること確認してきた.
メールしたらいいらしいよ.
投稿者: NZM | 2007年01月22日 12:18
うーん暇っつうか学生のうちにちょっと触っておきたかったんだ。
清水先生にメールした。単位来てくれるといいんだけど。。
投稿者: negipo | 2007年01月22日 16:15
>MeCabよりエンコード関係で難儀したなあ
たしかに、Encodeは流儀みたいなもんがありますからね。。僕も相当悩まされた覚えがあります。
狂人日記のみを対象にすればよりバロウズっぽくなるかと思います。バロウズの本買ってみたんですが、大変です。発狂しそうです。
投稿者: hiroyuki | 2007年01月23日 00:16
ああ確かに、いいこと言うたね
バロウズ読みたいけど自分で買いたいな。今度感想きかせてくれ
投稿者: negipo | 2007年01月23日 06:11