« 亀有教会 | main | バロウズカットアップprogress »

polog cloud

polog cloud
ゴミが取りきれてませんがもう飽きた。

エクスポートしたファイルから本文だけパースして、Text::MeCabで形態素解析、さらに名詞だけ取り出してHTML::TagCloudでタグクラウド化。多分これ系をやってる人たちと大体手法は同じ筈。
MeCabよりエンコード関係で難儀したなあ。日本語を触るPerlを書いたのはほぼ初めてなので。
エロ系ワードが多いのは当然として、"Д"がでか過ぎてワラタ。

(追記)
こいつのせいか!笑
以下メモ。
これで分詞マルコフ作ってバロウズ完成〜ってやりたかったんだけど、モデル自体は有向グラフだしhierarchicに可視化したら新しい文脈可視化で面白いかな。と思ったけど絶対もう誰かやってる。

トラックバック

このエントリーのトラックバックURL:
http://polog.org/mt-tb.cgi/268

コメント (4)

ちょうおもしろい.
ちょうひまだなおまえ.

俺今日の一限の授業で単位くること確認してきた.
メールしたらいいらしいよ.

うーん暇っつうか学生のうちにちょっと触っておきたかったんだ。

清水先生にメールした。単位来てくれるといいんだけど。。

>MeCabよりエンコード関係で難儀したなあ

たしかに、Encodeは流儀みたいなもんがありますからね。。僕も相当悩まされた覚えがあります。

狂人日記のみを対象にすればよりバロウズっぽくなるかと思います。バロウズの本買ってみたんですが、大変です。発狂しそうです。

ああ確かに、いいこと言うたね
バロウズ読みたいけど自分で買いたいな。今度感想きかせてくれ

コメントを投稿

Powered by
Movable Type 3.34