« 2007年03月 | メイン | 2007年05月 »

2007年04月 アーカイブ

2007年04月02日

移転しました

polog.orgに引っ越したばかりですが、pologは移転しました
既にコンテンツは移動済みです。
リンクの張り替え等、宜しくお願いします。

続きを読む "移転しました" »

2007年04月05日

Google Notepad

残業続きでへろへろしているとGoogle Japanへ行って来てた人がおみやげをくれた。

Google NotepadとGoogle Pen。僕は今日からこれでGoogle Diaryを付けようと思う。

2007年04月06日

青山の通り

そう言う訳で僕は青山に努めているのだけれど、青山の通りと言うものは実に色々な人が通る。その多くは神宮球場に外苑前駅から向かうヒレカツ弁当を抱えたヤクルトファンであり、桜を撃ち落とすみぞれを忌々しげに見上げる170cm以上身長のある痩せた女性や、注意深くデザインされたメガネをかけて一心不乱に自分の靴ひもを結び直すアルマーニを着た男と言った表参道的な人達はなかなか少ない。僕がなぜこんなに青山の通りについて詳しいのかと言うと、これは喫煙スペースが社内に無いからで、雨が降ろうが雪が降ろうが僕は外のコンビ二の前の灰皿で一服しなければならないのだ。そうすると自然と目の前を雑多な人々が阿呆面して通る訳である。酷く楽しくてくっくっと笑ってしまう。でもそうした自己言及的な笑いに昇華出来ないような人物が時たま通る訳で、そう言う人に限って僕の目の前の灰皿を奪取しようとダッシュするのだ。うふふ。今日のそいつは小太りの女性で、HD-25で東京の通り 23:59 REMIX / Shing02を大音量でかけている僕の目の前で悠々と煙草を取り出すと、一目でDUNHILLと分かるライターで火を点けた。僕のライターはCOLIBLIである。ううん、すげえ、かっこいい。その頭にはHD-25の2^20乗(1048576)倍ぐらいごついヘッドフォンを乗っけていて、ライターはDUNHILLで、リクルートスーツで、小太りの、女性なのだ。なかなか青山の通りと言う奴は、面白いと言えば面白くて、そのようなことを考えている自分がまた面白い。

2007年04月07日

dankogaiの真似クソおもしれええ

http://www.youtube.com/watch?v=L022IsDrTX8

2007年04月09日

crawler / indexer

Webクローラーを作るのは大変な作業だと僕は思う。ちょっとした定型のマークアップランゲージから必要な情報を取得することですら結構面倒なのに、人間が記述した、時たま破綻するような殆ど自然言語ライクなタグのかたまりを、その論理構造を無視する事無く、超高速に、超Massで、やってのける訳だ。そう言うコードを書く人達を僕は尊敬する。
さて先程食後に紅茶を飲みながら、暇だなと思ってpolog.orgのアクセスログを眺めていた。開設後一ヶ月はGoogleやYSTばかりだったが、最近はMSN Live Searchやgoo、livedoor(独自検索エンジンだっけ?)のbotがちょくちょくやってくる。へぇ、とかおおこんな記事が人気なのかとか思いつつDocomoや中部地方の大学(だれ?)のhostの合間に見つけたのがコレ↓

worio.com | Mozilla/5.0 (compatible; worio bot heritrix/1.10.0 +http://worio.com)

コロンビア大のソースコードサーチエンジンらしい。今時pure academicにそんなのやるのかと驚愕。まだオープンベータだが頑張って欲しい。
あと一つ思ったのがblogへのコードの貼付け方。現状は数行のモノでない限り別ファイルだが、これちょっと模索しないと上手い感じに世の中にcommitできないので、そのうちリサーチして良い手法を手に入れようと思う。or 誰か教えろ。

2007年04月10日

www.google.co.jp/hws

昨日の続きと言えば続き。
表題の検索画面からいっぱい人が来るのに気がついた。こんな感じで。hws?なにそのサービス?と思ってちょっとサーベイしてみた。
pota
プレスリリース

pota は、昨年9月に発表したインターネット検索世界最大手の Google Inc.(本社:カリフォルニア州、会長兼最高経営責任者:エリック E. シュミット、以下Google)との業務提携第2弾として実現したもので、Google が提供する Google Apps の“ Start Page” 機能をベースに、Gmail アカウントで利用可能にしたポータルサイトです。

最初いきなり自分のGmailのinboxの中身が表示されてうわXSS!?と思ったけど、すごいね、これ。
Sleipnirは一時期セカンダリブラウザにしていたWEBブラウザで、凄い量の機能がデフォルトで入っていた優れものだ。1.xの作成に使ってたPCが盗難->2.0立ち上げの為に会社設立ってとこまではフォローしてたが、Macにswitchしたお陰でその先は知らなかった。気がついたらGoogle Inc.と提携なんて話に。カッコイイなあ。うちへのReferer見る限りコアなファンも多いみたいだし、Firefoxに負けずに一定のシェアを保持して欲しいと素直に願う。
うーん、中村君はどう思う?

ヒろゆき (MSN) 23:23 poportal -> pota

な、なんだってー!?

2007年04月12日

Facebook登録してみた

スゲー色々な所で成功したWeb2.0企業として名前を聞くSNSのFacebookに登録してみた。
invitationを待つ必要は無く、Gmailのアドレスから普通に登録して終了。登録作業自体は特にいろいろ聞かれる事も無い。一瞬。
その後適当に個人情報を入力して、友達探しの開始。これがなかなか奮っていて、ぱっと見3通りのやり方があったので紹介する。
1. 普通に検索
emailアドレスとかから検索。普通。
2. Web mailのアドレスブックから検索
ヤバいのがこれ。いきなりパスワード入力画面が出て来て、入力すると勝手にGmailのアドレスブックを取得して来て全員分検索してくれた。心理的にはちょっとイヤだがこれはかなり便利。ちなみに一人もヒットしなかった笑
3. 高校・大学・企業から検索
逆の意味でヤバいのがこれ。例えば大学のemailアドレスを入力するとその大学に所属している人のネットワークに組み込まれ、さらにその中からLinkageを作成する人を選べる。まあmixiで言うコミュニティみたいなものなんだけど、実用上の問題はValidなアドレスじゃないとマズいと言う事。ご存知の通り僕は卒業してしまっているため、Validなアドレスと言うものを持っていない。恐らく海外の大学は通常卒業生用のアカウントを割と敷居の低い形で用意しているんだろう。しっかりしてよ、Keio Univ. 年間数千円とかダルくて払えん。
まあとにかくFaceBookは元々大学内ネットワークを密に構築するSNSとして発展して来た歴史があるため、こう言ったややこしい手続きを経る事で情報の有用性を上げようと努力しているんだろう。

と言う訳でイマイチ使いこなせていない感じですが、全体的なinterfaceは超好印象。私的には顔写真のサムネイルを作成する時に、ドラッグでどの辺切り出すか選べたりする点とか、痒い所に手が届く感じが最高です。その辺なあ、と。

そう言う訳でもしaccount持ってる人がいたらねぎぽを登録して下さい。ちょうさみしい。

2007年04月15日

Nintendo DS Liteと2ch

今日はやんごと無き理由により、DSを買いにボケの地元秋葉原へ。天下の秋葉なら売ってるだろーと適当に散策するも、2時間かけて結果はゼロ。「ねぎぽの変態的検索能力で売ってる所探してよ」と言うことで、カフェりながら変態的検索能力の権化とも言えよう2chに頼ること1時間ちょっと。で、精査した結果亀有駅の付近にあるイトーヨーカドーに行く事になり、マジ半信半疑のまま売り場に付くと山と積んでありましたDS。スーパーラッキー。早速「まだ売ってたよ」的情報を該当スレッドに還元。
と言う訳で今回のエントリーの骨子は2ch的な情報の流通速度と確度ってやっぱり結構バカにできないよねって話なんですが、最近就職関係で2chを行き来し始めたボケのにちゃんねらに対する信頼感が結構オーバーヒート気味で、今回の件のおかげでハマっちゃった結果「ニュー即のあのコテまじうぜえんだけど」とか言い出さないかとすげえ不安ってのが助けて助けて。

バカ過ぎるExtension

中止ボタンがしいたけに見えて困る
これはひどいw
FirebugとWeb Developer Toolkitしか入ってないうちの趣味マシンのFirefoxにも即挿れw

(via にたまごほうれん草)

2007年04月16日

使用済みのアルミ ホイルですてきな帽子を作ることができる。

Gmailのゴミ箱フォルダのヘッダーにはリサイクルに関するtipsのようなものが表示されるのだが、これはひどい。
と言う訳でコトノハに登録した。
コトノハってこう言うときのためにあるよね。なんとなく緩い感じがすごく好きだな。

2007年04月18日

冨田教授と曽我教授、文部科学大臣表彰科学技術賞受賞

ニュースリリース
ノーベル賞は多分無理だから、文部大臣科学賞を取りたい、と言う酷く具体的な着地点が小さい頃の夢だった。とみーは「みなさんの力と実績のおかげで、今回の受賞があったのです。みんなで受賞したのです」と発言していたらしくて、なんだか夢がちょっとだけ叶った気がして感動した。

tail -f

tail -fは今だと一日に5回ぐらい使ってるコマンドだけれど、冨田研時代は使った覚えが無かったのでなんとなく共有。

参考

要するにlogとかをwindow出しっぱなしでずっとモニターする時とかに使う。冨田研でも進行状況の把握とかの用途で比較的有用なはず。え、知らなかったの僕だけ?

2007年04月19日

Regexp::Assemble

スーパー便利。
cpan
要は正規表現の最適化。
こういうコード生成・最適化的なモジュールは何かにつけ重要だよね。コードを出力するコードを利用。でもRailsとか使ってるとDRYすぎてオレすげー感がうすまるのも事実。
まあ一番重要なのはサービスの中身っすよ。

(via 404 Blog Not Found)

2007年04月22日

wikipediaのパーサを書いている

ページ毎に必要な箇所、情報の形式が違うので毎ページ全部書き直してるんだけど、長年の研鑽のためか(だって5年間パーサ書いてたようなもんだもんな)1ページあたり実装に10分かからないのは良いとして、


  • start trigger

  • どの行から読み込み始めるか
  • end trigger

  • どの行で読み込み終えるか
  • regexp

  • どういう正規表現でオブジェクトを取得するか

だけで一応汎用化出来る気がした。最後の正規表現がミソで、上手くすれば一行に複数の取得したいオブジェクトがあっても配列化が行える筈、なんだけどどうすりゃいいのかね。
例えば
食文化に関する用語の一覧
だったら
<p><a href="/wiki/%E8%96%AC%E5%91%B3" title="薬味">薬味</a> <a href="/wiki/%E8%96%AC%E7%BC%B6" title="薬缶">やかん</a> <a href="/wiki/%E9%A3%B2%E8%8C%B6" title="飲茶">飲茶</a> <a href="/wiki/%E6%9C%89%E6%A9%9F%E8%BE%B2%E7%94%A3%E7%89%A9" title="有機農産物">有機農産物</a></p>

から
qw(薬味 やかん 飲茶 有機農産物)
のリストを取得するregexpが欲しい訳だ。当然欲しいオブジェクトの数は各行毎に可変である。
普段の僕だったら堅実にm%^<p>(.+?)</p>$%した上でs%</?a.*?>%%g;してsplit /¥s/なんだけど、一行で書くとしたら
@arr = $line =~ m%<p>(?:<a.*?>(.+?)</a>\s?)+</p>%
こうか?
うーん最後のマッチしか返してくれないなあ。どうやるんだろ。
逃げるんならregexp triggerとしてm%^<p>(.+?)</p>$%してregexpはwhile($line =~ m%<a.*?>(.+?)</a>\s?%){ ... }かな。

2007年04月23日

pretty print test

google-code-prettyfyを入れてみたのでテスト。
内容はeXpandaのサンプルスクリプト。

#!/usr/bin/perl
use warnings;
use strict;
use eXpanda;


# eXpanda Demo Script No 8
# "Visualizing Social network."

my $str = do 'sns_net.str';
bless $str, 'eXpanda';

### Analysis ####
$str->Analyze(
-method =>"degree",
);

### Initialize graphics ####
$str->Apply(
-object => 'node:graohics:fill',
-value => '#d39800',
);

$str->Apply(
-object => 'node:graohics:w',
-value => '15',
);

$str->Apply(
-object => 'edge:graohics:stroke',
-value => '#c3d825',
);

$str->Apply(
-object => 'edge:graohics:width-stroke',
-value => '#c3d825',
);

### Apply Score to Graohics ###
$str->Apply(
-object => 'node:graohics:fill',
-from => 'node:score:degree',
-value => {'#f39800' => '#e2041b'},
);

$str->Apply(
-object => 'node:graohics:w',
-from => 'node:score:degree',
-value => {'15' => '40'},
);

### Output ###
$str->out("sample08.svg",-no_node_label=>1,);

まるごとYAPC

ブックマークしなかったのでどこだか失念したけれど、「飛行機の移動時間は割と長大な講演を聞くのに良い」と書いている人がいたので、そういやYAPCの動画すげー勢いでアップされてたし電車の中とかで見たら勉強になるんじゃね、と思って全部download->iPod用に変換するスクリプトを書いてみた。
OS X前提。
前もってMiMMS(ストリーミングビデオダウンローダ)とffmpeg(エンコーダ)をインストールする必要がある。
んで


#!/usr/bin/perl

use strict;
use LWP::Simple;

my $url_base = 'http://www.i-revo.jp/yapcasia/archive/';

for my $num (1..43){
my $html_num = sprintf "%02d", $num;
my $html_content = get($url_base . $html_num . '.html');
my @wvx = $html_content =‾ m%param name="filename" value="(http://.+?.wvx)"%;
next if ($wvx[0] eq '');
my $wvx_content = get($wvx[0]);
my @wmv = $wvx_content =‾ m%ref href = "(mms://.+?.wmv)"%;
`mimms -o YAPC-$html_num.wmv $wmv[0]`;
`ffmpeg -y -i "YAPC-$html_num.wmv" -title "YAPC-$html_num" -bitexact -vcodec mpeg4 -s 320x240 -r 29.97 -b 768 -acodec aac -ac 2 -ar 48000 -ab 64 -f ipod "YAPC-$html_num.MP4"`
}


一気に書いて動かしてみたはいいけど手元のffmpeg、wmv3からのコンバート出来ないんだよね。
めんどくなってきた。

(追記)
iSquintの最新バージョンならwmv3通るらしいからもうそれでいいやー。今晩はダウンロードしっぱなしで寝ようっと。

(さらに追記)
"つhttp://tokyo2007.yapcasia.org/sessions/videocast.xml"って言われた><

Nielsen//NetRatingsの調査は実態に即していない?

メディアパブの記事
うーむ。
日本法人についてはRDD法で抽出した法人/一般家庭にツールバーをインストールさせる方式だったはずなので、少なくともAlexaの統計よりは信用がおけると個人的に思う。にしてもネット視聴率って結構注目度高いんだねえ。

2007年04月25日

自動ログインを可能にするGreasemonkey

Facebookなんかもそうだけど、意外と自動ログインを行ってくれないサイトは多い。セキュリティだったり最大ユーザ数の利便性だったり色々理由はあると思うが、個人的に我慢出来ない場合もある。
例えば職場のスケジューラ。毎日ログインするのに、クリックをしなければならないのは純粋な無駄に思える。
そんな訳でお昼休みにはじめてGreasemonkeyと言うものを書いてみた。


// ==UserScript==
// @name Utilities for Hoge
// @description Make Scheduler more convinient.
// @namespace http://polog.org/
// @include http://hoge.com/hoge.cgi
// ==/UserScript==
// based on http://blog.livedoor.jp/hakin/archives/50674506.html

(function(){
var w = (typeof unsafeWindow == 'undefined') ? window : unsafeWindow;
var onload = w.onload;
w.onload = function(){
onload();
document.getElementsByName("Hoge").item(0).click();
}
})();


見ての通り優秀な人のGreasemonkeyをコピペしてname="hoge"なボタンをクリックする1行のコードをonloadで呼んでるだけ。http://hoge.com/hoge.cgiとgetElementsByName("Hoge")を適当に変えればどんなサイトにも対応出来るはず。

続きを読む "自動ログインを可能にするGreasemonkey" »

2007年04月27日

FC2のトラフィックがすごいことに

ALEXAのトラフィック世界ランキング
Mixiとの比較
Mixiの51位はいいとして、なぜかFC2が53位にランクインしてる。世界的に見るとGoogleカナダとかAOLより、日本だと楽天やライブドアよりも上。これはすごい。

FC2のサービスと言うとblog以外はちょっと思いつかない。今月初めに出たTechnoratiの"世界中のblogで最も記述されている言語は日本語"と言う調査は記憶に新しいが、トラフィックデータもそれをサポートしているんだなあと。FC2はアダルト関係のブログが結構多いように思うので、その辺が要因かな。
あーびっくりした。

2007年04月30日

まさに集合知

有名人身長推定サイト SETAKE
あたまいい。全く同じメソッドでなんでもできるな。思いついたらやる。

Powered by
Movable Type 3.34