Visitors, a fast web log analyzer

http://www.hping.org/visitors/
高速なapache log analyzer。公式には

No installation required, can process up to 150,000 lines of log entries per second in fast computers (20MB/s with my log files average length).

と、一秒で150,000行さばけるとうたっている。うちの環境で実際に10万行ほどのログを食わせたところ1秒ちょいと非常に高速にさばけた。出力ではhtml(サンプル)だけならずテキスト(サンプル)も選べる。
ログアナライザとして必要な機能は一通りそろってるし、Googleからの検索キーワードも表示できてGood。日本語検索ワードだとeuc-jpやsjisutf-8だったりするのでnkfをかまして全部utf-8化したところばっちりそう。
なおかつ設定ファイルいらずのシンプルさが魅力。バーチャルホストで個別にログを切り分けてるんだけど、たいていのログアナライザはめんどうな設定があったする。しかしvisitorsならコマンドライン一行。素晴らしい。

visitors -A -m 100 /home/gorou/rails/map/log/lighttpd.access.log \
 | nkf -w -m0 > /home/gorou/public_rails2u/auth_area/visitors/map.html

として利用中。

かってにはてマ調査

ちょこっと位置移動するとキーワードやfotolifeの吹き出しが消えたり出現したり。なんなんだろーなと思ってはてマのjsソース読んだら、removeOverlayで消してるのかな。なんかもったいないな。
んではてマはxml over http(RESTのGETというべきなのかな?)でxml取得してそれをresponseXMLでDOMDocumentを取得しパースしてるのね。で、10件の制限かけてるので情報が集まってるところは地図を拡大してもうまく吹き出しがしなかったりするわけかー。もっと富豪的に30ぐらい取得(できればマップ描画部だけじゃなくて見えない周りも範囲に含めてがつんと)しちゃっても良さそうなんだけど、DBの負荷考えると妥当なのかもね。現在ベータテスト中だろうしそこら辺はそのうち適正値に改善されそう。
んでこれ、外部からももちろん取得できちゃうわけで、最速インターフェース研究会 :: Amazon最速検索を作ってみたの技術を使えばはてな外部のGoogleAPIつかったサービスでもkeywordやfotlifeのデータ取得してマッピングできそうなんだけど。楽しそうなんだけど。でもふつーに考えたらやっちゃマズイですよねぇ?(>ハテナオヤん)
将来的にAPIが用意されたら日本のwhere2.0によるmap remixが面白くなりそうなので期待!!!

php 5.1の対話型コマンドラインインターフェイス

X *ole.net : PHPの対話モードより。Rubyでいうirbつーとわかりやすいけど。関数や定義済み変数、オブジェクトのtab補完、Ctrl-Rでのインクリメンタル履歴サーチなど必要な機能は一通りそろってる。うわー超便利。
手元の環境だとphp 5.0.4のcliじゃだめで5.1 betaのcliならphp -aで対話モードに入れた。5.0.xじゃ対応してねーのかなー。