すごいです。
ただ、そのままだと500エラーが出たので
sub page_list{
の直前に
print "Content-type: text/html\n\nOK.\n"; exit(1);
を入れて以下を無効にしたら何とか動いてるみたいです。
あっちこっち閲覧してみたのですが
拡張子だけではなく
http://imepita.jp/
http://pita.st
http://pic.to
http://new.cx
や
htmlにjpgを埋め込む所とかも取得出来たらいいなとか思ったです。
取得出来なくても、URL抽出とか。