#13-01 sponsored page
web をぐるぐるしていると、広告が貼ってあるページがある。クリック(?)すると飛んでいく例のアレだ。
広告収入によって運営しているんだろうがヲレにとっては広告画像は帯域浪費以外のナニモノでもない。
いくら専用線でつながってても重いし。Animated GIF とかになってるとデカいしね。で、画像オフにして
いるわけだが、そういうページに限って ALT がしっかりしていない。ま、そんなことをいっても無駄だ
とあきらめたけど。問題は更新時刻だ。
鮮度が重要な情報系のページこそ Last-modified で更新時刻を取得できるようにするべきなのだが、 なかなか取れるところがない。ここを見てるかどうかは知らないが、biztech は更新時刻が正確に取れる ようになった。まだ疑わしいが…。なんにせよ更新時刻がわかるのは嬉しいものだ。
更新時刻がわからないページが更新されたかどうかを、なんとかして判別できないか、と考えられたのが 「サイズ増減による変化」だ。これはけっこうアテになる。ただ、HEAD リクエストでサイズ (Content-length)が得られないページはページ全部を読み込んでサイズを取得しなければならないので 時間がかかる。Last-modified が得られないので、たいてい Content-length も得られない。
ここで問題が。有名ドコロに広告を出している企業は一度に表示しきれないほどあるので、読むたびに 画像とリンクが変わるようなシカケがしてあるページがほとんどだ。Pragma: no-cache されてる某ページもその対策なんだろうが、キャッシュを 無視するので重くてイライラするんだよな〜。これらのページは URL が変化するので読み込むたびに ページのサイズが変化する。こうなるともうお手上げだ。
ページ内に更新時刻が記述してあるページでは、時刻文字列の変化から更新されたかどうかを判別する 方法もある。しかしこの方法をサポートしている更新時刻チェッカは Windows や Macintoch にはほとんどない。サポートするなら今だ!!>WWWC