おれさまラボの実験ノート

実際に手を動かして理解を深めるブログ。

Webサイトの記事がいつ作成されたのか調べる方法

はじめに

ちょっと気になったので調べてみました。

更新日時を確認する

ブログなんかだと作成日と更新日時が表示されていたりするのでわかりやすいですね。

f:id:naoto408:20200222235124p:plain

URLの確認

URLが日付になっているものもわかりやすいですね。

f:id:naoto408:20200222235304p:plain

JavaScript

デバッグモード(ブラウザでF12押下)のコンソールで以下のJavaScriptを実行すると、HTMLファイルがいつ更新されたのかわかります。

alert(document.lastModified);

ただ、ほぼほぼ正しい数値は返ってこないです。

  • ファイルが更新された日なので作成日とは一致しない
  • PHPなどの動的ページの場合、現在の時刻が返ってきてしまう
  • 静的ファイルでもCDN等を使っている場合は、エッジサーバのファイル情報が返ってきてしまう

Internet Archive

個人的にはこれが一番しっくりきました。

Internet Archiveアメリカの非営利組織が運営する電子図書館です。自動でクロールされたデータもあれば、手動で登録されたデータもあるそうです。

archive.org

たとえば、アライドテレシスネットワーク機器講座|スイッチ編というページは、2003年8月4日には少なくとも存在していたことがわかります。

f:id:naoto408:20200222234506p:plain

もちろんこの日が公開日と一致しているかと言われるとそうではないと思いますが、ざっくりとした年月を把握するには十分使える方法だと思いました。

以上