「なんでも、すぐ消す中野区」のアーカイブあります

「なんでも、すぐ消す中野区」のアーカイブあります

中野区は公式サイト内の大切なお知らせや資料を期限が過ぎると全部消してしまいます。それどころか、2018年10月10日には「平和の森公園再整備(第2工区)について意見を募集します」というページを期限がまだ過ぎていないのに消すという事件があり、ネットで炎上していました。

ところで、消えたウェブページは The Internet Archive - Wayback Machine を使って閲覧できることがあります。以下でそのやり方を紹介します。

(2018年12月23日追記: 本稿の末尾に「アーカイブされたPDFファイルをiPhoneで見るためのヒント」の節を追加しました)
(2019年3月20日修正: 中野区の公式サイトがSSL化されましたのでそれに対応する記述にしました)

追記2022年10月28日: 国立国会図書館Warp で2010年ごろから中野区ホームページが収集されており、区民が中野区に要望したので現在はインターネット公開されています。 warp.da.ndl.go.jp

The Internet Archive - Wayback Machine とは

The Internet Archive は、1996年に設立された非営利団体です(参考: Wikipedia)。

ほとんどの共同体は自分たちの文化や伝統の産物を保存することを重視しています。それがないと、成功や失敗から学ぶための記憶も仕組みもその文明には無いことになるからです。私たちの文化は今、電子資料をどんどん産み出しています。The Internet Archive の使命は、この電子資料の保存を支援し、研究者や歴史家や学者のためのインターネット図書館を構築することです。

The Internet Archive 公式サイトのFAQより引用。和訳は筆者による)

上の引用によると、「なんでも、すぐ消す中野区」は成功や失敗から学ぶための記憶も仕組みも無いが、The Internet Archive が支援してくれるということになりますね。

ありがたいことです。(と思ったかたは、こちらから募金)

非営利団体 The Internet Archive の運営するウェブページが Wayback Machine です。Wayback Machine は世界中のウェブページを不定期に巡回し、そのページを保存します。巡回頻度はウェブページの重要度に基づきますが、一般的には数ヶ月に1回程度です。

[朗報] 中野区公式サイト www.city.tokyo-nakano.lg.jp に関しては、2018年10月23日以降、巡回頻度が1週間に約2回になります!!

Wayback Machine では次のことができます。

  • 昔のウェブページを見たり、資料をダウンロードできる。
  • 消されてしまったウェブページを見たり、資料をダウンロードできる。たとえリンクが分からなくても推測できる。

注意: Wayback Machine によって1回も巡回されないうちにウェブページが消されてしまった場合、そのウェブページを見る手段はありません。残念ですがあきらめましょう。

使い方

URLが判明していて、以前のバージョンのページを閲覧したいとき

Wayback Machine https://archive.org/web/ を開きます。

上の画像の青枠で示した部分に閲覧したい URL(例えば、https://www.city.tokyo-nakano.lg.jp/dept/101500/index.html)を入力します。このときURLとして、長い、正式な形を入力したほうが頻繁に巡回されています。つまり、この例では index.html を省略した https://www.city.tokyo-nakano.lg.jp/dept/101500/ も、さらに末尾の / を省略した https://www.city.tokyo-nakano.lg.jp/dept/101500 も、同一ページを表しますが、.html まで付いているものを入力した方がよいということです。また、2019年2月以前の中野区公式サイトは URL の https の部分が http でしたが、以下の説明ではどちらを入力してもかまいません。

上段の棒グラフのところは横にスクロールできて、クリックすると年が選べます。棒グラフが無い年はそのページには巡回してません。

下段のカレンダーのところで、月日が選べます。上の画像はこの記事を書いた年(2018年)にキャプチャーしたので2018年のカレンダーが表示されており、2018年4月23日に1回と2018年10月23日以降は頻繁に Wayback Machine が巡回しているとわかります。

巡回したことのある日付(例えば、2018年4月23日)をクリックすると、そのときに保存されたウェブページが閲覧できます。

表示されているページ内のリンクもクリックできます。(同じ日に保存されたものが無い場合は別の日に保存されたページが表示されることがあります。)

URLがだいたいわかっていて、消されたページを閲覧したいとき

さきほどの入力窓(3枚上の画像の青枠)に、こんどは、URL を / で切ったもの、例えば、 https://www.city.tokyo-nakano.lg.jp/dept/101500/ を入力してみましょう。すると、カレンダーのページが表示されます(2つ上の画像のページ)。そこに "Site Map of city.tokyo-nakano.lg.jp" というリンクがあります。このリンクをクリックすると、次のようになります。

円の周上や内部でマウスカーソルを動かすと、その年に保存された、https://www.city.tokyo-nakano.lg.jp/dept/101500/ の下にあるページの URL が次々に表示されます。これらの URL には、現在は消されたページも含まれます。ページの内容を確認するには URL が表示されたところでクリックしてください。

このやり方でみつけたこのページは、かつて http://www.city.tokyo-nakano.lg.jp/dept/101500/d001066.html として公開されていたページですが、今では Wayback Machine の中にしか存在していません。

もっと探して見たい人へのヒント

試しにこのページを開いて見てください。ブラウザのアドレスバーには https://web.archive.org/web/2018*/https://www.city.tokyo-nakano.lg.jp/dept/nakano/* が入力されているはずです。ここで https://web.archive.org/web/2018 の後の*は2018年のデータのすべてであることを表し、https://www.city.tokyo-nakano.lg.jp/dept/nakano/ の後の*はその下にあるページのすべてを表します。

つまり、この2つの条件(2018年、dept/nakano/以下)を満たす、保存されたページが一覧となって表示されるわけです。

時期とURLの概略がわかっている場合には、消されたページをこのやり方でサルベージするのが速いかもしれませんね。以下、このやり方の詳細な説明です。

検索オプションを指定する方法

ブラウザーのアドレスバーに入力する URL の一部分を * にしたりしなかったりすることで、保存されたウェブページから条件に近いものや条件をみたすもののリストを表示させることができます。

最新のものを表示させる  https://web.archive.org/web/https://www.city.tokyo-nakano.lg.jp/dept/244000/d001477.html
→ ここで "https://www.city.tokyo-nakano.lg.jp/dept/244000/d001477.html" の部分が表示させたいURLです。ブラウザーのアドレスバーにこのように入力すると、表示させたいURLからアーカイブされたウェブページのうち、もっとも新しいものが表示されます。
特定の日時にアーカイブされたものを表示させる  https://web.archive.org/web/20180122232032/https://www.city.tokyo-nakano.lg.jp/dept/244000/d001477.html
→ ブラウザーのアドレスバーにこのように入力すると、指定された日時(この場合は 2018年01月22日23時20分32秒)にもっとも近いタイミングでアーカイブされたウェブページ が表示されます。ただし、秒まで指定する必要はなく、例えばここを20180122とすれば2018年01月22日にもっとも近いタイミングでアーカイブされたウェブページが表示されます。
年まで指定する  https://web.archive.org/web/2018/https://www.city.tokyo-nakano.lg.jp/dept/244000/d001477.html
→ 2018年にもっとも近い(2018年の真ん中の日2018年07月01日にもっとも近い)タイミングでアーカイブされたウェブページが表示されます。
月まで指定する  https://web.archive.org/web/201801/https://www.city.tokyo-nakano.lg.jp/dept/244000/d001477.html
→ 2018年01月にもっとも近い(2018年01月の真ん中の日2018年01月15日にもっとも近い)タイミングでアーカイブされたウェブページが表示されます。
* をつけると、日時の範囲にあてはまる、アーカイブされたウェブページのリストをカレンダー形式で表示させることもできます  https://web.archive.org/web/201801*/https://www.city.tokyo-nakano.lg.jp/dept/244000/d001477.html
→ 2018年01月にアーカイブされたウェブページが表示されます。
表示させたいURLの末尾を * にすることもできます  https://web.archive.org/web/201801*/https://www.city.tokyo-nakano.lg.jp/dept/244000/*
→ URLが https://www.city.tokyo-nakano.lg.jp/dept/244000/ではじまるもののうち、2018年01月にアーカイブされたもののリストが表示されます。

(この節の執筆にあたり、英語で書かれたこちらを参照しました。翻訳と改変は筆者が行いました)

(く)

アーカイブされたPDFファイルをiPhoneで見るためのヒント

Wayback Machineアーカイブされた PDF ファイルを iPhone のブラウザ(SafariChrome)で開くと、最初のページだけが表示されどこをどうフリックしても次のページへ行けません。PC のブラウザではこの不具合はなく、PDF ファイルの全ページを閲覧することができますが、手元に iPhone しかない場合にアーカイブされた PDF の全ページを閲覧する方法はないのでしょうか。

例えば、 https://web.archive.org/web/20181219095908/https://www.city.tokyo-nakano.lg.jp/dept/102000/d026542_d/fil/31omonatorikumian.pdf の場合、2番目の : を %3A に変えて https://web.archive.org/web/20181219095908/https%3A//www.city.tokyo-nakano.lg.jp/dept/102000/d026542_d/fil/31omonatorikumian.pdf をブラウザのアドレスバーに入れてください。

これで、アーカイブされた PDF ファイルの全部のページを見ることができるようになりました。

(2018年12月23日追記。2019年6月6日改訂)