削除された役所のデータを復元する方法 WARP

インターネット資料収集保存事業


WARP・インターネット資料収集保存事業の概要

 公共機関のサイトに掲載された情報は更新・削除される。
 国立国会図書館は、2002年から、インターネット資料収集保存事業(Web Archiving Project: WARPを実施しており、主に公共機関のウェブサイトを保存・公開している。
 このWARPを使えば、過去に掲載されていた情報を見たり、ダウンロードできる

 民間のサイトも掲載されているが、公益法人、私立大学、政党など国立国会図書館が選定をしたサイトに限定されている。

 国立国会図書館法を根拠とするため、安全・確実に業務が行われることになっている。

 このサイトは何か特殊な事情を抱えた人が使うサイトである。ほぼほぼ使われることは無いであろうが、必要なサイトである。歴史の記録の残し方が、紙からネットデータへと変化したのである。


https://warp.da.ndl.go.jp/ (実際に検索を行うページ)


ウェブアーカイブの流れ(国立国会図書館)
ウェブアーカイブの流れ(国立国会図書館)

 

  東大阪市役所では、一部のパブコメを恣意的に削除するという問題がある。
 WARPを使えば削除されたファイルをダウンロードすることができる。
 
 

実際に使ってみて

 「自治体」>「大阪」だけで72件がヒットした(2020年8月時点)。ここから「東大阪市」を選び出すのは面倒である。
 「自治体」の検索窓から「東大阪市」と入力すれば、東大阪市役所だけが表示される。
 東大阪市役所は2010年8月11日から保存されており、概ね3カ月毎に収集・保存されている
 10年以上前のサイトを見ると、懐かしく感じる。

 

 あの有名な「あいちトリエンナーレ」のデータもあるように思えるが、トップ > 詳細検索 > 本文「あいちトリエンナーレ」及びURLhttps://aichitriennale.jp/index.html)を入力すると

国立国会図書館(東京本館、関西館、国際子ども図書館)で閲覧できます

とだけしか表示されない。つまり、ネットでは公開していないということだ。
 トップ > イベントの検索窓から「あいちトリエンナーレ」を入力すると、関連したデータは表示されるが、あいちトリエンナーレ本体は表示されない。

 以上のことから、このシステムを使うには、あらかじめ何らかのキーワードやURLを知っておかねばならない、ということがわかる。
 

 このWARPのサイトには、表題の事業だけでなく、知的触発をさせるページもある。

 保存した1万サイトの可視化

 私が特に面白いと思ったのは「保存した1万サイトの可視化」です。
 役所毎に情報発信の量が異なるのが可視化されていて面白いです。


WARPが保存した1万サイトの可視化
WARPが保存した1万サイトの可視化

 大きさが異なるということは、その情報発信量が異なることを意味します。
 大きいことは、情報を発信するだけのネタを持っている、個性がある、ということです。

 注目は、都道府県です。大きさがほぼ同じです。
 あの有名でメディアで頻繁に取り上げられる東京都の発信量が他の道府県とほぼ同じです。
 兵庫県と和歌山県とを比べると2倍以上の違いがありますが、他のコレクション(中央官庁や市町村)における大きさの違いに比べれば、都道府県間の大きさの差は小さいです。
 これは、都道府県庁においては、ほぼ同じ業務を行っているため、違いが出てこないことを意味しているのかもしれません。

 同じ業務をやっているのであれば、行政改革の観点から、47の都道府県庁を1個の役所にまとめて「自治省」っていう国の機関を作ってみてはどうでしょうか(笑)。
 例えば、警察業務などは、都道府県に分割する必要性を感じません。たぶん、それは、警察官が役職に就きたいためのポスト対策なのかもしれません。

 大阪府では、大阪都構想が話題ですが、むしろ、大阪府庁を廃止して、国と市町村とを直結させるという思考実験もできるかもしれません(笑)。

 可視化をすると、今まで思いつかなかったアイデアが出てきたりします。

 定性的ではなく、定量的に考えてみる。コンピュータが発達してきたから可能になった、ものの見方・考え方ですね。

 このように可視化して社会現象を理解するという記事は次のとおりです。

以上