今週の世界の研究所は、目先を変えて、Wayback Machineを運営する非営利団体 Internet Archive(アメリカ、San Francisco)を取り上げます。Wayback Machine はインターネットを経時的に保存するという野心的なプロジェクトです。1996年に開始されました。保存してほしくない場合は、その旨のタグを埋め込むか、archiveからの削除依頼を申し出ればいいそうです。
現在 475 billion webpagesを保存しており、容量は70PB(ペタバイト=10^15)で、増え続けています。保存には磁気媒体を使っていると思います。従業員168人、年間資金20億円(2018)。運営資金の出どころはよくわかりませんが、各種財団の援助が謝辞に書いてあります。個人寄付(税控除つき、ただし米国内)も募集しています。いくつかのトピック(President Trumpなど)に関する過去のニュースを見ることもできます。日本を含む他の国にも類似サービスがあるようです。日本の国立国会図書館からリンクが張られているのには驚きました。
https://archive.org/
https://en.wikipedia.org/wiki/Internet_Archive
https://warp.da.ndl.go.jp/contents/reccommend/world_wa/index.html
日本は民間の「ウェブ魚拓」というシステムがありますが、バックアップ作業のミスで2007年以前のものが失われてしまったそうです。
https://ja.wikipedia.org/wiki/%E3%82%A6%E3%82%A7%E3%83%96%E9%AD%9A%E6%8B%93
archive 文書館、記録の集積、アーカイブ
web crawlers crawlは泳法のクロール、這いまわる。web siteの情報を自動で収集するロボットプログラム
The Archive also oversees(監督する) one of the world’s largest book digitization projects.
imminent 「イ」ミネント 差し迫った
enclosure 同封物
envelop 封筒、包絡線
moisten 「モ」イスン 湿らせる、濡らす (tは読みません)
equinox 春分(秋分)の日 「イ」ークイノックス
solstice 「ソ」ルスティス 夏至、冬至(summer/winterをつける)
fish print (日本固有のようなので要説明) 魚拓
To provide a fish print generating apparatus for easily forming an accurate fish print at the place without colorfully staining a user’s hand.(特許の訳文)
stain 染める、汚す
acronym 頭文字 (CEO, OEMなど) 「ア」クロニム
abstract 「ア」ブストラクト(名詞)要旨、抽象 アブスト「ラ」クトにすると意味が変わって「抽象的」