インターネット魚拓 Wayback Machineの物理的サイズ

インターネット情報を保存するWayback Machineの保存装置の物理的な大きさについて考えてみましょう。 3.5インチハードディスク(外形140x100x25mm)は18TBのものが市販されています、Wayback machineの容量70PBは、3888個分に相当します。3.5インチハードディスクをびっしり積むと、14m×10m×10mくらいになりますね。コントローラーや放熱も必要ですが、何重かにバックアップするとしても、それほど大きくないビルに収まりそうです。下記、いろいろ写真があります。 http://ssdpower.com/interface.html https://en.w…

本の自動スキャンと透視

本やフィルムをデジタル化するのは人手がかかります。下記はInternet Archiveの紹介ビデオです。 https://upload.wikimedia.org/wikipedia/commons/transcoded/a/a9/Internet-archive-brewster-kahle-2013-0329.webm/Internet-archive-brewster-kahle-2013-0329.webm.480p.vp9.webm 東大が画像認識技術を使った高速スキャナーを発表しています。 https://www.youtube.com/watch?v=03ccxwNssmo ス…

世界の研究所 非営利団体 Internet Archive

今週の世界の研究所は、目先を変えて、Wayback Machineを運営する非営利団体 Internet Archive(アメリカ、San Francisco)を取り上げます。Wayback Machine はインターネットを経時的に保存するという野心的なプロジェクトです。1996年に開始されました。保存してほしくない場合は、その旨のタグを埋め込むか、archiveからの削除依頼を申し出ればいいそうです。 現在 475 billion webpagesを保存しており、容量は70PB(ペタバイト=10^15)で、増え続けています。保存には磁気媒体を使っていると思います。従業員168人、年間資金2…

Hoffmann 交通標識の裁判

今週のHoffmannは、第6章”Signs and Portents: No Parking in the Courtroom”、交通標識が間違って取り付けられていたたため駐停車禁止の箇所で駐車して違反切符をもらった学者の裁判の話です。実在かどうかわかりませんが、裁判記録をドラマ仕立てで紹介しています。丸に斜め線の駐停車禁止の標識が横棒になっていた場合に違反切符は有効かどうか、という裁判が最高裁(!)で裁かれます。標識とは何か、化学における分子式や、記号論などを使って議論しています。面白いですが、詳細は書ききれません。一例をあげると、「Scotland では男性も s…

分子進化の「ほぼ」中立説

分子進化の「ほぼ中立説 nearly neutral theory」というのも遺伝研から提出されて定説となりました(太田朋子博士 1973)。これは、弱い自然選択が起こる変異の蓄積率は、集団の大きさによるということを数式で示しています。これにより、孤島などの小集団で進化が加速されることが説明できます。素人目には、簡単に言えることはこれくらいで、後は歴史学に近いものになると思います(偶然の出来事を扱う必要がでてくる)。日本人の起源などもDNAの変異の解析を使って議論されています。 https://www.nig.ac.jp/museum/evolution01.html https://en.w…

分子進化時計と「中立説」

DNAの変化を調べることにより、いつ種が分化したかを推測する手法があります。電気陰性度で有名なL.Pauling とE.Zuckerkandlが1962年に発見した「分子進化時計」を使っています。彼らはヘモグロビンのアミノ酸の変化の種による違いに系統性を見出しました。1980年代以降にDNAを直接調べることが可能になり、DNAのうち機能を持たない部分の変化速度が年あたりほぼ一定であることがわかりました。これを説明するのが1968年に遺伝研の木村資生博士から提出された「分子進化の中立説」です。 https://en.wikipedia.org/wiki/Neutral_theory_of_mol…

人間の遺伝的個性とSNPs

人間の持つ遺伝情報(human genome ヒトゲノム)は30億塩基対、750MBだそうです。USBメモリに余裕で入る量なので意外と少ないように思いますが、一つ一つ見ていくと気が遠くなりそうです。そのうち、タンパク質をコードしている部分は約30000種類と言われており、そのほかに、発現の制御プログラムの条件文(どのような条件のときどのくらいそのタンパク質を作るか,典型的な動作速度は20分と聞きました)なども書き込まれているというのが私の理解です。これを調べれば製薬に役立つのは間違いないので、多くの人が研究に従事しています。バイオインフォマティィックスは、最近のデータサイエンスの先駆けとなった…

世界の研究所 国立遺伝学研究所(日本)

今週の世界の研究所は、静岡県三島市の国立遺伝学研究所(National Institute of Genetics; NIG)です。 https://www.nig.ac.jp/nig/ja/ データーベースの整備や、遺伝資源の保存など地道な仕事の他に、遺伝学に関する研究を行っています。所員は500人。 人間の遺伝情報の概略はすでに得られており、個人による違い、その機能や病気(がんなど)のときにどこが変化するかが研究されています。 人間のゲノムの情報量は750MBと言われています。 https://en.wikipedia.org/wiki/Human_genome#Information_c…

Hoffmann 藍の染め方

金曜日は「今週のHoffmann」と称して、Woodward-Hoffmann則の理論家 Roald Hoffmannが著者の一人である Old Wine New Flaskから面白そうなところを引用しています。この本は、ユダヤの伝統と化学のエピソードを混ぜて解説した独特の本で、何か役に立つ文化的側面がないかと思って読んでいます(ここで取り上げるのは、単語が難しいので自分では面倒で読まないからです)。2000年以上の間、時代に合わせて議論を尽くしそれを記録する民族性について私の認識は深まりました。最近の「サピエンス全史」(Y.N. Harari著)の著者はイスラエルの人ですが、訳者による下記の…

歴史探偵のメッセージ

先日亡くなった歴史探偵・半藤一利氏の「昭和史(上下)」は歴史好きにはおすすめです。語りかける口調で、一部は読者代表のような形で編集者が質問して話が進んでいくので読みやすいです。昭和64年間の社会全体の動きが俯瞰できるので、未来を考えるのに役立つと思います。今はSNSで人が直接つながりすぎることの弊害が出てきていますが、ここ100年程、技術の進歩が激しく社会を揺すぶっている様子も読み方によっては分かると思います。 https://www3.nhk.or.jp/news/html/20210209/k10012858531000.html?utm_int=detail_contents_news-…