Human Cell Atlas の中を見ると例えば下記のページが肺のデータだそうです。黒い umap という図形が細胞の種類や地域性別などのチェックボックスをon/offすると変わりますが、何を示している図なのか、意味がよくわかりません。
https://cellxgene.cziscience.com/e/066943a2-fdac-4b29-b348-40cede398e4e.cxg/
解説記事を読んでみることにしましょう。下記にはコンピュータがHuman Cell Atlasにどのように使われるか書いてあります。
https://www.nature.com/articles/d41586-024-03762-y
まさに昨日考えていたことが書いてあって驚きました。曰く「人間の脳には複雑すぎる」「AIを活用する」などです。具体的には、細胞の画像やRNAパターンからある細胞が何なのかを判別するときにAIを使います。具体的には、PopV(=popular vote 人気投票)というプログラムがいろいろな判断基準から多数決を採って答を出し、その信頼性も算出します。そこからは人間が悩む番です。人間には約20000の遺伝子の発現パターンを使っていましたが、128個を調べれば十分だということが分かったそうです。これは大きな進歩ですね。400個のデータセットから2300万個の細胞を検索するのに数秒しかかからないとのことです。
コンピュータによる遺伝子発現パターンを使った細胞の同定はすでに発見を生んでいます。血球の幹細胞を作ろうとして培養した白血球の中に肺の細胞と同じものが見つかったなど、思わぬ成果だそうです。
読みながら、細胞1個の遺伝子発現パターンを調べるのは大変だろうと思いましたが、かたまりとして分析してAIでどの細胞の組み合わせが存在するかを判別する方法も開発したそうです。最初は手作業で細胞1つ1つ調べていたのでしょうが、顕微鏡的プローブの使用等でデータを蓄積し、ある程度たまったら集団を分析することで個々のデータに分解できると思います。変な結果がでればまた1つ1つ調べればいいわけです。特に、COVID-19の肺への影響の調査に威力があったとのことです。
ヘマトキシリンとエオシンによる2色の組織染色が長年臨床診断に使われていて膨大な蓄積がありますが、その画像の幾何学的構造とRNA発現パターンに相関があり、染色写真からAIを使ってRNA発現パターンと一致する細胞の同定ができるそうです。ちょっと驚くべき結果です。ここから敷衍して、実験もコンピュータの中でできるようになるのではないかと書いてあります。UNAGIという薬に対する細胞群の応答を見るコンピュータ内のモデル(使用者が学習させる)が紹介されています。なぜ「ウナギ」かは不明ですが、説明文のなかにウナギの絵が描いてあります。作った人は日本人ではないようです。インターフェースはpythonなので、触ってみることもできそうですね。
https://github.com/mcgilldinglab/UNAGI
Human Cell Atlasは現在一部の臓器のみ公開されていますが、1~2年後には最初の人体細胞地図がコンピューターツールと一緒に公開されるそうです。これはおそらく、夜空の星と同じくらい細かくて面白いです。アマチュア天文学者のようなアマチュア人体学者が出てくると予想します。私も暇になったらやるかもしれません。
英語は上記記事から。
“Such tools make massive data sets accessible”
massive 膨大な
“Single-cell technologies have shattered the fuzzy lenses through which researchers conventionally view biology.”
shatter 粉々にする
fuzzy lenses ぼやけたレンズ
“At the forefront of the design — and use — of single-cell technologies is the Human Cell Atlas (HCA), which aims to catalogue every cell type in people. Launched in 2016, the project has profiled hundreds of millions of single cells, resulted in about 440 published studies and led to dozens of wet-lab and computational procedures.”
forefront 最前線
launched in 2016 2016年に立ち上げられた
wet-lab and computational procedures プロ「スィ」ージャ― 水を使う実験室とコンピュータの手順
” Available on the website GitHub, these computational tools include ways to catalogue cells and search atlas data; shortcuts for researchers to obtain spatial or multi-modal data at low cost; and in silico models that describe how cells interact and where and how diseased cells might respond to treatment.”
GitHub ギットハブ プログラムを無料で公開するwebサイト。Gitはバージョン管理のツール。
shortcuts 近道
spatial 空間的
multi-modal 複数の異なるデータの
in silico コンピュータの中で
how diseased cells might respond to treatment 病気になった細胞が治療にどのように応答するか