autoencoder

昨日は、画像生成AIが非平衡熱力学の手法とベイズの定理を使ってノイズ+その拡散を逆演算してノイズから画像を作り出しているということを紹介しました。演算をするニューラルネットワークに別の情報(単語など)を一緒に学習させておくと、魔法のように単語から画像が現れるわけです。 例えば、Stable Diffusionのwebにはいろいろな例が載っていますが、「宇宙飛行士が月面で馬に乗る」と入れるとそのような画像が出るようです。適切に物体や背景をはめ込む技法は写真の修整などにも使われるようになっています。その名前の物体の画像と、その適切なはめ込み方をAIが知っているわけですね。 いくつかの不可欠の技法が…

Latent diffusion modelによる画像生成

今週は動画生成AIのスタートアップが何をやっているかを解説しようとしましたが、Stable Diffusionを使っていることしかわからないので、その手前の画像生成AI(例 Stable Diffusion)の勉強に付き合っていただくことになりそうです。 昨日用語だけ紹介したlatent diffusion model (潜在空間における拡散モデル)、を解説する前にdenoising diffusion probablistic models((画像空間における)確率拡散モデルによるノイズ除去)について勉強すべきである、とのことなので(いろいろなAI解説サイトで)、やってみましょう。 いくつも…

生成AI Stable Diffusion

いろいろ調べていると、Lore Machineは2023年に発表されて1年後(2024-03-05)にリリースされましたが、ログインしないと詳細情報がわからないようです。計算資源がかなりかかると思うので、万人が自由自在に動画を作れるのはまだ少し先かもしれません。 先日紹介したマウスで3次元を動かせる動画を作るのは撮影を含めて1分あたり$60(=9000円)かかるそうなので、Lore Machineの1か月$10は安すぎるような気がします。 Lore Machineは画像生成AIのソフトウェア”Stable Diffusion”を使っているそうなので、こちらを見てみましょ…

世界の研究所: 生成AIのLore Machine社

先週、高名な漫画家が亡くなったニュースが世界をめぐりました。今週は、3月5日に公開されたAI漫画家および動画生成サービスのスタートアップ Lore Machine社 をとりあげます。 https://www.loremachine.world/ https://www.technologyreview.jp/s/331049/i-used-generative-ai-to-turn-my-story-into-a-comic-and-you-can-too/ 会社のyoutubeは下記。 https://www.youtube.com/watch?v=vKIhBcCV_Rg https://w…

仮想旅行の現状

年を取ってくると実際に出かけるのはおっくうになってきます。仮想空間での旅行はどうなっているか調べてみました。検索で目立つサイトは下記です。 youtubeがマウスで動かせるのは知りませんでした。 https://www.youtube.com/watch?v=dWa5hJGpTN4 これは下記の会社が作っています。撮影法やwebでの実現方法について、たいへん気になります。特に乗り物酔いの感覚はなく、よくできています。 https://www.airpano.com 誰が作っているかが英語版には書いていなかったですが、中国語版にはありました。ロシアの人たちです。応用数学専攻の技術者とカメラマンの…

Intel4004からMead-ConwayのVLSI教育革命へ

半導体エンジニアを養成する教育で我々に求められている仕事は、下記の有名な教科書のようなものを作ることかもしれません。 https://en.wikipedia.org/wiki/Mead%E2%80%93Conway_VLSI_chip_design_revolution 昨日のyoutuberが解説を出しています。これは集積回路の歴史を知りたい人は絶対見たほうがいいです。 https://www.youtube.com/watch?v=XgbxFVyKMMo Carver Mead はCaltechの教授で、Lynn ConwayはXeroxのVLSIプロジェクトリーダーでした。 最初のCP…

半導体設計支援ソフトの解説

半導体設計支援ソフト(EDA)いろいろ情報をあさっていたらyoutubeにわかりやすい解説がありました。 (1) https://www.youtube.com/watch?v=ihz2WY-E2C8 (2) https://www.youtube.com/watch?v=OmEbzRp_NGg (1)はEDAの歴史を語っています。電子回路シミュレータSPICEはUCバークレーの電子工学の研究室が作ったものですが、現在はAnalog Devices社がLTSPICEを無料頒布しています。使いこなせると楽ですが、実用上はトランジスタを組み合わせて回路を作ることはなく、色々な集積回路を使います。い…

半導体設計支援ソフトウェア Electonic Design Automation 

EDA(Electronic Design Automation)には広義では流体力学や化学反応を扱うものから電子回路設計、プリント基板などもありますが、この業界では微細な半導体集積回路のリソグラフィパターンの設計を指し、金額としても大きいと思います。先日発表のルネサスが8900億円で買収したのは回路設計~プリント基板のところのEDAの会社Altriumで、年商は$263Mでした(買収価格はその22倍、これが高いか安いかは面白い問題です)。 半導体微細加工設計のSynopsis社の年商は$58Bなので、Altrium社の約200倍と巨大です。上流か下流を抑えている会社が、目障りな他社をつぶすた…

脳のハードウェアにおける感情の相関

最新というには少し古いですが、下記の論文が2019年に出ています。無料で読めます。 https://www.science.org/doi/10.1126/sciadv.aaw4358 fMRIと畳み込みニューラルネットワークを使って、人の感情を外から読み取る装置を作ったというものです。一種のテレパシーの装置ですね。 これは11~20種類の感情を扱っています。感情と紐づけされた25000個の画像と動画を見せて、教師ありで訓練して8層のニューラルネットワーク(名前はEmonet)を作ったら画像から誘起される感情を当てられるようになったとのこと。 このニューラルネットワークを使って、感情を誘起する…

多言語データベースの中身

昨日の感情の言語学的な分析に使われたデータベース”CLICS3”について少し見てみましょう。 https://clics.clld.org/ 中身を解説した論文は下記です。これは誰でも読めるopen access出版です。2020年ですから古い話ではありません。 https://www.nature.com/articles/s41597-019-0341-x 30個のデータベースを合体させたもので、1973年のものが一番古いです。 形式は単純で、下記は1016個の単語を英語、ドイツ語、ロシア語で記してあるだけです。 https://concepticon.clld.o…