Posted inコンピュータ
autoencoder
昨日は、画像生成AIが非平衡熱力学の手法とベイズの定理を使ってノイズ+その拡散を逆演算してノイズから画像を作り出しているということを紹介しました。演算をするニューラルネットワークに別の情報(単語など)を一緒に学習させておくと、魔法のように単語から画像が現れるわけです。 例えば、Stable Diffusionのwebにはいろいろな例が載っていますが、「宇宙飛行士が月面で馬に乗る」と入れるとそのような画像が出るようです。適切に物体や背景をはめ込む技法は写真の修整などにも使われるようになっています。その名前の物体の画像と、その適切なはめ込み方をAIが知っているわけですね。 いくつかの不可欠の技法が…