世界の研究所:ドイツ・ミュンヘン大学の成果を使った Stability AI 社

最近AIツールが使いやすくなってきて、かなり長い日本語→英語や、自分で書いた英語の冠詞のチェックなどは一発で満足のいくものが出てくるようになっています。論文など長い文章の要約を自在にできるツールも出てきているようです。すなわち、論文を読ませてこちらで質問をするといろいろ答えてくれるというもので、頭が疲れないのと時間が短縮される効果があります。また、「プロンプト」を入れると絵や音楽が出てくるツールも進化しています。講義のスライドの図の著作権の問題がたいへん面倒になったので(クラウドにアップする場合はすべての図の出典を「どの本の何ページ」まで申告する必要あり)、生成AIに作らせたいと思っています。初期は無料だったAIツールがどんどん有料化してきていますが、Stable AI社のツールの一部は今のところ1M$=1.5億/年以下のビジネスでは無料ということになっています。
https://stability.ai/license
年末年始にStable Diffusionを自分でインストールしてイラストの出力に使ってみましたが、CPUでは荷が重く、GPUでの数十倍以上の加速を実感しました。NVIDIA(エヌヴィディア)社の株が2年で10倍に上がっているのに納得です。これだけ収益を上げているとライバルが出てきそうですが、今のところ生成AIにはNVIDIAのGPUが非常に使いやすく、AMDのものは使いにくいというのが実感です。超並列計算のプログラミング言語(CUDA)が対応しているかどうかの問題があり、CUDAがNVIDIAにより開発された経緯があるためと、他社GPUへのCUDAの移植がボランティアベースで行われていて組織的でない、という謎の問題があることが原因のようです。もしかしたら他社GPUにCUDAを商用目的で移植するとNVIDIAに訴えられるのかもしれません。超並列計算はハードウェアに依存する要素が大きいですが、CUDAの別言語を作るなど、やり方はありそうに思います。Intel、AMD、Armなど有力なプレーヤーが参加しているので、10年後がどうなっているかが楽しみです。日本にも生成AIの会社はいくつかあり、ハードウェア(低消費電力)に踏み込む計画も報道されています。
https://ledge.ai/articles/japan_ai_infra_collaboration_pfn_rapidus_sakura
自分で触ってみて、消費電力が500W~1kW近くになり、24時間使っていると月2万円かかる(1kWh=約30円なので)など、電力が問題になるのも実感しました。今週は生成AIの現状や仕組みについてみてみましょう。

英語は、https://en.wikipedia.org/wiki/Stable_Diffusion から。
“The generative artificial intelligence technology is the premier product of Stability AI and is considered to be a part of the ongoing artificial intelligence boom.”
generative artificial intelligence 生成AI
genetic algorism 遺伝的アルゴリズム
generic medicine ジェネリック医薬   ※ generative, genetic, generic 似ていますが意味が違うので正確に覚えましょう。
premier 第一の
ongoing 現在進行中の
“It is primarily used to generate detailed images conditioned on text descriptions, though it can also be applied to other tasks such as inpainting, outpainting, and generating image-to-image translations guided by a text prompt.”
conditioned on text descriptions 文章で叙述された条件をつけた ※ “on” が難しいですね。これも英語用のAIなら一発です。
inpainting 「画像修復」だそうです。
outpainting はよくわかりませんが、画像の一部を見せてその外を描かせること?
”Its code and model weights have been released publicly, and it can run on most consumer hardware equipped with a modest GPU with at least 4 GB VRAM.”
code コンピュータプログラム(コード)
model weights ニューラルネットワークの「重み」の係数のことでしょう。
modest GPU そこそこの性能のGPU
”Stable Diffusion originated from a project called Latent Diffusion, developed in Germany by researchers at Ludwig Maximilian University in Munich and Heidelberg University.”
Ludwig Maximilian University in Munich 通称、ミュンヘン大学。 1472年創立、ドイツ国内のランキングが1位の学科が多い名門です。レントゲンが教えていた。工学部は別の大学(ミュンヘン工科大学)なので、この大学にはないそうです。

Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA