こんにちは、いーとぅんです。
みなさんは「Stable Diffusion」をご存じですか?
つい2週間ほど前に公開された画像生成AIで、文章から画像の生成や
画像から画像の生成ができることで今話題になっています。
しかもオープンソースということで、誰でも無償で使用することができます!
今回はGoogle社が提供しているWebサービス「Google Colaboratory」を利用して、
実際にどんな絵ができるのか遊んでみました。
(GoogleアカウントとHugging Faceアカウント、アクセストークンなど事前に準備が必要です)
■テキストから画像生成
Stable Diffusion with diffusers
こちらのノートブックを自分のドライブにコピーして、
上から順に再生マークをポチポチしていきます。
そして、生成する画像の特徴を指定している呪文(ここ)を
prompt = “a photograph of a cat floating in the sky with balloons”
としてみました。(訳:風船で空に浮かぶ猫の写真)
そしてできたのがこちら。
20秒足らずで生成してくれました!
いい感じに表してくれてますね。
■画像から画像生成
image-2-image using diffusers
同じようにこちらのノートブックを自分のドライブにコピーして、
上から順に再生マークをポチポチしていきます。
サンプルではWeb上の画像を入力として指定していますが(ここ)
このように自前の画像をアップして指定するようにします。
今回入力とした画像はこちら。空に浮かぶ羊です。
そして、特徴を指定している呪文(ここ)を
prompt = “the sheep in the sky”
としてみました。(訳:空に浮かぶ羊)
そしてできたのがこちら。
ここまできれいにしてくれるとは、、、驚きですね。
今回のは原型がないくらいですが、変形させる強度なども指定できるみたいです。
こんな風にハイスペックなPCがなくても簡単に画像生成を試すことができます。
アイデアが出てこないときに生成してみたり、ラフ絵をちゃんとした絵にしたりと
色々できることは多そうですね。
興味がある方はぜひ試してみてはいかがでしょうか。
■参考・引用
CompVis/Stable Diffusion:https://github.com/CompVis/stable-diffusion
huggingface/diffusers:https://github.com/huggingface/diffusers