1.「画像生成AI」とは
画像生成AIとは、テキストで出来上がりのイメージを指示したり、ラフスケッチのような下書きをベースに指示をするだけ自動的に画像やイラストが生成されるソフトウェアのことです。
これらの機能やタスクのことを、「text-to-image」(言葉や文章で出来上がりのイメージを指示して生成)や「image-to-image」(ラフスケッチをベースに生成)と呼びます。
今回は「text-to-image」のほうをメインに実際のソフトウェアを利用して画像の出力や処理の説明をしたいと思います。
2.「text-to-image」で実際に出した画像
「text-to-image」の機能で実際に画像を出してみようと思います。
今回使用するソフトは「Bing Image Creator」というもので、お題は「幻想的な背景のサーバールーム」で画像を生成してみます。
①「Bing Image Creator」にて、「幻想的な背景のサーバールーム」で画像を生成
②生成された画像1
③生成された画像2
3.「text-to-image」の仕組み
「text-to-image」で行われている処理としては「テキストエンコーダ」と「画像生成器」という2つの部分からなります。
テキストエンコーダは入力されたテキストを低次元のベクトルに変換し、画像生成器はこのベクトルを画像に変換するという役割をそれぞれ担っています。
ベクトルとは、「入力テキストの意味」または「画像の内容」を表す「数字の列」のことを指します。
↓処理イメージ
4.まとめ
画像生成AIというものについて、名前やどういったものかというのはよく話題にあがったりするので理解はしている方も多いと思いますが、実際に内部処理はどういった動きをしているのかなどは知らないという方も多いかと思います。
今回あげたもの以外にも、生成AIとして「文章生成AI」や「音楽生成AI」など、AI技術は幅広く普及しているので気になった方はどういった仕組みなのかなど含め色々調べてみると面白いかと思います。
【画像生成AIとは?イラストが生成される仕組みとおすすめサービス7選】
【Bing Image Creator】
https://www.bing.com/create