昨今世の中を賑わせている生成AI。
その中でも画像生成AIなるものはさらに注目を浴びています。
今回紹介する田中秀弥さんの「画像生成AIがよくわかる本」では、そんな画像生成AIの仕組みと例が簡単に解説されていました。
この記事では、「画像生成AIがよくわかる本」の内容をさらにわかりやすく要約し、紹介していきます。
では、いってみましょう!
本書の概要
ページ数
索引及びおわりにを含めず、177ページ。
全193ページでした。
読むのにかかった時間
大体2時間ほどで読み切ることができました。
構成
画像生成AIが主テーマですが、生成AI全般にも触れる部分があり生成AI、画像生成AIの初心者にぴったりの一冊でした。
図と例がわかりやすく織り交ぜられる構成で、本自体のサイズもコンパクトなので一冊は持っておきたいと思いました。
画像生成AIとは
画像生成AIとは、ユーザーが生成したい画像のイメージをテキストや参照画像を入力することで、そのイメージに沿った画像を生成してくれるAIです。
生成される画像は写実的なものから、油絵風、アニメ風などと幅広く、「ゴッホの絵」というプロンプト(指示文)によってゴッホの絵そっくりな画像を作ることもできちゃいます。
画像生成AIの仕組み
画像生成AIの仕組みはかなり複雑です。
モデル名としては潜在拡散モデルと呼ばれるもの利用します。
潜在拡散モデルの簡単なイメージを解説すると。
まず、綺麗な画像をノイズに変換するという過程を学習させます。
続いて純粋なノイズ画像を入力します。するとノイズ変換の逆を行うことで綺麗な画像を生成することができるのです。
ノイズ変換する処理には莫大な時間を要するので、そこに画像圧縮という技術も併用します。
このノイズに変換する技術を逆向きに利用する。画像圧縮技術も併用する。というのが潜在拡散モデルです。
このモデルが元となり画像生成AIは画像を作り出すことができます。
ノイズから自由にどの部分のノイズを除去することで、綺麗な画像になるかを学習して生み出していくという感じですね。
学習時に画像と共にテキストも添えてあげることで、画像とペアで学習することもでき、潜在拡散モデルと共に利用するとテキストを入力すると画像が出力されるという形になるのです。
画像生成AIの著作権
画像生成AIで度々問題となるのが著作権です。
画像生成AIで気になる著作権は二つ。「学習データに対する著作権」と「生成された画像に対する著作権」
それぞれについて解説していきます。
まず「学習データに対する著作権」です。
AIには大量の学習データが必要になります。
この学習データは人間が生み出した著作物が多く、勝手に学習に使われるのは気持ちが悪いと思います。
この感覚は正しく著作権に引っかかるのではないかという話です。
結論から言うと、超グレー。
「著作権者の利益を不当に害してはいけない」という内容に抵触しなければセーフとなっています。
研究目的で利用するのであれば、問題ないのですが、果たしてどう研究目的で著作権者の不利益を害していないかを判断するかは難しいです。
今後、画像生成AIが使われる場面が増えていく中で、裁判なども起こっていき判断が見えてくると思います。
続いて「生成された画像に対する著作権」です。
画像生成AIが作った画像には著作権があるのか、ないのか問題ですね。
こちらは、どれだけ人間が関わったかによって決まってきます。
単純に「空とぶサンタさん」というプロンプトで出力した画像に対しては、著作権はありません。
出力された画像を加工したり、プロンプトを試行錯誤して作成したということであれば著作権が発生することがあります。
人間がどのくらいAIに関わったかによって著作権が決まる形です。
著作権はシビアな問題なので、今後も実例が増えていくと思いますので要チェックですね。
画像生成AIの活用事例
画像生成AIを使った例も増えてきています。
まずコミック制作分野。
日本でも「サイバーパンク桃太郎」というSFコミックが発表されていて、画像生成AIを使って書かれた漫画となっています。
AIならではの持ち味の絵で、新しいジャンルの可能性を見せてくれる作品となっています。
映像制作現場でも画像生成AIの実用事例があります。
人手が足りず作画崩壊となってしまうアニメ業界で、背景を画像生成AIツールで作成するという例がありました。
NETFLIXが実際に「犬と少年」というタイトルで使用し、3分ほどの短い動画ではあるものの、全カットの背景画の作成に画像生成AIを活用したのです。
今後アニメでは作画の手間を少なくする手段として画像生成AIは注目されています。
広告クリエイティブの分野でも画像生成AIは活躍を見せています。
画像生成AIによって大量の画像を簡単に生み出せるようになったことで、より良いデザインの広告を作り出すことができるのです。
株式会社ガラパゴスでは、従来のバナー広告で利用していたフリー画像を生成AIで作る広告画像に変更したところ、クリック率が1.8倍に向上したと発表しています。
表示回数を揃えた正式なABテストではないものの、可能性としては十分にありそうなものです。
他にも自動車デザイン、医療分野といったところで、既に画像生成AIは使われ始めています。
画像生成AIの代表的なサービス
最後に画像生成AIの代表的なサービスを一覧でまとめて紹介します。
・Midjourney
フォトリアルスティックな画像の生成を得意としたサービス。
パラメータを変更することでより細やかに画像を生成することができる。
・にじジャーニー
アニメ調に特化したモデルを提供するサービス。
漫画やアニメのような二次元イラスト調の画像を生成することができる。
・DreamStudio
構成のなPCがなくても簡単に画像生成をすることができるサービス。
商用利用も可能で、自由に画像生成ができる。
・NovelAI
日本のアニメや漫画のキャラクターのような画像が得意なサービス。
使用したいモデルを変えることで、生成される画像の雰囲気を変えることができる。
・お絵描きばりぐっどくん
LINEチャットボットで使用できる画像生成サービス。
LINEのアカウントであるため友達登録だけで利用できる。
など。
「画像生成AIがよくわかる本」では他にも数種類のサービスが紹介されているとともに、実際にどうやって始めればいいのかも紹介されていました。
まとめ
今回は、田中秀弥さんの「画像生成AIがよくわかる本」を紹介してきました。
画像生成AIのことを基礎から、実際に使うレベルにまで学習できる一冊として最高だと思います。
画像生成AIを今後学んでいきたいという方はぜひ読んでみてください。
この内容で、1,210円というのはコスパが超いいですね。
では、皆さんの画像生成AIライフがより良いものになることを祈っています。
コメント