こんにちは、たてごと♪ です。
『ChatGPT』の有料版では、『DALL-E(ダリ)』という画像生成AIと連携をして、絵を描いてもらうことができるわけですが。
画像の精度だけは非常に高いんですが、まあ制御難しいですねこれ。
人間が相手のときと同じように、日常的な言葉で指示を出せるのは便利なんですが、実用化にはまだまた課題がありそうです。
僕も、拙作『哲学魔王と迷える天使』のイメージイラスト描いてもらおうかなあ、と思って色々やってみたんですが。
これぐらい(↓画像参照)がやっとですかねえ、、
ともあれ、何が難しいかというと「同一性の保持」。
生成された画像に対して、ここを修正してほしいという要望を伝えたとしても、一からの生成がなされてしまうらしく、まったく別の姿が出力されてしまう。
画風もころころ変わります。
かといって指示を一度にたくさん含めると、ある被写体への指示が別の被写体に適用されるとかして、どんどん不整合が出てくる。
そして何より、『DALL-E』さんが返してくる画像データは当然ながら、テキストAIである『ChatGPT』さんにはいっさい検証ができません。
だから一枚絵を描いてもらうのには耐えても、複数の画像を漫画のように連続性を保って描いてもらうのは、ほぼ不可能でしょう。
唯一、「すべてのコマをひとつの画像に」という指示を出すことで、四コマ漫画(の雛形)くらいは何とか行けるかもしれません。
あと『DALL-E』さん、どうやら文字を認識できないっぽくて、指示どおりのテキストを埋め込むのも無理でした。
つまり現段階では、「注文の受け付け」に大きな課題があるわけですね。
妥当性の判断には、元となる膨大なデータが必要になってくるもので、画像の場合だと容量的にも処理速度的にもしんどいんだと思います。
取りうる構図も千差万別に考えられますから、学習データを十分に揃えきるのも難しいでしょう。
もっとも、単純な一枚絵としては本当にクオリティ高いので、マジそのうちイラストレーター失業するかもわからんですね。
これと同じもん自分で描こう思ったら、いったい何年修行しなきゃいけないんだ……?
ところで生成された画像は、『DALL-E』に指示を与えて生成させた「AI利用者に著作権が帰属」します。
つまり『DALL-E』は法的には、絵筆とかと同じに「絵を描くための道具のひとつ」であって、だからAI利用者が描いたもの、ってふうに見なされるわけですね。
なので『DALL-E』を提供しているOpenAIさんから差し止めを受けることもなく自由に使用できるわけですが、権利には責任が付き物。
不用意に公開した場合、もしほかの既存の著作物と内容がかぶっていたら、そのAI利用者が権利侵害に問われてしまうって事も考えられます。
いちおう、有名人や有名キャラあたりは出力をくい止めるゲートが備わってるみたいですけど、マイナーなものに関してはその限りじゃないでしょうし。
ちょっと怖いかもしれませんね。