ChatGPT-4にて画像生成が可能に!

遂にChatGPTにて画像生成ができるようになりました!!(イエーい!)

まだ成長途中の機能ですがChatGPTに課金しているユーザや気軽に利用したいユーザには最適かも!

ウーロン
どうやって使うか説明していくぞ!

ChatGPTの画像生成AIについて

まず画像生成AIとは?

画像生成AIは、自然言語の指示に基づいて画像を生成する先進的な技術です。このようなAIシステムは、通常、大量の画像とテキストデータから学習しており、ユーザーが提供するテキストの説明や指示に基づいて新しい画像を作成します。これは、特定のシーンや対象物、さらには抽象的なコンセプトを視覚化するために使われることが多いです。

要はテキストから画像を生成することです。

有名な画像生成AIのMidjourneyではテキスト情報とプロンプト/コマンド情報をもとに様々な画像を生成できます。
以下のような感じで。

/imagin man creating a blog, style manga, -ar 16:9
ウーロン
私もコマンドなど覚えるの大変でしたね。。まだまだ勉強が必要そう

ChatGPTの画像生成エンジン

ChatGPTの画像生成機能には、OpenAIが開発した「DALL-E」というエンジンが使用されています。DALL-Eは、テキストの説明から高品質な画像を生成することができる高度なAIモデルです。このモデルは、多様なスタイルと内容の画像を作成する能力を持っており、ユーザーの要求に応じて様々な画像を生成することが可能です

ChatGPTに説明してもらった。

他画像生成AIのデメリット

上記では筆者のMidjourney環境での出力を添付していますが使用するには

  1. プロンプト/コマンドの理解
  2. テキストの書き方
  3. 英語力

の上記3つが必要になります。
(Midjourneyを日本語で利用できる方法もありますが英語の方がクオリティが高い気がします。)

正直、AIによって「画像の生成が簡単にできる=イラストレーターがいらない」みたいな風潮がありますが、AIによる生成はかなり知識も必要ですし細かな修正にかなり時間がかかります。なので私はイラストレーターという仕事は無くならないと考えています。もちろんAIも使っているハイブリッドな方もいるのかなと思ってます。(※個人的な考えです。)

また利用には各サービスでサブスク(定期的購入)が必要になる為コストもかかってしまいます。

ChatGPTのメリット

大きく2つのPoint!!

  1. シンプル性
  2. インタラクティブ性

ChatGPTの画像生成AIはかなりシンプルに利用することができます

まず日本語での利用が可能、テキストの書き方におけるルールが無く気軽に利用ができます。ChatGPT Proに課金さえしていれば誰でも気軽に利用することができます。
また面白いのがAIとインタラクティブにやり取りができることです。
Midjourneyでは生成依頼をした後に4つ案が出てきますが、修正コントロールが難しく利用するために知識が必要になります。
ただしChatGPTではAIと同じチャットページにて会話をしながら修正や追加依頼などを行うことができます。

利用方法

利用の方法も通常通りChatGPTを使う画面から利用が可能となります。

まずは利用するChatGPTのバージョンが4になっていることを確認してください。

バージョンが3.5の場合、画像生成AIのDALL-Eが利用できません。課金が必要

テキストボックスに「画像生成してくれ」とテキストを入力することで画像生成AIのDALL-Eが動作し少し時間が経った後に生成した画像を出力してくれます。

試しに「ブログを書く男性を漫画風に画像生成してください。」と入力してみます。

cartoon = 漫画 で出てきましたね。
もし変更点がある場合同じチャットページから修正点を追加すれば修正されます。

こんな感じで気軽に修正点を依頼することもできます!
(今回はやり方のレクチャーなので画像のクオリティは無視しています。)

これであればクオリティを求めず簡単に画像生成したいユーザにとっては気軽に画像生成AIを楽しめますね。

ただしクオリティの高い画像を作りたい場合はまだChatGPTでは難しいかもしれないです。コマンドやプロンプトが無いため細かなコントロールが難しいからです。

ウーロン
AIを利用しているクリエイターからするとChatGPTの画像生成はまだ遅れてますが期待値は高い!
今後進展があり次第情報共有します!