どうも!sodaエンジニアの國田です。
前回、Google Geminiの新しい画像生成AI "Nano BananaPro"について紹介しました。
その中で、以下のような"書籍の表紙画像"を生成したのですが、皆さま、覚えておられますでしょうか?

我ながら、素敵な書籍の画像だと思います(笑)。
実は、この書籍画像、ブログだけではなく、画像単体でも弊社の社内チャットに出回っておりまして...
たまたま、画像だけを目にした先輩社員からこのようなことを言われました。
"國田くん、本を出版したって本当?"
ーーいや、嘘ですよ?
AI生成で作った、"それっぽい表紙"です。
ディープフェイク...今の最先端AIがこの言い方で正しいかどうかは分かりませんが、とにかく、「存在しない本」です。
「そんなタイトルの本、書けてたまるか!」です(笑)。
そう説明すると、先輩社員は、
"そっかあ...。残念だなぁ...。読んでみたかったのに"
と、少しもの悲しそうな顔をして去っていきました。
うーん......。
AI生成画像で楽しんでいただけたのは良かったですが、肝心の本の中身がないことに失望されてしまったのかも知れません。
私、國田は、筋肉系AIエンジニア界隈でも「非常に優しいエンジニア」と呼ばれていると自負しています。
もの悲しそうな人を見ると、つい中身を作ってあげたくなる、温情に溢れた慈悲深い人間なのです。
とは言え、です。
流石に、この本の厚さほどのボリュームで文章を書くのは気が引けますし、読む側もなかなかに大変だと思います。
かつて雑誌で毎月8ページほどの技術記事を連載していたことはあるのですが、それとは比較にならない作業でしょう。
そう思い悩んでいると、ふと頭にアイデアがよぎりました。
「あれ?でも......漫画をAIに作らせれば、できるんじゃないか?」
さぁ、やってみよう
ということで、今回、nano Banana Proを使い、「筋肉系エンジニアリング」をテーマにした漫画を、AI画像生成だけで創作してみたいと思います。
(最初は『ダンベルで始める機械学習』というテーマで始めましたが、難しすぎてやめました。期待していたファンの皆さま、申し訳ありません。國田先生の次回作にご期待ください。)
方法
今回の手順はざっくり次の2ステップです。
① キャラクターの定義
キャラクターの画像をnano Banana Proにアップロードし、テキストベースでキャラクターを定義させます。
具体的には、キャラクターの外見的特徴を単語で列挙させ、この特徴を厳密に守るようにAIに指示します。
② 1ページずつ漫画として生成する
先ほどのキャラの外見的特徴および漫画の構成をプロンプトベースで指示し、1ページずつ画像を生成していきます。
これをひたすら繰り返し、それなりにボリュームのある漫画の完成を目指します。
結果
では、早速、今回生成した漫画をご覧ください。
今回は、悩める若手エンジニア・田中(仮名)を、筋肉系エンジニア・クニタが熱く指導するハートウォーミングなストーリーを描いてみました。
いかがでしたでしょうか?
多少、文字の乱れや構成のおかしな部分はあるものの、それなりに読める漫画として仕上がっている印象ですよね?
ここからは考察と言いますか、作ってみた感想をQ&A形式でまとめます。
感想(Q&A)
Q. 全体としてどれくらい時間がかかったの?
2時間くらいです。
どちらかと言えば、時間がかかったのは、画像生成そのものよりも、漫画用プロンプトの構成でした。
以下のように、単純に「漫画を描いて」と指示するだけでも、それっぽい画像は出ます。
ただ、コマ割りや話の構成までそれなりにコントロールしようとすると、
- 何コマにするか
- どう分割するか
- 各コマには誰を出すか
- セリフは何にするか
といった指定が必要になります。
AIエンジニア目線で言うと、これはわりと典型的で、「要求仕様をどう言語化するか?」 が支配的になります。
このあたりを組み立てるところで、想像していた以上に時間を取られました。
Q. 生成は1テイクでいけた?
いえ、1テイクではないです。
テキストベースの画像生成AIの宿命でもありますが、想像通りに上手くいくケースは稀ですし、ミスも起こします。
ミスの内容で多いのは、やはり日本語テキストの破綻ですね。
nano Banana Proは割と安定しているのですが、それでも、吹き出しの中が読めない文字になっているケースがたまにあり、その場合は画像の生成を最初からやり直しています。
次に多いのは、登場人物の破綻です。
1枚のページの中だけを見ると、1コマ目から最後のコマまで同じ人物を維持する力はかなり高いです。
しかし、ページをまたぐと、直前ページまでの人物と比べて 顔の特徴や服装、筋肉量が変わってしまうことがありました。
「服装を直して」と追加プロンプトを投げれば修正されるケースもありますが、
破綻の仕方によってはページ丸ごと作り直した方が早いこともあります。
それでも、やり直し回数は1ページあたり最大4回程度でした。
中には1回で理想通りのページもあり、全体としては「意外と簡単にできた」という印象です。
※ちなみに、上に挙げた漫画も後で見返してみると、服装が直前と異なっていたり、セリフが微妙に間違っているページがあります。
(作成時に全く気づかなかったという痛恨のミス!)
Q. AIエンジニア的に、一番のボトルネックはどこ?
一番のボトルネックは、画像生成そのものではなく、漫画の仕様化(設計)でした。
漫画を画像生成AIで描かせるには「面白い漫画を描いて」という指示だけでは成立せず、
- 情報の出し方(読者がいつ何を知るか)
- 会話の流れ
- 視線誘導(コマ順)
- オチの配置
が必要になります。
ここはモデルの能力というより、
人間側が「何を作りたいか?」「きちんと言語化できているか?」の勝負になったと感じています。
今回、この構成やセリフのアイデア出しもある程度LLMに手伝ってもらいました。
(一部、バグ修正と関係ない筋トレ用語が混じりまくっているのはそのためです。用法的には間違っているとも言えるのですが、個人的にツボだったので、LLMに「最高のアイデアだぜ」「もっとやれ」などと要求を繰り返し、この顛末に至りました。反省はしていますが、後悔はしていません。)
Q. Nano Banana Proの「漫画制作」適性はどう評価する?
結論から言うと、短編漫画であれば適正ありです。
もちろん完璧ではありませんが、
- 1ページ内の登場人物の維持
- それっぽい漫画表現(コマ割り・吹き出し)
- 指示した雰囲気の反映
は、想像以上に強いと感じました。
一方で課題としては、
- 日本語テキストが崩れることがある
- ページをまたぐと人物がブレることがある
この2点は、現時点では、プロンプトの工夫ではどうしようもないため、「運用でカバーする部分かな?」と思います。
今回は、「AIのみ」という方法にこだわりましたが、実際に作るとするのであれば、吹き出しやセリフは手作業で入れてしまっても問題ないように思います。それに、入力もテキストプロンプトベースで指示していますので、ある程度コマ割りやネームを描けるのであれば、リファレンスとして画像を渡した方が追従性は上がるかも知れません。
「AIと人間の協業」という視点で考えると、実用寄りのアイデアではないかな、と思います。
まとめ
いかがでしたか?今回は Nano Banana Pro を使って、
「筋肉系エンジニアリング」をテーマにした漫画を、AI画像生成だけで作ってみました。
やってみて分かったのは、
- 絵はAIが作れる
- でも、漫画を成立させるのは人間の設計力
ということです。
それにしても、画像生成AIは「絵を描かせる」よりも、要件を言葉にして、期待する出力に寄せる工程が面白い領域になってきていますね。ページ間の人物ブレをもう少し抑えるために、キャラ仕様の持ち方(固定情報の書き方)なども色々検討してみても良いかも知れません。
そして、もっと長いページの漫画を描いてみたいですね。
先輩社員にも、いつかはこう言われたいものです。
"國田くん......本当に出版したんだね"
その日が来るまでは、まずコツコツと筋トレをして研鑽を積み上げていこうと思います。
ではまた!

















