同じキャラが描けないAIに、アニメの「設定資料」を作らせた話

俺は自分のRPG（rpgdev）のキャラを、全部AIに描かせてる。ドット絵の勇者、火・水・風・土の精霊、敵のモンスター。一枚一枚、生成して、透過して、ゲームに入れてきた。

で、ずっと引っかかってた問題がある。AIは、同じキャラを描き続けるのが苦手だ。

一枚、いい感じのキャラが描けたとする。それを「同じキャラのまま、向きだけ横にして」とか「ダメージを受けた版にして」と頼む。すると——別人になる、とまでは言わないが、髪型が少し変わる。色がずれる。装備が増えたり減ったりする。輪郭の太さが変わる。一枚ずつ見れば悪くないのに、並べると「同じキャラ」に見えない。

一枚絵を編集してバリエーションを増やす、というやり方は、一貫性の面で信用できなかった。

ちなみに前に書いたターミナルをRPGにした話で、このドット絵の差分作りに手こずって、32GBのグラボを発注して「再戦する」と書いた。これはその再戦の記録でもある。

アニメや漫画の現場は、どうやって揃えてるのか

考えた。プロのアニメーターや漫画家は、毎カット・毎話で同じキャラを、どうやって揃えてるのか。

答えは知ってる。**キャラクター設定資料（モデルシート）**だ。正面・斜め・横・後ろのターンアラウンド、表情のパターン、いくつかのポーズ。一枚にまとめた「このキャラはこう描く」という基準表。現場の全員が、これを見ながら描く。だから何百カットでも同じキャラでいられる。

だったらAIにも同じことをさせればいい。一枚絵を直し続けるんじゃなくて、先に設定資料を一枚作って、それを基準に以降を生成する。 発想自体は単純だ。

問題は、その設定資料を、AI自身にどう作らせるか、だった。

設定資料の作り方に、肝がある

素直にやると、こうなる。「正面を描いて」「次は横向き」「次は後ろ姿」「次は笑った顔」——とカットを一枚ずつ別々に生成する。

これだと、結局さっきと同じだ。カットごとにキャラがブレる。設定資料の中で別人になる。 基準を作るための資料が、基準になってない。本末転倒だ。

そこで考えたのが、二段構えだった。

一段目。全アングル・全表情・全ポーズを、一回の生成でまとめて一枚に描かせる。 バラバラに頼まない。「ターンアラウンドと表情とポーズが並んだ設定資料を、一枚で」と一発で出させる。一枚の絵として同時に描かれるから、その中では互いに整合する。正面と後ろ姿が、ちゃんと同じ髪型・同じ衣装になる。これが「一貫性の基準（アンカー）」になる。

一発でまとめて描かせた基準シート

ただ、一枚に詰め込むと、一カットあたりが小さくて粗い。ゲームに使うには解像度が足りない。

だから二段目。その"まとめ描き"のシートを、今度は「お手本」としてAIに渡し直す。 そして各カットを一枚ずつ、高解像度で描き直させる。「このお手本に写ってるキャラのまま、この一カットだけを大きく描いて」と。

お手本があるから一貫性は保たれる。一枚ずつ描かせるから解像度も出る。一貫性は基準シートから、解像度は個別生成から。両取りだ。 この二段構えは自分で設計して指示した。

出来上がりがこれ。上に基準シート、その下に高解像度で描き直したターンアラウンド・表情・アクション・別衣装・ちびキャラ・装備、最後に抽出した配色まで。全部、同じキャラだ。

各カットを基準シートから描き直した設定資料

水の精霊。表情も、走りも跳躍も、騎士鎧もドレスも、全部同じ一人として並んでる。

おまけ：設定資料が、次の量産の燃料になる

二段目で出来た高解像度のカット群には、もう一つ使い道がある。

そのまま「このキャラ専用の学習データ」になる。同じキャラを十数枚、いろんな角度・表情で持ってる状態だ。これをAIに学習させて「このキャラを覚えた小さな追加モデル」を作れば、設定資料に無いポーズでも、そのキャラのまま新規に量産できるようになる。

設定資料を作る工程が、そのまま次の量産の燃料を兼ねてる。狙ってこうした。

痛みを「関門」に変える

ここまでが軸。あとはツールの中身の話を少しだけ。

rpgdevのアセット作りで、細かい痛みを山ほど踏んできた。それを一つずつ、ツールに「絶対ルール（関門）」として焼き込んである。

透過の黒漏れ：腕とリボンの隙間みたいな「閉じた黒」が、単純な背景抜きだと残る。採用した一枚に黒が20万px以上残ってたこともあった。→ 四隅がちゃんと透過してなければ、出荷前に弾く。
ダメージ版のズレ：「ダメージを受けた版」が再生成のたびに数pxずれて、ゲーム内でベースと重ならず、配置が崩れる。→ ベースと1px以内で一致してなければ弾く。
画風のドリフト：レトロなドット絵を指定する必須の語句を抜くと、艶のあるアニメ調にぬるっと滑り落ちる。→ その語句を自動で注入する。
手作業は効かない：布や肌や輪郭を手で描き足して直す、の成功率はゼロだった。→ 手描き機能は持たない。直すなら再生成。

壊れたアセットが黙ってゲームに紛れ込まない。関門で止まる。

そして、人間が操作する画面（WebUI）と、AI（Claude や Codex）が叩く窓口（MCP）の、どっちから来ても同じ処理を通るように作ってある。だからどっちの顔から入っても、この関門は迂回できない。

32GBで、ようやく動いた

#30で、自作の差分ツールが手元の16GBのグラボで回らなくて、32GBを発注して「再戦する」と書いた。

このツールが使う編集モデルは、VRAMを20GB以上ごっそり食う。16GBには全然収まらなくて、本当に1枚も出なかった。32GBに積み替えて、ようやく動いた。ここはVRAMが足りなければ、それまでだ。

その上で、本体の作りはこうしてある。重い生成は、その32GBを積んだ一台（ComfyUIのGPU機）が丸ごと引き受ける。本体は「何を、どの順で作るか」の指揮と、さっきの関門の判定に徹する、薄い指揮役だ。生成する一台さえ立てておけば、指揮はMacからでもWSLからでも繋がる。

CUDAのGPUとComfyUI一式が要る、土台のいるツールだ。二段構えという考え方自体は、ツールに依らない。同じキャラが揃わなくて困ってるなら、そこだけ持っていっても効く。

おわりに

sprite-forge。テキストから、透過済みのゲーム用キャラを作る。発想を打てば素体が出て、設定資料が組み上がり、そのキャラの学習データまで揃う。人間でもAIエージェントでも、同じ関門を通って同じものが出る。

リポジトリは github.com/kitepon-rgb/sprite-forge-mcp。MIT。

一枚絵を直し続けるのをやめて、設定資料から作るようにした。同じキャラが、やっと同じキャラのまま並ぶようになった。