AI教程18 分钟

AI儿童绘本怎么做:2026年从角色一致性到KDP发布的实战决策指南

不是所有 AI 儿童绘本项目都该用同一套流程。本文把需求拆成定制礼物、单本试水 KDP、系列化生产 3 条路线,结合 2026-03-18 官方资料更新 Midjourney V7、GPT Image 与 KDP 发布规则。

Nano Banana Pro

4K图像官方2折

Google Gemini 3 Pro Image · AI图像生成

已服务 10万+ 开发者
$0.24/张
$0.05/张
限时特惠·企业级稳定·支付宝/微信支付
Gemini 3
原生模型
国内直连
20ms延迟
4K超清
2048px
30s出图
极速响应
老张
老张·AI 绘本工作流研究员

如果你只是想给孩子做一本生日礼物型绘本, 最重要的通常不是追求“最强模型”, 而是用一条当天能完成、 允许手动修图、 不会把自己拖进发布细节的轻量流程。 如果你想把作品挂到 Amazon KDP, 真正容易翻车的地方也常常不是故事本身, 而是角色一致性是否足够稳、 固定版式文件怎么交、 AI 内容要不要披露、 以及打印成本会不会把定价空间吃掉。

这也是为什么我不准备再写一篇“从故事到插画再到出版”的平均化教程。 2026 年继续这样写, 读者看完往往知道了很多工具名, 却仍然不知道自己下一步该做什么。 本文直接把 AI 儿童绘本拆成 3 条真实路线: 送礼或亲子定制、 单本试水 KDP、 以及长期做系列化内容。 你先选路线, 再选工具, 最后才决定要不要进入 KDP。

AI儿童绘本三路径决策封面图

TL;DR

  • 如果你的目标是给孩子做一本定制礼物, 先走轻量路线, 优先考虑“参考图 + 手动微调”的工作流, 不要一开始就把自己拉进 KDP 规范。
  • 如果你的目标是试水上架, 最好把“单本能否稳定发布”当成第一目标, 而不是先幻想批量变现。 KDP 现在要求披露 AI-generated 内容, 且封面与内页图也算在内(KDP Content Guidelines, 2026-03-18)。
  • Midjourney 当前默认主版本仍是 V7, 角色/物体参考的官方入口是 Omni Reference, 兼容 V7, 但会额外消耗 2x GPU 时间(Midjourney Version; Midjourney Omni Reference, 2026-03-18)。
  • gpt-image-1 现在更适合被理解为“参考图编辑链路”而不是神秘的一致性黑箱。 它支持一张或多张参考图, 并支持 high input fidelity(OpenAI Image Generation Guide, 2026-03-18)。
  • 这篇文章最重要的结论不是哪家第一, 而是: 先判断你做的是礼物、 上架试水, 还是系列化生产; 选错路线, 比选错模型更容易返工。

为什么 2026 年不能再把 AI 儿童绘本写成一条线性流程

过去把 AI 儿童绘本写成“先写故事、 再画插图、 再排版、 再出版”的线性教程, 在启蒙阶段是有用的。 但到了 2026 年, 这种写法已经不够了。 因为读者真正需要的, 不是再被提醒一遍流程顺序, 而是先判断自己到底在做哪种项目。

同样叫“做一本 AI 绘本”, 礼物型项目看重的是情感匹配和成品速度, 试水 KDP 的项目看重的是可发布性, 系列化生产看重的是角色资产复用。 如果这三类需求仍被塞进同一个模板, 文章就很容易看起来很全, 但实际没有帮人做决定。

再加上当前规则环境也已经变了。 角色一致性不能继续沿用旧版本说法, 固定版式文件也不能继续照搬旧格式, 发布端还多了 AI 披露、 ISBN、 版税公式这些现实约束。 所以后面的内容不会按“万能流程”展开, 而是按真实目标来拆。

先选路线:你要的是礼物、试水,还是系列化生产?

多数 AI 儿童绘本文章最大的问题, 不是信息太少, 而是默认所有读者都在做同一件事。 但现实里完全不是这样。 给孩子做一本专属睡前故事的人, 和准备把作品放上 Amazon KDP 的独立作者, 以及想连续做十几本角色系列的人, 面临的是三套完全不同的约束。

如果你不先把目标讲清楚, 后面的工具对比几乎都会失真。 因为同样是“角色一致性”, 礼物型项目只需要 10 到 16 页里别明显漂掉, 而系列化项目需要你在多册内容里维持角色资产稳定。 同样是“出版”, 有的人只需要 PDF 能打印, 有的人却必须处理 ISBN、 固定版式、 AI 披露、 预览与定价。

所以本文的核心建议很简单: 先选路线, 再选工具。 你真正该比较的不是“哪个模型最聪明”, 而是哪条生产路线最符合你对速度、 一致性、 商业化和返工风险的容忍度。

AI儿童绘本三路径选择矩阵图

路线最适合谁推荐工具链人工介入发布门槛不适合的情况
路线 A 定制礼物家长、送礼者、老师做课堂材料大模型写故事 + 参考图出图 + Canva 排版中等你需要稳定商用发布或长期系列化
路线 B KDP试水想先上 1 本看看市场反馈的人故事脚本 + 稳定出图 + print PDF / fixed-layout eBook 准备 + KDP 后台中高中高你还没准备好处理 AI 披露、ISBN 与定价
路线 C 系列化生产想做角色 IP、目录化内容、持续上新角色 bible + gold master + 参考图/资产库 + 批量排版流程你只是想尽快做一本给孩子看

如果你还没有明确方向, 一个很实用的判断方法是看“返工的代价”。 礼物型项目的返工代价, 通常只是你多花一点时间重画两页。 KDP 试水的返工代价, 是文件重做、 预览重来、 定价重算, 甚至整本重新上传。 系列化生产的返工代价更高, 因为一旦角色设定没有锁住, 你后面做的所有页面都会一起漂。

路线 A:送礼或亲子定制,怎样在 1 天内做出能读的成品

如果你的目标只是做一本送给孩子的故事书, 我更建议你把“读起来顺、 角色像同一个人、 打印出来像一本完整作品”当成成功标准, 而不是一开始就追求标准出版流程。 这一类项目最大的价值是情感匹配, 比如主角像孩子本人、 场景来自家庭日常、 故事里有孩子熟悉的玩具或口头禅。 这时你真正需要的是可编辑性和回改速度, 不是复杂的后台规则。

在这条路线里, 图像模型最好承担“把角色放进场景”的工作, 而不是替你决定整本书该怎么做。 如果你手里已经有孩子的参考照片、 喜欢的服装图或者一张满意的人物底图, gpt-image-1 这类参考图编辑链路往往更顺手, 因为它支持一张或多张参考图, 并支持 high input fidelity(OpenAI Image Generation Guide, 2026-03-18)。 如果只是按方图粗估, gpt-image-1 的图像输出成本约为 0.01 / 0.04 / 0.17 美元 (low / medium / high)(OpenAI Pricing, 2026-03-18)。 这不代表一本书一定只花这些钱, 但至少你能用“每次重生一张图的成本”去算, 而不是被“整本只要几美元”的宣传话术带偏。

这条路线最实用的工作流通常是 4 步。 先让大模型写 8 到 16 页的故事脚本, 每页只保留一句到两句正文和一段画面描述; 再先做一张主角的基准图; 然后围绕那张图逐页扩场景; 最后再进 Canva 或其他排版工具把图片和文字压到页面里。 你会发现真正节省时间的不是“自动一键生成全书”, 而是尽量减少整本一起返工的机会。

如果你是第一次做, 不要急着做复杂世界观。 儿童礼物型绘本最容易成功的题材, 通常是孩子自己就能理解的熟悉场景: 上学、 海边、 动物园、 生日、 和爷爷奶奶的视频通话, 或者一场很小但很具体的冒险。 题材越贴近孩子本人, 对角色一致性的绝对要求反而越容易被满足, 因为读者会更关注“这是他/她的故事”, 而不是每一页都像艺术设定集。

如果你后面想把这种参考图工作流再往深一点做, 可以继续看 GPT Image 1 完整指南

路线 B:单本试水 KDP,最小可发布工作流是什么

当你的目标从“做一本能送人的书”变成“做一本能上架的书”, 工作重点就会立刻变化。 这时你不再只是追求故事完整, 而是必须把排版、 文件格式、 元数据、 预览和定价一起考虑进去。 很多旧教程把这一步写得过于轻松, 好像上传 PDF 就算结束, 但对第一次试水 KDP 的人来说, 最小可发布工作流其实应该比“从零做一本礼物书”更克制。

我通常建议第一次试水的人把目标缩到最小。 不要同时做 paperback、 hardcover、 eBook 三个版本, 也不要一开始就做 24 页以上的大项目。 你需要验证的是: 你的故事长度是否适配这个年龄段, 你的画面和文字是否能稳定通过预览, 以及你的定价是否还有利润空间。 纸质版版税不是固定“每本赚几美元”, 而是按 (royalty rate x list price) - printing costs 计算, 当前 paperback 会按市场与价格区间走 50% 或 60% 版税(KDP Paperback Royalty, 2026-03-18)。 这意味着你真正要算的不是“理想销量”, 而是打印成本会不会吃掉你原本设想的价格带。

对试水型项目来说, 最稳的思路通常不是把模型堆满, 而是先做一本可以顺利发布的短书。 故事脚本尽量简单, 人物设定尽量集中, 页面风格尽量统一, 并且给每一页预留足够留白, 避免后期为了塞字而重做整张图。 如果你还在纠结到底该先把故事写长一点还是先把文件交出去, 我的建议是: 先把可发布性做稳, 再谈扩页。

这一条路线也最容易被“变现幻想”误导。 一本新绘本真正稀缺的不是上架本身, 而是你是否能连续做出第二本、 第三本, 以及是否能从第一本里学到足够清晰的反馈。 所以路线 B 的目标不应该是“马上做成被动收入”, 而应该是用最小投入跑通一次真实发布, 验证你的题材、 工作流和返工成本。

路线 C:想做系列化内容,先把角色资产库搭起来

如果你想做的不只是一本, 而是会反复出现同一批角色的系列绘本, 那么你最该投入的就不是“多找几个画图工具”, 而是角色资产管理。 没有资产库的系列化生产, 本质上仍然是在每一页重新碰运气。 一开始也许能靠提示词和参考图顶住, 但只要你开始做不同角度、 不同服装、 不同情绪、 不同场景, 漂移就会越来越明显。

所谓角色资产库, 至少应该包含 4 类东西。 第一类是角色 bible, 也就是角色的文字设定标准件: 年龄、 脸型、 发型、 眼睛颜色、 衣服、 鞋子、 配件、 不能变的视觉锚点。 第二类是 gold master, 也就是你真正决定“这个角色长什么样”的几张母图, 最好至少有正面、 3/4 视角和近景表情基准。 第三类是姿势和情绪资产, 例如跑、 坐、 挥手、 惊讶、 沮丧、 大笑。 第四类才是场景资产, 比如固定房间、 教室、 森林、 卧室、 交通工具。

一旦你把这些资产先搭出来, 后面每一页的工作就不再是“重新创造角色”, 而是“把角色调入场景”。 这个顺序会直接决定你的返工量。 很多人做系列绘本失败, 不是因为模型不行, 而是因为他们把 gold master 放在了第十页之后才想起来做。 等到那时, 前面几页已经是不同版本的角色了。

如果你准备长期做系列内容, 还要尽早把文件命名和页面组织方式标准化。 比如把角色母图、 场景母图、 封面元素、 页码草稿分开存放, 并在每一页记录“用了哪张角色参考”。 这听起来像制作管理而不是写故事, 但它恰恰是 AI 时代把绘本从“实验作品”变成“可持续生产”的关键。

角色一致性现在到底怎么做:Midjourney V7、GPT Image 与专用绘本平台怎么选

这里最容易被旧教程误导。 如果你还把 Midjourney V7 的主流程理解成 --cref, 或者把 GPT Image 描述成某种自动记住角色的黑箱, 你拿到的很可能不是稳定工作流, 而是对旧版本或二手教程的延续。

先看 Midjourney。 当前默认主版本仍是 V7(Midjourney Version, 2026-03-18), 而 Omni Reference 兼容 V7, 可以把角色、 物体或非人类生物从参考图带进新画面, 但结果会额外消耗 2x GPU 时间(Midjourney Omni Reference, 2026-03-18)。 这条路线的优势, 是画面审美和风格表现仍然很强, 非常适合需要统一艺术风格的项目; 它的弱点, 是你最好已经知道自己想要什么, 而且能接受在网页端或工作区里做更多人工筛选。

再看 OpenAI 的图像链路。 gpt-image-1 的真正强项不是一句“角色一致性更好”, 而是它对文字指令和参考图编辑的配合更自然。 如果你要做的是: “保留这个角色的脸和衣服, 但把他从卧室移到海边, 同时改成黄昏光线”, 那么参考图编辑链路通常会更直接。 官方文档已经明确, 它支持一张或多张参考图, 并支持 high input fidelity(OpenAI Image Generation Guide, 2026-03-18)。 这使它在礼物型项目、 局部修图、 以及需要 API 化串联工作流的场景里非常有吸引力。

第三类是专用绘本平台。 如果你不想自己维护参考图、 角色 bible、 页码结构, 而更想要一个“角色锁定 + 页面生成 + 简化导出”的封装环境, 专用绘本平台会比通用图像模型更轻松。 它们的代价通常也很明确: 风格自由度较低, 输出和后续排版的自由度也未必和你想象中一样高。 所以我更愿意把它们定义成“降低生产摩擦”的工具, 而不是所有场景下的最优解。

方案更适合什么项目最大优势最大限制
Midjourney V7 + Omni Reference需要统一审美风格的绘本风格表现强,成图气质稳参考链路与返工成本更依赖人工筛选
GPT Image 参考图编辑礼物定制、局部修图、自动化工作流文本理解强,参考图编辑自然需要你自己管理页面一致性纪律
专用绘本平台新手、课堂、快速试样工作流封装好,上手门槛低自定义空间和后续自由度可能偏弱

如果你还没想明白自己到底该停留在“参考图层”还是要升级到更受控的角色资产工作流, 可以继续看 AI绘画角色一致性怎么做。 如果你要把 Midjourney 接到后续自动化链路里, 再去看 Midjourney API 指南 会更合适。

排版与文件别走回旧教程:儿童绘本的输出格式已经变了

旧教程最常见的坑, 是把 2024 年甚至更早的儿童绘本输出方式直接搬到现在。 但如果你准备走 KDP, 你至少应该知道两件已经发生的变化。 第一, KDP 自 2025-03-18 起不再接受 fixed-layout MOBI, 后续应该用 EPUBKPF 等当前支持的格式(KDP MOBI Support FAQ, 2026-03-18)。 第二, KDP 的儿童书准备页依然把 Kindle Kids' Book Creator 放在可用工具里, 且支持导入 PDF / JPG / TIFF / PNG / PPM(KDP How to publish children's books, 2026-03-18)。 这意味着你不能再简单照搬“先导出一个 MOBI 再上传”的旧做法。

对第一次做儿童绘本的人来说, 最稳的想法是把“排版”看成发布工作流的一部分, 而不是最后一步。 你在做每一页插图时, 就该决定这页文字到底放在哪里, 是否需要留白, 是否会因为文字太长导致字号失控。 如果这些问题被拖到最后, 你往往会在出图完成后, 再被迫回头改图。

我自己的经验是, 礼物型路线更适合先用最熟悉的排版工具把纸质阅读体验做顺, 而试水 KDP 的路线则应该更早确认目标版本。 你到底是先做 paperback, 还是要同步准备 fixed-layout eBook, 会直接影响你对页面比例、 文字布局和图片边缘安全区的判断。 不要等所有页面都定稿了, 才第一次去看 KDP 的预览器。

上 KDP 前必须检查的 5 件事

就算你前面的故事、 角色和排版都做得不错, 真正把 AI 儿童绘本交到 KDP 之前, 我仍然建议你把以下 5 件事逐条过一遍。 它们看起来像发布细节, 但实际上直接决定你会不会在最后一公里整本返工。

其中最容易被忽略的, 往往不是封面够不够好看, 而是你是否把“这本书到底属于 AI-generated 还是 AI-assisted” 想清楚了, 以及你有没有把打印成本和格式路径提前算进去。

KDP儿童绘本发布前五项检查图

1. 先判断你要披露什么。
KDP 当前要求披露 AI-generated 内容, 而且封面、 内页图、 翻译文本都算在内; 如果只是用 AI 做润色、 校对或辅助修改, 才属于不必披露的 AI-assisted(KDP Content Guidelines, 2026-03-18)。 这一步不能模糊带过, 因为它关系到你在后台如何如实填写。

2. 不要把 ISBN 理解成所有版本都要。
KDP 当前规则很明确: eBook 不需要 ISBN, paperback 和 hardcover 需要 ISBN (低内容书例外)(KDP Metadata Guidelines, 2026-03-18)。 这意味着如果你只是先试水电子版, 你的准备项和纸质版并不完全一样。

3. 把固定版式格式想清楚。
如果你做的是儿童绘本, 就不要再沿着旧教程去找 fixed-layout MOBI 的出口了。 那条路径已经不是当前入口(KDP MOBI Support FAQ, 2026-03-18)。 真正该确认的是: 你是先交 print PDF, 还是同步准备当前支持的 fixed-layout eBook 文件。

4. 先按公式看利润,不要先按想象看利润。
纸质版利润的关键不在于“别人卖多少钱”, 而在于你的 list price、 printing costs、 以及目标市场的 royalty rate 是怎么叠加的。 先按 KDP 的公式去反推你可接受的页数和定价区间, 再决定要不要把这本书做得更厚、 更彩或者更大。

5. 预览不是礼貌动作,而是最终质检。
儿童绘本最容易出问题的地方, 是跨页对齐、 边缘裁切、 字号偏小、 以及文字压到插图主体。 如果你把预览留到最后一分钟, 通常不是改一页, 而是会牵连整本。

常见问题 FAQ

AI 生成的儿童绘本可以直接拿去卖吗?

可以卖, 但“能卖”不等于“可以忽略规则”。 当前 KDP 已经把 AI-generatedAI-assisted 区分开来, 并要求作者对 AI 生成内容做相应披露(KDP Content Guidelines, 2026-03-18)。 另外, 版权问题也不要简单理解成“整本都自动受保护”。 美国版权局关于生成式 AI 输出可版权性的 Part 2 已于 2025-01-29 发布(U.S. Copyright Office AI, 2026-03-18)。 更稳妥的理解是: 你的人类创作部分, 例如故事构思、 页面编排、 素材选择、 修改和整本书的组织方式, 才是你真正能稳稳站住脚的价值。

第一次做 KDP 试水,应该先上纸质版还是电子版?

如果你是第一次, 通常先把一个版本做稳更重要。 很多人会本能地觉得 eBook 更轻, 但儿童绘本往往涉及固定版式和图文关系, 并不一定比 paperback 更简单。 如果你的目标是尽快验证读者体验和实际预览效果, 先把纸质版路径跑通往往更直观。 如果你的目标是降低实体打印约束, 那再考虑同步做当前支持的 fixed-layout eBook。

Midjourney 和 GPT Image 到底选哪个更适合儿童绘本?

看路线, 不要看“谁更强”。 如果你更在意统一审美风格、 能接受筛选和返工, Midjourney V7 的 Omni Reference 路线更合适。 如果你更在意参考图编辑、 局部修改、 以及和脚本或 API 工作流串联, GPT Image 会更顺手。 如果你只是想快速做一个新手级样本, 带角色锁定的专用绘本平台可能更省力。

一本儿童绘本做多少页更适合试水?

试水最怕的不是页数少, 而是一次把变量开太多。 对第一次上架的人来说, 更合理的目标通常是把结构、 角色、 留白和排版先做稳, 而不是上来就做很长的故事。 你真正要验证的是: 这套工作流能否稳定跑完一次, 而不是你能否一次性把所有想法都塞进第一本。

什么时候我应该从“单张参考图”升级到“角色资产库”?

当你发现自己开始重复做这些事时, 就该升级了: 反复让同一个角色换姿势、 换情绪、 换视角, 或者准备在第二本、 第三本里继续复用同一个主角。 如果你仍然每次都靠一句提示词加一张旧图碰运气, 你的返工会越来越多。 而一旦你把角色 bible、 gold master、 表情和姿势资产先搭好, 后面每一页都会轻松很多。

如果你现在还处在“先做一本试试”的阶段, 本文最重要的建议仍然只有一句: 不要先问哪个模型最强, 先问你要做的是礼物、 试水, 还是系列化生产。 这个顺序一旦错了, 后面几乎每一步都会变贵。

推荐阅读