> ## Documentation Index
> Fetch the complete documentation index at: https://docs.coze.cn/llms.txt
> Use this file to discover all available pages before exploring further.

本文档以扣子编程官方模板[漫画视频生成](https://www.coze.cn/template/project/7545769806146977830)为例，拆解视频生成工作流的核心流程和模块，演示如何通过搭建一个生成指定风格视频的低代码工作流。只需要输入一个内容主题，此工作流即可帮你生成相应漫画视频。
## 低代码工作流设计 {#9d9575f0}
<div style="text-align: center"><img src="https://p9-arcosite.byteimg.com/tos-cn-i-goo7wpa0wc/4e3e150ca4ce4c0bbe09458e0734ad1b~tplv-goo7wpa0wc-image.image" width="63216px" height="6378px" /></div>

你可以单击[漫画视频生成](https://www.coze.cn/template/project/7545769806146977830)模板中的**复制**，创建一个副本以查看完整的工作流。该工作流分为以下四个核心步骤：

1. **剧本创作**：由大模型节点创作剧本，并制作核心人物画像。
2. **（可选）设计人物形象**：为了保证各个分镜的人物形象一致性，可以专门由任务画像描述来生成一个通用可参考的人物形象图。
3. **分镜设计**：大模型根据剧本来设计分镜，详细到分镜提示词、运镜方式等。开发者可以根据业务侧对视频的质量需求自行调节分镜的设计思路与细节。
4. **视频制作**：根据分镜设计来生成分镜视频，添加旁白与字幕，并将分镜视频合成为完整的视频文件。

## 低代码工作流拆解 {#75d08f24}
本章节将分别介绍各个核心步骤的实现流程。
### 步骤一：剧本创作 {#95a2510f}
我们通过大模型节点来制作剧本，可以把大模型当作一个“实习生”，我们告诉“他”应该怎么去生成剧本，“他”就会根据我们的要求，结合输入去生成相关的剧情。只需要为模型节点设计一个剧本编辑的人设，并指定剧本的要求即可。
大模型节点的输入是用户指定的剧情主题，输出是剧本内容及核心人物的详细人设介绍。

* 剧本内容：用于后续生成分镜和视频内容
* 核心人设：用于后续生成主角形象设计概念，解决后续的人物一致性的问题。

![Image=328x347](https://p9-arcosite.byteimg.com/tos-cn-i-goo7wpa0wc/c4afade642324eba81fd3f354f6152e0~tplv-goo7wpa0wc-image.image)
### 步骤二：（可选）设计人物形象 {#c1a94c6e}
由于我们后续要用到批处理节点去批量生成视频的各个分镜片段，而大模型每次的输出总是随机的，不一定能保持主体任务的形象一致性，主角可能在不同分镜中是不同的外表和样貌。如果对任务形象一致性的要求比较高，可以添加一个设计人物形象的分支，专门生成人物形象图，供后续生成视频时参考。
任务形象的设计由批处理节点完成，此节点接收用户指定的视频模式（图解视频、漫画视频），并基于前序节点生成的核心人设生成人物形象图。其中：

* **文本处理节点**：拼接前序节点生成的核心人设和用户指定的画风。
* **图片生成节点**：生成人物形象图需要用到文生图的模型，这里我们选取的是 Seedream4.0。
* **代码节点**：用于对任务形象的数组进行数据类型转换，以便后续节点处理。

![Image=500x130](https://p9-arcosite.byteimg.com/tos-cn-i-goo7wpa0wc/7681021a727e4845adc479469049e4f7~tplv-goo7wpa0wc-image.image)
### 步骤三：分镜设计 {#15e256b5}
有了剧本之后，就可以开始制作分镜了，这里我们让模型来设计每个分镜的细节。一般分镜要求有以下几个要素：场景描述、台词、人物动作、音效说明等，本文主要是面向入门的开发者，所以简化整体流程，只需要让模型设计旁白、场景和运镜方式即可。详细的分镜设计提示词可参考模板。
大模型节点的输出我们设置为一个字符串数组，其中每个元素是一个分镜，其中包括：

* content：分镜字幕，也就是分镜画面上要显示的文案内容。
* scene：图像提示词，用于后续生成该分镜的视频片段。
* act：运镜方式，使画面更加生动逼真。

![Image=415x299](https://p9-arcosite.byteimg.com/tos-cn-i-goo7wpa0wc/2df691fc6c724fa581eac4951976b708~tplv-goo7wpa0wc-image.image)
### 步骤四：视频制作 {#03ab1a02}
分镜设计完之后，就是“拍摄”了。在 AI 生成视频的场景，我们依然需要生成旁白的音频、制作首帧图片，并且通过视频剪辑技术将视频内容与音频、首帧图合成起来。
这个环节同样由批处理节点完成，批量制作各个分镜，再将其合并为一个完整的视频即可。
![Image=724x123](https://p9-arcosite.byteimg.com/tos-cn-i-goo7wpa0wc/7c82eb3ac4084624aaf429ed165b5c81~tplv-goo7wpa0wc-image.image)
#### 生成首帧图片 {#b55c36a6}
首先，我们需要先制作首帧图片。此环节由大模型节点完成，所以生图模型的提示词至关重要。
为了保证主角人物形象的一致性，我们在步骤二中已经为每个角色设计了对应的人设参考图，后续的环节都可以参考此图片去生成。当然这里也可以通过 Seedream 模型的过拟合的特性去实现，也就是描述的人物的提示词没有变化，出来的人物图基本一致。
所以在生成首帧图片的环节，我们需要保证每个分镜的人物的描述都是一致的，那么我们就需要模型在描述分镜的时候也把人物形象也塞进去，所以，分镜设计的环节中我们输入了人物形象，让“分镜设计”的节点结合人物形象去生成分镜。
![Image=482x268](https://p9-arcosite.byteimg.com/tos-cn-i-goo7wpa0wc/8328651a32e94ef684dfddc063a91366~tplv-goo7wpa0wc-image.image)
#### 生成分镜视频 {#afdf7170}
生成首帧图之后，我们可以通过首帧图驱动分镜视频视频合成，以达到图像元素的一致性。这里我们可以选取“Seedance-lite”或者“Seedance-Pro”进行视频合成。Pro 模型的价格相对较高，但是效果更好。
需要注意的是，这个工作流支持生成两种类型的视频，我们通过工作流入参 mode 来指定视频类型：

* 1：通过图片驱动视频合成，这是直接生成的视频，流畅度和效果会更好。对应下图中 mode=1 的链路分支，也就是红框中上部的分支。此分支通过视频生成节点来生成视频。
* 其他值：PPT 视频，可以理解为不会动的图片，通过动效拼接成了视频。对应下图中 mode 为其他值的链路分支，也就是红框中靠下的分支。此分支通过视频剪辑节点来拼接图片，生成视频文件。

![Image=554x371](https://p9-arcosite.byteimg.com/tos-cn-i-goo7wpa0wc/fb94a172f4df42bc996020086ac855c7~tplv-goo7wpa0wc-image.image)
#### 生成旁白与字幕 {#3aa1381b}
直接将分镜设计中的生成的旁白进行文字转语音进行播放，这里当然可以指定特定的音色进行生成。然后通过视频剪辑插件，我们将语音添加到视频当中，并且配上字幕。核心节点如下：

* **语音合成插件节点**：将前序节点生成的字幕转为音频文件。
* **音视频合成节点**：将音频文件和制作好的分镜视频文件合并为完整的视频。
* **代码节点**：为字幕内容添加时间戳，便于添加字幕。
* **视频添加字幕节点**：为视频添加字幕。

![Image=542x199](https://p9-arcosite.byteimg.com/tos-cn-i-goo7wpa0wc/f26a6e2fdf924cbc8b7bf22bc63cbe3f~tplv-goo7wpa0wc-image.image)
#### 合成视频 {#c82ec950}
最后一步就是将前面的分镜进行合成，生成整段视频。这里我们通过**视频剪辑工具（concat_videos）​**插件实现，该插件将批处理节点制作好的分镜数组合成为一个完整的视频文件。
![Image=574x317](https://p9-arcosite.byteimg.com/tos-cn-i-goo7wpa0wc/9489cc7f7f274588b90916e348c76c52~tplv-goo7wpa0wc-image.image)
## 常见问题 {#7fc86a67}
### 如何保证人物形象的一致性？ {#a0582528}
有以下两种方式：

* **通过 Seedream 模型的过拟合的特性来保证一致性**。指的是使用统一的人物提示词，生成的人物形象通常是一致的。我们需要保证每个分镜的人物的描述都是一致的，那么我们就需要模型在描述分镜的时候也把人物形象也塞进去，所以，我们可以看到分镜设计的时候，我们输入了人物形象，让“分镜设计”的节点结合人物形象去生成分镜。
* **通过参考图来保证一致性**。先生成一张人物形象图，后续视频分镜视频中，涉及这个任务的视频都参考这张图来生成。此方式生成的任务一致性效果会更好。