ComfyUI工作流原理--文生视频、图生视频

发布时间:2026/6/26 1:54:00
ComfyUI工作流原理--文生视频、图生视频 ComfyUI 的文生视频,核心思想是在文生图的基础上引入了 “时间”维度。它不再生成一张静态图片,而是一系列连贯的帧(Sequence of Frames),最终合成为视频。目前主流方案主要有两条技术路径:AnimateDiff 和 SVD (Stable Video Diffusion)。它们的核心差异如下:路径一:AnimateDiff 工作流这是最主流的方案,可以看作是在标准文生图工作流中,插入了负责“运动”的模块。核心节点与工作原理Checkpoint Loader (模型加载器):与文生图相同,加载基础大模型(如 SD 1.5),输出 MODEL 和 CLIP。CLIP Text Encode (文本编码器):将你的正面/负面提示词编码为语义向量。AnimateDiff Loader (动态加载器):这是最关键的节点。它从 Checkpoint Loader 接收基础 MODEL,并为其加载一个预训练的“运动模块”(Motion Module)。这个模块赋予了模型生成动态的能力。输出:一个“增强版”的模型,同时具备图像生成和运动生成的能力。参数:可以选择不同的运动模块版本(如 v2, v3),并调整运动幅度(Motion Scale) 来控制动态强弱。Empty Latent Image (空潜在图像):与文生图