本地视频生成大模型

发布时间:2026/7/3 17:45:15
本地视频生成大模型 研究了近两个月的本地部署大模型视频生成最终锁定的消费级显卡能跑的两大最新的大模型ltx 2.3和wan2.2。Ltx 2.3的优点就是音画同步生成不需要后期的对口型配音它的缺点就是人脸大幅度运动的时候会出现漂移变脸面部表情不够细腻丝滑。Wan2.2的优点就是面部表情生动画质比lts 2.3好那么一些缺点也很明显没有音画同步后期还需要配音对口型另外速度也慢几倍。最终下来目前为止最靠谱的办法2条线生产线1、单独使用用ltx 2.3的魔改版Sulphur2用首尾帧控制人脸的漂移变形。2、利用wan2.2的魔改版的SkyReels-V3音画同步功能结合wan2.2的画质细腻特点共组一个工作流。