图音转视频 Wan 2.2 S2V
基础模型: Wan Video
图像
音频
提示词prompt
帧数num_frames
宽度width
高度height
使用指南
通过音频驱动图片来生成数字人视频 200 秒内生成 720-1280 的14 秒视频。
暂无返图