【数字人】阿里万相Wan：S2V——首个开源的音频生成视频的模型

作者：李前南发布日期： 2025年8月27日

这是阿里在今天（2025年8月27日）开源的另外一个数字人的分支。

S2V，它应该是至今全世界首创的只需要音频就可以自己驱动生成数字人视频的人工智能模型。在ComfyUI平台上，在搭建好的工作流上，我只给了它一段音频，然后给它一句提示词：一位女士在说话。

结果，就生成了这个数字人视频了。