最新口型驱动语音的大模型安装技巧
发布时间:2025-03-23
付费文章:66.6元
上一篇文章介绍了:语音克隆MaskGCT-TTS
借助剪映软件生成导出克隆人声(真人人声,免VIP)_哔哩哔哩_bilibili
1年前这个技术还是付费栏目,现在很多已经开源了。
https://www.codewithgpu.com/i/open-mmlab/Amphion/MaskGCT-TTS-10G-models
接下来,很多场景需要采用语音驱动口型(示例):
早期,用wav2lip和facefusion3.xd都可以实现,但是效果嘛,能用。
https://www.codewithgpu.com/i/yeayee/facefusion/facefusion3.0-webUI
https://www.codewithgpu.com/i/yeayee/wav2lip-webui/wav2lip-webui
截至目前,已经有最新的大模型可以实现,如上视频,当然,安装过程中会有不少坑。
同样,你要免费显卡,不是不可以,但需要打赏才可以看到操作流程。
本期附送,音频转文字的大模型安装技巧。