最新口型驱动语音的大模型安装技巧

发布时间:2025-03-23 付费文章:66.6元

Base

基础知识

Civil

土木分类资料

Python

Python编程学习

Tools

自媒体效率工具

上一篇文章介绍了:语音克隆MaskGCT-TTS

 

借助剪映软件生成导出克隆人声(真人人声,免VIP)_哔哩哔哩_bilibili

1年前这个技术还是付费栏目,现在很多已经开源了。

https://www.codewithgpu.com/i/open-mmlab/Amphion/MaskGCT-TTS-10G-models

 

接下来,很多场景需要采用语音驱动口型(示例):

 早期,用wav2lip和facefusion3.xd都可以实现,但是效果嘛,能用。

https://www.codewithgpu.com/i/yeayee/facefusion/facefusion3.0-webUI

https://www.codewithgpu.com/i/yeayee/wav2lip-webui/wav2lip-webui

 

截至目前,已经有最新的大模型可以实现,如上视频,当然,安装过程中会有不少坑。

 

同样,你要免费显卡,不是不可以,但需要打赏才可以看到操作流程。

 

本期附送,音频转文字的大模型安装技巧。

 

 


如忘记保存,或后续再查看,可凭"订单号" 手动获取