GPT-SoVITS V2 AI语音转换与语音合成

GPT-SoVITS 是B站UP主 花儿不哭 大佬研发的低成本AI音色克隆软件。目前只有TTS(文字转语音)功能,将来会更新变声功能。
 
GPT-SoVITS 的正确缩写应该是 GSV,请不要用 sovits 来简称它,这会让人把它和 So-VITS-SVC 搞混,两者并没有什么关系
 

 
GPT-SoVITS-V1 实现了:
由参考音频的情感、音色、语速控制合成音频的情感、音色、语速
可以少量语音微调训练,也可不训练直接推理
可以跨语种生成,即参考音频(训练集)和推理文本的语种为不同语种
 
GPT-SoVITS-V2 新增特点:
对低音质参考音频合成出来音质更好
底膜训练集增加到5k小时,zero shot 性能更好音色更像,所需数据集更少
增加韩粤两种语言,中日英韩粤5个语种均可跨语种合成
更好的文本前端:持续迭代更新。V2中英文加入多音字优化。
 
配置需求:
支持 CUDA 的 nVIDIA 显卡,每张拥有至少 6G 以上显存
Windows 10/11 系统
macOS Ventura 及以上
M系列芯片
 
官方项目地址:https://github.com/RVC-Boss/GPT-SoVITS
 
官方视频教程:https://www.bilibili.com/video/BV1GJ4m1e7x2
 
官方提供整合包网盘下载:
 
For Windows:

download
来源:123盘

 
For MAC:
download
来源:123盘

THE END