今天教大家如何训练自己的语音模型,文本转成自己的语音,克隆自己的声音。让生成的效果更自然,更像自己的声音。此教程适合新手没有编程经验的朋友。
1.首先打开百度Ai飞桨PaddleSpeech网址,
注册、实名认证
https://aistudio.baidu.com/aistudio/projectdetail/5003396
2.点击下图的【运行一下】
![图片[1] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/25c1063021155814.png-water.jpg)
3.点击【启动环境】,会弹出选择框,必须使用GPU环境,建议使用 32G的GPU环境运行,下图红框的三个都可以,我选择的是第一个。1.0点/小时
![图片[2] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/6efad59494160329.png-water.jpg)
4.进入环境
![图片[3] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/fc70f62711160708.png-water.jpg)
5.下拉找到【安装试验所需环境】这个目录
然后点击箭头这个按钮进行环境安装。
![图片[4] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/a42378e309160804.png-water.jpg)
等待一两分钟即可。完成后会显示:运行时长、结束时间。
运行完成才能操作。
![图片[5] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/3852e24048161153.png-water.jpg)
每次启动都是需要先运行一次的。
6.双击左侧文件列表的untitled.streamlit.py
,然后点击浏览器打开
![图片[6] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/2b5f51f0ec163216.png-water.jpg)
7.用手机或者软件录制至少五段自己的语音。需要没有杂音,声音清晰。
我用的手机录的视频,用格式工厂转wav格式音频上传的。
![图片[7] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/09fd3d257d161757.png-water.jpg)
8.点击【效验数据】,如果效验有问题,就替换声音,重新录
![图片[8] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/5020e8561b161857.png-water.jpg)
9.训练步数,文档有详细的说明,按照说明操作即可
训练完成后可以选择导出下载生成的声音模型。
![图片[9] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/35e0120492162312.png-water.jpg)
10.生成语音
输入文本后【合成】
![图片[10] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/a2fdc18f49162703.png-water.jpg)
如果需要帧级别调整音素长度进行语音合成,需要点击fun_exp1.streamlit.py
文件进去修改
![图片[11] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/9ef47ef8df162524.png-water.jpg)
点击【生成Suration】按钮
![图片[12] | 训练自己的语音模型,克隆自己的声音,文本转成自己的语音 | 泰普及blog](https://img.77nn.net/2023/04/504b515b3d162843.png-water.jpg)
其他详细说明看看里面的文档吧。
© 版权声明
THE END
暂无评论内容