作者: | 来源:互联网 | 2023-08-14 09:54
ASR:automatic speech recognize ,语音识别技术,语音转换为文本
TTS:text to speech ,文本转语音技术
audio2face:音频转表情技术《重点*********》
其中,audio2face的代表算法有facegood
wav2lip:声音到嘴唇算法
百度安全验证https://baijiahao.baidu.com/s?id=1722621345023280547&wfr=spider&for=pc百度安全验证https://baijiahao.baidu.com/s?id=1722472024679803706&wfr=spider&for=pc
先从最简单的wav2lip研究开始:
嘴型同步模型Wav2Lip_我的个人网站: https://xugaoxiang.com-CSDN博客
ffmpeg工具windows/linux安装离线下载:Builds - CODEX FFMPEG @ gyan.devhttps://github.com/BtbN/FFmpeg-Builds/releases(需要认证,未成功)
ffmpeg linux版本下载:
Index of /releases
中文的可以使用paddle的预训练wave2lip模型:基于Wav2lip实现精准唇形合成 - 知乎