如果您有问题或想要帮助,可以在LAION Discorde服务器上的#音频生成频道找到我们。
由Inverting Whisper构建的开源文本到语音转换系统。以前被称为spear-tts-pytorch。
我们希望这个模型类似于稳定扩散,但对于语音来说-既强大又容易定制。
我们只使用适当许可的语音录音,所有的代码都是开放源代码的,因此该模型将始终安全地用于商业应用。
目前,这些模型是在英语LibreLight数据集上进行培训的。在下一个版本中,我们希望面向多语言(Whisper和EnCodec都是多语言)。
WhisperSpeech数据统计
WhisperSpeech数据评估
关于WhisperSpeech特别声明
本站商娱网提供的WhisperSpeech都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由商娱网实际控制,在2024年1月25日 17:24收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,商娱网不承担任何责任。
暂无评论...