面壁智能开源了VoxCPM 1.5语音生成AI模型,这个模型在保持高采样音频克隆的同时,生成效率翻倍,并且模型大小仅为0.5b。用户在Hugging Face上测试后反馈说,它的表现非常出色,甚至可以媲美mininax收费模型。考虑到这一成果,有人开始考虑更换自己的显卡以获得更好的性能。尽管这个新闻已经发布了一段时间,似乎并没有引起太多关注。这可能是由于TTS模型在当前技术圈中的热度不高。不过,对于语音生成AI技术的爱好者来说,这是一个值得关注的开源项目。

标签: none

评论已关闭