GoSubTTS:一款集成配音生成与字幕提取的桌面应用程序
我最近发现了一款非常实用的桌面应用程序,名为GoSubTTS,它集成了配音生成和字幕提取功能,无需额外配置即可下载使用,操作极为简单。这款应用程序是用Wails开发的,它利用了edgetts进行配音生成,以及ffmpeg和whisper.cpp进行字幕提取。所有插件都打包进了可执行文件中,下载后即可直接使用。
对于macOS用户来说,它支持Metal硬件加速(适用于M1、M2和M3处理器),能够通过GPU加速处理,例如使用large-v3-turbo模型提取大约30分钟的音频仅需5分钟左右。Windows用户同样可以享受CPU和GPU加速,不过GPU加速目前仅支持NVIDIA系列显卡,配置简单,无需额外下载内容。
除了需要下载Whisper模型外,其他所有组件都已打包完毕。macOS版本的可执行文件仅40MB,而Windows版本由于包含GPU加速相关内容,大小约为320MB。
Whisper模型可以在以下链接下载:huggingface.co。该应用程序致力于通过开源和开放科学推动人工智能的进步和民主化。
评论已关闭