MOSS-Transcribe-Diarize模型发布：提升多人语音视频转录字幕效率

OpenMOSS最近发布了MOSS-Transcribe-Diarize模型，这是一个强大的工具，专门用于多人声转录制文本。这个模型能够处理最长90分钟的视频，并且能够解析视频中的不同人物声音，为每个声音分配时间戳标记。这对于制作视频字幕来说是一个巨大的帮助，因为它可以自动识别不同的说话者，并将转录内容按说话者分类。用户可以通过上传音频或视频文件来使用这个系统，系统会自动检测不同的说话者，并将转录内容按说话者组织起来。

这个模型可以在Hugging Face平台上找到在线演示，用户可以通过以下链接访问：MOSS Transcribe Diarize - a Hugging Face Space by OpenMOSS-Team。此外，MOSI网站也提供了这个模型的信息，用户可以通过以下链接访问：MOSI。

MOSI Intelligence致力于构建下一代交互式AI，通过建立上下文感知的基础模型，实现通用的人机交互。这个模型是MOSI Intelligence的一部分，展示了他们在这个领域的创新和进步。

更多关于这个话题的讨论可以在平台上找到，用户可以通过以下链接：[](https:///t/topic/1421564)。

此外，还有一些与这个话题相关的图片可以在平台上找到，用户可以通过以下链接查看：image 和 image。

MOSS-Transcribe-Diarize模型发布：提升多人语音视频转录字幕效率

评论已关闭