OpenMOSS最近发布了MOSS-Transcribe-Diarize模型,这是一个强大的工具,专门用于多人声转录制文本。这个模型能够处理最长90分钟的视频,并且能够解析视频中的不同人物声音,为每个声音分配时间戳标记。这对于制作视频字幕来说是一个巨大的帮助,因为它可以自动识别不同的说话者,并将转录内容按说话者分类。用户可以通过上传音频或视频文件来使用这个系统,系统会自动检测不同的说话者,并将转录内容按说话者组织起来。

这个模型可以在Hugging Face平台上找到在线演示,用户可以通过以下链接访问:MOSS Transcribe Diarize - a Hugging Face Space by OpenMOSS-Team。此外,MOSI网站也提供了这个模型的信息,用户可以通过以下链接访问:MOSI

MOSI Intelligence致力于构建下一代交互式AI,通过建立上下文感知的基础模型,实现通用的人机交互。这个模型是MOSI Intelligence的一部分,展示了他们在这个领域的创新和进步。

更多关于这个话题的讨论可以在平台上找到,用户可以通过以下链接:[](https:///t/topic/1421564)。

此外,还有一些与这个话题相关的图片可以在平台上找到,用户可以通过以下链接查看:imageimage

标签: none

评论已关闭