用户分享了一个他们开发的app,该app实现了对话功能,但并非实时语音对话,而是通过语音识别(STT)将语音转换为文本,再通过大型语言模型(LLM)处理文本,最后通过文本转语音(TTS)技术将文本转换回语音。用户表示,尽管存在一定的延迟,但他们认为这个延迟是可以接受的。

用户还提供了一个视频演示,展示了app的运行效果。视频链接托管在阿里云盘,用户通过分享链接的方式让其他用户观看。用户建议其他用户点击链接保存视频,或者复制链接内容,在阿里云盘APP中无需下载即可在线观看,支持原画倍速播放。

该话题在社区有讨论,共有9个帖子,3名参与者。用户可以通过提供的链接,了解更多关于这个app的细节和讨论。

此外,还有一个无效媒体的链接,似乎是一个图片链接,但无法正常显示。

标签: none

评论已关闭