Spokenly语音输入法是一款流行的语音识别工具,它支持多种API,如volcengine API和OpenAI API。然而,对于一些用户来说,他们希望Spokenly能够接入更多的语音识别服务,比如豆包(Doubao)和千问(Qwen ASR)。最近,有用户在中分享了一种方法,通过将豆包和千问的API转换成OpenAI格式,从而让Spokenly能够识别这些服务。

该用户发现,虽然Spokenly目前不支持直接接入豆包API,但可以通过一些技术手段,将豆包API的调用方式转换成Spokenly所支持的OpenAI格式。具体来说,用户需要将豆包API的文档和参数格式化,使其符合OpenAI的调用规范。然后,用户可以将这些转换后的数据发送到Spokenly,从而实现语音输入法对豆包API的识别。

此外,用户还提到了千问(Qwen ASR)API的接入。与豆包API类似,用户需要将千问API的调用方式转换成OpenAI格式,然后通过Spokenly进行识别。这个过程涉及到对API文档的详细分析和参数的转换,但一旦设置完成,用户就可以在Spokenly中同时使用豆包和千问的语音识别服务了。

用户还分享了一个具体的实现方法,即通过阿里云的百炼平台,将API的调用方式转换成OpenAI格式,并在本地部署一个Node.js服务器,使用pm2进行管理。这种方法不需要用户直接与豆包或千问API进行交互,而是通过一个中间层来进行数据转换和调用。用户表示,这种方法不仅简单易行,而且启动服务后内存占用也不大,豆包识别的速度也很快。

总的来说,通过将豆包和千问API转换成OpenAI格式,用户可以扩展Spokenly的功能,使其能够识别更多的语音服务。这种方法对于希望使用多种语音识别服务的用户来说,是一个非常有用的解决方案。

标签: none

评论已关闭