Spokenly接入豆包和千问ASR的解决方案

Spokenly语音输入法是一款流行的语音识别工具，它支持多种API，如volcengine API和OpenAI API。然而，对于一些用户来说，他们希望Spokenly能够接入更多的语音识别服务，比如豆包（Doubao）和千问（Qwen ASR）。最近，有用户在中分享了一种方法，通过将豆包和千问的API转换成OpenAI格式，从而让Spokenly能够识别这些服务。

该用户发现，虽然Spokenly目前不支持直接接入豆包API，但可以通过一些技术手段，将豆包API的调用方式转换成Spokenly所支持的OpenAI格式。具体来说，用户需要将豆包API的文档和参数格式化，使其符合OpenAI的调用规范。然后，用户可以将这些转换后的数据发送到Spokenly，从而实现语音输入法对豆包API的识别。

此外，用户还提到了千问（Qwen ASR）API的接入。与豆包API类似，用户需要将千问API的调用方式转换成OpenAI格式，然后通过Spokenly进行识别。这个过程涉及到对API文档的详细分析和参数的转换，但一旦设置完成，用户就可以在Spokenly中同时使用豆包和千问的语音识别服务了。

用户还分享了一个具体的实现方法，即通过阿里云的百炼平台，将API的调用方式转换成OpenAI格式，并在本地部署一个Node.js服务器，使用pm2进行管理。这种方法不需要用户直接与豆包或千问API进行交互，而是通过一个中间层来进行数据转换和调用。用户表示，这种方法不仅简单易行，而且启动服务后内存占用也不大，豆包识别的速度也很快。

总的来说，通过将豆包和千问API转换成OpenAI格式，用户可以扩展Spokenly的功能，使其能够识别更多的语音服务。这种方法对于希望使用多种语音识别服务的用户来说，是一个非常有用的解决方案。

Spokenly接入豆包和千问ASR的解决方案

评论已关闭