跳到主要内容

speech-score API

有道智云语音评测中转接口。客户端上传 WAV 文件和参考文本,服务端从 .env 读取有道 YOUDAO_APP_KEYYOUDAO_APP_SECRET,按 v2 签名规则请求有道非流式评测接口。

如果要完全按有道原始 API 字段对接,请使用 speech-assessspeech-score 保持为简化版接口。

文档说明

/api/speech-score 使用统一 HTML 容器渲染当前 Markdown 原文,并提供查看 Markdown 和复制 Markdown 按钮。演示站 /api/speech-score/demo 仍是独立交互页面。

环境变量

YOUDAO_APP_KEY=应用ID
YOUDAO_APP_SECRET=应用密钥

路由

GET  /api/speech-score
GET /api/speech-score/health
GET /api/speech-score/demo
POST /api/speech-score

公网地址:

https://6767.chat/api/speech-score

POST /api/speech-score

请求格式:multipart/form-data

字段必填说明
audioWAV 文件,推荐 16k / 16bit / mono / PCM,最长 120 秒。
text跟读参考文本,例如 have a good day
lang默认 en,中文用 zh-CHS

示例:

curl -X POST "https://6767.chat/api/speech-score" \
-F "audio=@output.wav" \
-F "text=have a good day" \
-F "lang=en"

成功返回:

{
"success": true,
"service": "speech-score",
"provider": "youdao",
"data": {
"overall": 92.2,
"integrity": 99.9,
"fluency": 86.8,
"pronunciation": 73.7,
"speed": 133.3,
"refText": "have a good day",
"words": []
},
"raw": {
"errorCode": "0"
}
}

raw 会保留有道原始响应,便于前端读取 wordsphonemes 等细粒度评分。

音频格式

有道建议:

格式:wav,非压缩 PCM
采样率:16000
位深:16bit
声道:单声道
最长:120s

转换示例:

ffmpeg -i input.mp3 -ar 16000 -ac 1 -sample_fmt s16 output.wav

演示站 /api/speech-score/demo 会在浏览器端把麦克风录音转换成 16k / 16bit / mono WAV 后再提交。

有道签名

非流式接口使用:

signType = v2
sign = sha256(appKey + input + salt + curtime + appSecret)

其中 input 由 Base64 后的音频字符串计算:

q.length <= 20 ? q : q[:10] + q.length + q[-10:]

更新日志

2026-05-20 文档页改为 Markdown 渲染

  • /api/speech-score 改为统一 HTML 容器渲染 docs/speech-score.md
  • 文档页新增查看 Markdown 和复制 Markdown 按钮。
  • 保留 /api/speech-score/demo 演示站独立页面。

2026-05-20 初始发布

  • 新增 /api/speech-score 有道智云语音评测中转接口。
  • 新增 /api/speech-score/demo 浏览器录音演示站。
  • 新增 docs/speech-score.md,记录请求参数、返回结构和签名规则。