speech-score API

有道智云语音评测中转接口。客户端上传 WAV 文件和参考文本，服务端从 .env 读取有道 YOUDAO_APP_KEY、YOUDAO_APP_SECRET，按 v2 签名规则请求有道非流式评测接口。

如果要完全按有道原始 API 字段对接，请使用 speech-assess。speech-score 保持为简化版接口。

文档说明

/api/speech-score 使用统一 HTML 容器渲染当前 Markdown 原文，并提供查看 Markdown 和复制 Markdown 按钮。演示站 /api/speech-score/demo 仍是独立交互页面。

环境变量

YOUDAO_APP_KEY=应用ID
YOUDAO_APP_SECRET=应用密钥

路由

GET  /api/speech-score
GET  /api/speech-score/health
GET  /api/speech-score/demo
POST /api/speech-score

公网地址：

https://6767.chat/api/speech-score

POST /api/speech-score

请求格式：multipart/form-data

字段	必填	说明
`audio`	是	WAV 文件，推荐 16k / 16bit / mono / PCM，最长 120 秒。
`text`	是	跟读参考文本，例如 `have a good day`。
`lang`	否	默认 `en`，中文用 `zh-CHS`。

示例：

curl -X POST "https://6767.chat/api/speech-score" \
  -F "audio=@output.wav" \
  -F "text=have a good day" \
  -F "lang=en"

成功返回：

{
  "success": true,
  "service": "speech-score",
  "provider": "youdao",
  "data": {
    "overall": 92.2,
    "integrity": 99.9,
    "fluency": 86.8,
    "pronunciation": 73.7,
    "speed": 133.3,
    "refText": "have a good day",
    "words": []
  },
  "raw": {
    "errorCode": "0"
  }
}

raw 会保留有道原始响应，便于前端读取 words、phonemes 等细粒度评分。

音频格式

有道建议：

格式：wav，非压缩 PCM
采样率：16000
位深：16bit
声道：单声道
最长：120s

转换示例：

ffmpeg -i input.mp3 -ar 16000 -ac 1 -sample_fmt s16 output.wav

演示站 /api/speech-score/demo 会在浏览器端把麦克风录音转换成 16k / 16bit / mono WAV 后再提交。

有道签名

非流式接口使用：

signType = v2
sign = sha256(appKey + input + salt + curtime + appSecret)

其中 input 由 Base64 后的音频字符串计算：

q.length <= 20 ? q : q[:10] + q.length + q[-10:]

更新日志

2026-05-20 文档页改为 Markdown 渲染

/api/speech-score 改为统一 HTML 容器渲染 docs/speech-score.md。
文档页新增查看 Markdown 和复制 Markdown 按钮。
保留 /api/speech-score/demo 演示站独立页面。

2026-05-20 初始发布

新增 /api/speech-score 有道智云语音评测中转接口。
新增 /api/speech-score/demo 浏览器录音演示站。
新增 docs/speech-score.md，记录请求参数、返回结构和签名规则。

文档说明​

环境变量​

路由​

POST /api/speech-score​

音频格式​

有道签名​

更新日志​

2026-05-20 文档页改为 Markdown 渲染​

2026-05-20 初始发布​