From d98aa500854352184782f983ed318d5fba17390f Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E5=8C=97=E5=BF=B5?= Date: Thu, 27 Jun 2024 20:51:39 +0800 Subject: [PATCH] update --- README.md | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/README.md b/README.md index 99285fe..e3f9d07 100644 --- a/README.md +++ b/README.md @@ -64,10 +64,10 @@ SenseVoice多语言音频理解模型,支持语音识别、语种识别、语

SenseVoice-Small是基于非自回归端到端框架模型,为了指定任务,我们在语音特征前添加四个嵌入作为输入传递给编码器: -- :用于预测音频语种标签。 -- :用于预测音频情感标签。 -- :用于预测音频包含的事件标签。 -- :用于指定识别输出文本是否进行逆文本正则化。 +- LID:用于预测音频语种标签。 +- SER:用于预测音频情感标签。 +- AED:用于预测音频包含的事件标签。 +- ITN:用于指定识别输出文本是否进行逆文本正则化。 # 用法