update

2024-06-27 20:46:29 +08:00 · 2024-06-27 20:46:29 +08:00 · fbe5bf1d21
commit fbe5bf1d21
parent 0652ca1af5
1 changed files with 5 additions and 2 deletions
--- a/README.md
+++ b/README.md
@ -63,10 +63,13 @@ SenseVoice多语言音频理解模型，支持语音识别、语种识别、语
 <img src="fig/sensevoice.png" alt="SenseVoice模型结构"  width="500" />
 </p>

+SenseVoice-Small是基于非自回归端到端框架模型，为了指定任务，我们在语音特征前添加四个嵌入作为输入传递给编码器：
+- <LID>：用于预测音频语种标签。
+- <SER>：用于预测音频情感标签。
+- <AED>：用于预测音频包含的事件标签。
+- <ITN>：用于指定识别输出文本是否进行逆文本正则化。


-# 用法
-
 # 用法

 ## 推理