This commit is contained in:
北念 2024-06-27 20:51:39 +08:00
parent a29026cee4
commit d98aa50085

View File

@ -64,10 +64,10 @@ SenseVoice多语言音频理解模型支持语音识别、语种识别、语
</p>
SenseVoice-Small是基于非自回归端到端框架模型为了指定任务我们在语音特征前添加四个嵌入作为输入传递给编码器
- <LID>:用于预测音频语种标签。
- <SER>:用于预测音频情感标签。
- <AED>:用于预测音频包含的事件标签。
- <ITN>:用于指定识别输出文本是否进行逆文本正则化。
- LID用于预测音频语种标签。
- SER用于预测音频情感标签。
- AED用于预测音频包含的事件标签。
- ITN用于指定识别输出文本是否进行逆文本正则化。
# 用法