diff --git a/README.md b/README.md index abf6f80..6da4ef2 100644 --- a/README.md +++ b/README.md @@ -63,10 +63,13 @@ SenseVoice多语言音频理解模型,支持语音识别、语种识别、语 SenseVoice模型结构

+SenseVoice-Small是基于非自回归端到端框架模型,为了指定任务,我们在语音特征前添加四个嵌入作为输入传递给编码器: +- :用于预测音频语种标签。 +- :用于预测音频情感标签。 +- :用于预测音频包含的事件标签。 +- :用于指定识别输出文本是否进行逆文本正则化。 -# 用法 - # 用法 ## 推理