From a38aa58d2252d48eca64c4018db693a9cb7504f6 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E5=8C=97=E5=BF=B5?= Date: Thu, 27 Jun 2024 21:01:11 +0800 Subject: [PATCH] update --- README.md | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/README.md b/README.md index 3affa85..3ffd0b8 100644 --- a/README.md +++ b/README.md @@ -58,7 +58,7 @@ tasks: SenseVoice多语言音频理解模型,支持语音识别、语种识别、语音情感识别、声学事件检测、逆文本正则化等能力,采用工业级数十万小时的标注音频进行模型训练,保证了模型的通用识别效果。模型可以被应用于中文、粤语、英语、日语、韩语音频识别,并输出带有情感和事件的富文本转写结果。

-SenseVoice模型结构 +SenseVoice模型结构

SenseVoice-Small是基于非自回归端到端框架模型,为了指定任务,我们在语音特征前添加四个嵌入作为输入传递给编码器: @@ -163,7 +163,7 @@ Undo 我们在开源基准数据集(包括 AISHELL-1、AISHELL-2、Wenetspeech、Librispeech和Common Voice)上比较了SenseVoice与Whisper的多语言语音识别性能和推理效率。在中文和粤语识别效果上,SenseVoice-Small模型具有明显的效果优势。

-SenseVoice模型在开源测试集上的表现 +SenseVoice模型在开源测试集上的表现

@@ -178,7 +178,7 @@ SenseVoice-small模型采用非自回归端到端架构,推理延迟极低。

-SenseVoice模型的推理效率 +SenseVoice模型的推理效率

如果您是本模型的贡献者,我们邀请您根据模型贡献文档,及时完善模型卡片内容。