您当前的位置:首页 > ai数字人

中文方言识别模型

时间:2025-05-02 14:14:19  来源:互联网  作者:
AI导航网,AI网站大全,AI工具大全,AI软件大全,AI工具集合,AI编程,AI绘画,AI写作,AI视频生成,AI对话聊天等更多内容请查看 https://aiaiv.cn/

阿里云开发者社区Dolphin:40语种+22方言!清华联合海天瑞声推出的语音 2025年4月4日 · Dolphin是面向东方语言的语音识别大模型。 功能:支持40种语言和22种中文方言的精准识别,提供开源模型和便捷接口。 技术:采用CTC-Attention混合架构,结合E 更多内容请查看https://developer.aliyun.com/article/1659901

模型开源|支持东方40语种+中国22方言的新SOTA语音大 2025年4月2日 · Dolphin网络结构基于CTC-Attention架构,E-Branchformer编码器和Transformer解码器,并引入了4倍下采样层,以实现高效的大规模多语言语音识别模型的训练。CTC 更多内容请查看https://blog.csdn.net/Speechocean/article/details/146920006

华东理工大学学报(自然科学版)https://journal.ecust.edu.cn › article › doi › j.cnki基于局部和全局特征提取及多级特征聚合的中文方言识别模型摘要: 与其他语种的方言相比,中文方言种类较多,且方言类间差异小,类内差异大,因此中文方言识别极具挑战性。考虑到中文方言间的差异性可能体现在语音的局部(短时)特性上,也可 更多内容请查看https://journal.ecust.edu.cn/article/doi/10.14135/j.cnki.1006-3080.20231011003

小红书开源的自动语音识别模型 | AI工 FireRedASR 是小红书开源的工业级自动语音识别(ASR)模型家族,支持普通话、中文方言和英语,在普通话 ASR 基准测试中达到了新的最佳水平(SOTA),在歌词识别方面表现出色。更多内容请查看https://ai-bot.cn/fireredasr/

InfoQ中文大模型竞争从普通话扩展到方言了?电信、商汤 2024年6月4日 · 5 月 25 日,中国电信人工智能研究院发布业内首个支持 30 种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话 更多内容请查看https://www.infoq.cn/article/aHD8JvfGGMJE8Q1WUArm

华东理工大学学报(自然科学版)https://journal.ecust.edu.cn › article › doi › j.cnki基于语音音素后验概率图关键特征提取的中文方言识别模型为了充分利用这一差异性,提出了基于音素后验概率图分析的方言识别模型,该模型引入Convolutional Block Attention Module(CBAM)的提取音素后验概率图关键特征,并利 219318更多内容请查看https://journal.ecust.edu.cn/article/doi/10.14135/j.cnki.1006-3080.20221011001

推荐资讯
栏目更新
栏目热门