您当前的位置:首页 > ai数字人

ai 语音识别模型

时间:2025-04-09 14:27:01  来源:互联网  作者:
AI导航网,AI网站大全,AI工具大全,AI软件大全,AI工具集合,AI编程,AI绘画,AI写作,AI视频生成,AI对话聊天等更多内容请查看 https://aiaiv.cn/

清华联合海天瑞声推出的语音识别大模型Dolphin是什么 Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言(含普通话),能精准识别不同地区的语言特点。模型训练数 更多内容请查看https://ai-bot.cn/dolphin/

知乎现在有什么开源的语音识别吗? Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语 更多内容请查看https://www.zhihu.com/question/23473262

13个最佳开源语音识别引擎 语音识别(ASR)在人机交互方面发挥着重要的作用,可用于:转录、翻译、听写、语音合成、关键字定位、语音日记、语言增强等场景。语音识别基本过程一般包括:分析 更多内容请查看https://zhuanlan.zhihu.com/p/679165787

小红书开源的自动语音识别模型 | AI工 FireRedASR 是小红书开源的工业级自动语音识别(ASR)模型家族,支持普通话、中文方言和英语,在普通话 ASR 基准测试中达到了新的最佳水平(SOTA),在歌词识别方面表现出色。更多内容请查看https://ai-bot.cn/fireredasr/

字节跳动推出的AI语音识别模型 | AI工具集Seed-ASR是字节跳动开发的一款基于大型语言模型(LLM)的语音识别(ASR)模型。 在超过2000万小时的语音数据和近90万小时的配对ASR数据上训练,支持普通话和13种中国方言的 更多内容请查看https://ai-bot.cn/seed-asr/

aisharenet.comFireRedASR:多语言高精度语音识别开源模型-首席AI分享圈2025年3月4日 · FireRedASR 是小红书 FireRed 团队开源的语音识别模型,支持普通话、方言、英语及歌词识别,提供高精度 FireRedASR-LLM 和高效 FireRedASR-AED 两个版本,可处理短 更多内容请查看https://www.aisharenet.com/fireredasr/

aisharenet.comFunASR:开源语音识别工具包,说话人分离/ 多人对 2024年10月16日 · FunASR提供了便捷的脚本和教程,支持预训练模型的推理与微调,帮助用户快速构建高效的语音识别服务。 支持各种音视频格式输入,可以把几十个小时的长音频与视频识别成带标点的文字,支持上百路请求同时进行转写 更多内容请查看https://www.aisharenet.com/funasr/

阿里云帮助中心https://help.aliyun.com/zh/model-studio/developer语音识别-SenseVoice_大模型服务平台百炼 (Model Studio 2025年3月17日 · SenseVoice语音识别大模型专注于高精度多语言语音识别、情感辨识和音频事件检测,支持超过50种语言的识别,整体效果优于Whisper模型,中文与粤语识别准确率相对提 aiwaf更多内容请查看https://help.aliyun.com/zh/model-studio/developer-reference/sensevoice-speech-recognition/

推荐资讯
栏目更新
栏目热门