MooER:首个国产音频理解大模型
FGJ博客 发布于 2024-09-01
一、MooER概述 MooER是由摩尔线程研发的首个基于国产全功能GPU训练的开源音频理解大模型。该模型具备多项功能,包括中文和英文的语音识别、语音翻译等,在全行业中具有显著的应用价值。MooER在Covost2中译英测试中取得了25.2的BLEU分数,接近工业级效果。这一成果表...
FGJ博客 发布于 2024-09-01
一、MooER概述 MooER是由摩尔线程研发的首个基于国产全功能GPU训练的开源音频理解大模型。该模型具备多项功能,包括中文和英文的语音识别、语音翻译等,在全行业中具有显著的应用价值。MooER在Covost2中译英测试中取得了25.2的BLEU分数,接近工业级效果。这一成果表...
FGJ博客 发布于 2024-08-27
Lingo 是西湖心辰推出的国内首个端到端语音大模型,在技术上具备实时打断、实时指令控制、超级拟人、能说会唱等能力,拥有比 GPT-4o 更出色的中文语音效果。心辰 Lingo 语音模型已于 2024 年 8 月 24 日开启内测预约,预计将在 9 月 5 日的外滩大会上正式发布...
FGJ博客 发布于 2024-08-27
山海大模型是云知声推出的多模态AI大模型,具备丰富的知识储备和多模态交互能力。山海大模型能通过文本、音频、图像等多种形式与用户进行实时互动,提供信息查询、知识学习、灵感激发等服务。山海大模型特点包括实时响应、情绪感知、音色切换和视觉场景理解,最新推出的山海多模态大模型,能实现实时...
FGJ博客 发布于 2024-08-27
GLM-4-Flash是智谱AI推出的首个免费大模型API,GLM-4-Flash不仅支持多轮对话和多语言处理,还具备网页浏览、代码执行等高级功能。开发者和企业可以在智谱AI开放平台接入免费使用,GLM-4-Flash 模型在“速度”和“性能”两方面都具有较大优势,提供了极具成本...