阿里云通义SenseVoice与CosyVoice两款语音基座模型正式开源

近日,阿里云通义宣布正式开源两款前沿的语音基座模型SenseVoice与CosyVoice,这两款模型分别针对语音识别与语音生成领域,以其卓越的性能和广泛的应用潜力见长,其中SenseVoice在语音识别方面的表现尤为突出,其识别效果已超越行业标杆OpenAIWhisper。SenseVoice作为一款专注

国奖得主再出“王炸”,星火语音大模型引领人机交互新突破!

6月27日,科大讯飞正式发布星火大模型V4.0,科大讯飞董事长刘庆峰宣布星火V4.0七大核心能力全面提升,八大维度超越GPT-4Turbo,值得一提的是,星火语音大模型再突破,科大讯飞发布74个语种/方言免切换对话,破解强干扰场景下语音识别难题;发布国际领先的极复杂场景语音转写

讯飞星火4.0霸榜八个榜单,大秀语音识别遭有预谋干扰

游鱼发自凹非寺量子位|公众号QbitAI很炸裂!讯飞星火大秀语音识别能力,现场掌声雷动——三个人同时说话,再加上背景音乐,如此强干扰的场景,大模型却表示都能听懂听清,还瞬间转化为文字,语音识别的“鸡尾酒会”难题不在话下~好,就只听到了最后的北京烤鸭,谁懂……

讯飞星火大模型升级:74个语种方言“自由对话”,破解强干扰场景语音识别难题

6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。自去年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次。此次升级后的讯飞星火V4.0七大核心能力全面升级,全面对标GPT-4Turbo,并实现在文本生成、语言理解、知识问答、逻辑推理、数学能力

小米大模型提效新框架:训练最高提速34%,推理最高提速52%!

小米AI实验室投稿量子位|公众号QbitAI大模型推理速度提升50%以上,还能保证少样本学习性能!小米大模型团队提出SUBLLM(Subsampling-Upsampling-BypassLargeLanguageModel),国际AI语音大牛、开源语音识别工具Kaldi之父DanielPovey也参与指导。与Llama等模型相比,S

刘庆峰:讯飞星火V4.0本月发布,将提供多项GPT-4o不具备的能力

IT之家6月11日消息,科大讯飞今年3月推出了讯飞星火大模型V3.5,而讯飞星火V4.0将于今年6月27日正式发布。科大讯飞董事长刘庆峰在公司成立25周年司庆活动上透露,讯飞星火V4.0发布时将展示最新的端到端智能语音落地成果,同时公司的端到端的语音技术建模方案

NVIDIA Chat RTX 0.3版本:映众RTX40显卡解锁AI新体验

NVIDIA近日发布了ChatRTX0.3版本,为人工智能对话系统带来了诸多令人兴奋的新功能。作为基于RTXGPU的本地大语言模型(LLM),NVIDIAChatRTX凭借其卓越的性能和安全的本地处理,已经成为企业和开发者的理想选择。此次0.3版本更新,进一步提升了其功能和用户体验,增加了照片搜

中国电信推出搭载星辰大模型的新型短消息服务“星辰慧答”

IT之家6月3日消息,中电信人工智能科技有限公司和中国电信人工智能研究院(TeleAI)宣布面向中国电信用户推出搭载自研星辰大模型的新型短消息服务“星辰慧答”。星辰慧答通过短信通道提供大模型服务,用户无需下载App、直接在短信界面即可体验,同时星辰慧答业务不新增任

马斯克的机器人女友,陪着吃饭、看电影、旅行。生活非常和谐!

世界首富马斯克开发了一款名叫卡特尼拉的机器人,作为他的女友。她不仅具有类人容貌和智能,还拥有多种功能,如语音识别、自然语言处理、情感理解等。本文将对卡特尼拉的特点、功能和使用情况进行介绍,并探讨马斯克开发卡特尼拉的背景和意义。最后,将对卡特尼拉的市场前景