关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3405人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

恩里克:登贝莱得流感了所以没来,我们已习惯这赛季没有他

懂球帝 浏览 2063

特朗普证实美国不会向加沙地带派遣地面部队

新京报 浏览 2583

曼联传奇警告梅努绝不能租借离队

绿茵情报局 浏览 1603

曹西平遗体火化,干儿子哽咽道别:谢谢四哥给我的一切

素素娱乐 浏览 1463

NBA战报:灰熊141-125热火,阿德巴约23分

懂球帝 浏览 2676

多位老人痴迷买保健品:有人甚至吞安眠药逼女儿妥协

新京报 浏览 5411

斯科尔斯回应利马:有人踢了一场好球,真替你感到高兴

懂球帝 浏览 1563

鲁尼:萨拉赫应该回撤参与协防;范戴克的进球应该算作有效

懂球帝 浏览 2375

国家外汇管理局副局长刘斌:研究长期限、多品种、小币种等外汇市场发展问题|2025外滩年会

国际金融报 浏览 2627

业内曝娜扎被抢休息室,刘亦菲聊天被保镖监听,好精彩的后台大瓜

萌神木木 浏览 2431

许利民:如此困难的情况下大家坚持到了最后,取胜全靠精神力

懂球帝 浏览 1513

法甲:马赛2比1客胜斯特拉斯堡

体坛周报 浏览 3099

续航或超800km?后驱长续航版特斯拉Model Y现身工信部目录

Nice好车 浏览 2826

伊朗伊斯兰革命卫队:战争的结束由伊朗决定

界面新闻 浏览 621

丰田"世极"正式独立 全新概念车剑指劳斯莱斯

网易汽车 浏览 2569

“满200减20”变“满200减200”,豆瓣App致歉:将对所有异常订单进行自动退款

扬子晚报 浏览 812

奚梦瑶何猷君解绑6年婚姻她终于支棱起来了?

如安青何 浏览 2545

泽连斯基称乌美代表团将于本周晚些时候举行会谈

国际在线 浏览 2103

尹同跃宣告奇瑞AI进入2.0时代,要快速追赶特斯拉FSD

贝壳财经 浏览 1523

媒体:民进党为突破僵局推动"绿白合" 柯文哲不能犯浑

海峡导报社 浏览 7397

中国电动汽车出口欧洲通道打通,谁最受益?

电动汽车观察家 浏览 1597
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1