关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3402人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

佘诗曼《正义女神》首播,看完4集后,我要说:港剧就应该这样拍

娱乐圈笔娱君 浏览 480

ChatGPT要有广告了?消息称ChatGPT安卓测试版现广告代码

环球网资讯 浏览 2087

特朗普调侃让委内瑞拉成第53个州

红星新闻 浏览 1346

排队两小时买奶皮子糖葫芦,值吗?

时尚COSMO 浏览 2101

许家印侄子许火健豪宅被法拍,起拍价4400万元,配有5个洗手间

红星资本局 浏览 1572

理想汽车,又打了一场翻身仗?

电动势 浏览 2559

美的与华为强强联合,共拓AI领域创新生态

正解局 浏览 3481

死了么APP征集新中文名

扬子晚报 浏览 1561

今年春天最流行的4件卫衣,照着穿就很好看

LinkFashion 浏览 744

女子应聘疑遭老板性暗示 涉事企业法人:出于工作需要

极目新闻 浏览 7824

优雅,与皱纹无关

Yuki女人故事 浏览 426

帕普·戈麦斯即将复出

体坛周报 浏览 2613

三星单季利润暴增208%

21世纪经济报道 浏览 1586

非洲杯决赛裁判组:主裁来自民主刚果,VAR裁判来自加蓬

懂球帝 浏览 1546

蚂蚁阿福声明:问答结果中无任何广告推荐、不存在商业排名

三言科技 浏览 1382

AI会取代考古学家吗?在这场沙龙中窥见人工智能对文保利用的影响

封面新闻 浏览 2691

转行当吉他手?科纳特被罗梅罗蹬到后,做出吉他里的扫弦动作

懂球帝 浏览 1907

解密福建舰电磁弹射背后的硬核支撑

上观新闻 浏览 2347

英伟达发布新一代Rubin平台,推理成本较Blackwell降10倍,拟下半年发货

华尔街见闻官方 浏览 1744

垃圾至少有10层楼高 天坑溶洞垃圾堆成山臭气熏天

每日经济新闻 浏览 34566

保障+财富创新融合,阳光人寿获评2025金柿奖·卓越分红险样本

Daily每日财报 浏览 1993
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1