关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1682人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

双手插兜!梅西奥体首训,主办方并未售票,球迷蹲守到训练结束

天涯沦落人 浏览 16432

“杂交水稻之父”袁隆平逝世,世界上第一个成功地利用水稻杂交优势的科学家

趣看热点 浏览 25887

到了秋天才知道,年纪大的女人要告别“小脚裤”,这样穿显瘦

静儿时尚达人 浏览 974

黎以停火协议生效一年 以军称打死370余名武装人员

国际在线 浏览 251

方程豹豹5对手来了?深蓝全新硬派SUV曝光,网传售价30万左右

Nice好车 浏览 12634

ST华铁信披违法拟被罚800万 律师:受损投资者维权已启动

雷达财经 浏览 12353

苹果最贵耳机“积水”问题惹争议,官方曾称这现象是正常的

南方都市报 浏览 14258

陈妍希喊刘德华"老公"!陈晓反应惊人

网易娱乐 浏览 19289

美邦创始人回应“衣服丑价格贵” 女儿接手7年亏损32亿元

北京商报 浏览 12432

新赛道,世锦赛400米栏冠军博尔宣布将转战女子800米

懂球帝 浏览 1078

奥运冠军江旻憓将参加香港立法会选举 申请放弃加护照

澎湃新闻 浏览 6301

同样是悼念亡妻,把具俊晔和辛柏青放一起比较,差别怎么这么大!

娱乐圈笔娱君 浏览 873

Stein:猛龙预计会给珀尔特尔开出年薪2000万的续约合同

直播吧 浏览 15625

79岁一代文艺女神走了:终生未婚,一辈子穿西装

世界音乐公号 浏览 992

律师:黄老师直播唱“挖呀挖” 或涉嫌侵权

每日经济新闻 浏览 18459

美论坛:为什么中国明知很容易被摧毁 仍在南海建基地

博览历史 浏览 4179

财报爆表后,“最乐观多头”给了1100美元目标价,预测英伟达还要翻倍!

华尔街见闻官方 浏览 14290

技能养宠人,好麻烦,好费钱!

时尚COSMO 浏览 935

努比亚Z60 Ultra正式发布 售价3999元起

网易科技报道 浏览 13224

西溪码农,滨江网红,杭州消逝的大平层

财经十一人官方 浏览 12725

全裸颁奖,影帝打人,一年比一年离谱,奥斯卡已经没有好电影了吗

不八卦会死星人 浏览 11734
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1