关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12423人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

始祖鸟和火柴棍哪个好?对比后发现:国外冲锋衣还不如国产凯乐石

潮人志Fashion 浏览 13075

趁春光大好,赶紧法式一下!

瑞丽网 浏览 19487

央视精品系列!这个节目堪称中国演员演技天花板!

皮皮电影 浏览 19720

专家:美媒释放与中国有关假新闻 或是与白宫"合作"

环球网资讯 浏览 88900

全台湾拼吃菠萝,军队吃完监狱吃?

海峡导报社 浏览 26186

火了40年的刘德华,没想到是这种人

GirlDaily 浏览 12771

被67岁的她惊艳了!白发不染衣品优雅,老了也时髦

LinkFashion 浏览 13382

不再性感的谷歌将成下一个IBM?老龄化严重,不再支持创新,失去员工信任人才外流

新智元 浏览 12061

赫斯基:斯洛特应该调整战术体系,将萨拉赫撤出首发

懂球帝 浏览 876

澳波:最后10分钟能看到维拉已经很疲惫;不能吹捧这场胜利

懂球帝 浏览 11941

燃油/插混/纯电都有 五菱星光730将于10月15日预售

网易汽车 浏览 1048

普通人秋天就该这么穿,准备几件黑色单品和牛仔服饰,简约又百搭

静儿时尚达人 浏览 843

全新一代轩逸实车曝光!颜值飙升,内饰双联屏,动力依旧“佛系”

汽车有文化 浏览 983

大败局中,理想汽车大转折

帮宁工作室 浏览 10916

白宫附近国民警卫队员遭枪击:500名士兵将增派华盛顿

澎湃新闻 浏览 21642

男子救人后发现场视频遭被救女子举报"侵权" 网友吵翻

新民晚报 浏览 6073

“泰坦”号背后:人类的深海探索到哪儿了?

新京报 浏览 16064

百万超跑,救不了极氪

虎嗅APP 浏览 14303

我国新能源汽车产量达到2000万辆

工信微报 浏览 15507

心灵奇旅票房破2亿,豆瓣评分接近9分

趣看热点 浏览 25883

52岁颜丙燕官宣恋情!小20岁男友被拍

青梅侃史啊 浏览 1002
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1