关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12418人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

恒大地产去年净亏527亿 流动负债1.6万亿 已资不抵债

每日经济新闻 浏览 85289

连打工人出差都住不起亚朵了?日益昂贵的亚朵该咋看?

江瀚视野 浏览 1676

看到不少人穿花苞裙,想必夏日肯定有它的一席之地了!

伊周潮流 浏览 11624

修杰楷庆祝生日获贾静雯献吻 称继女是"宝贝女儿"

娱絮 浏览 19402

奥巴梅扬:马赛会继续在欧联杯前进;我是射门不是传中

懂球帝 浏览 12212

距离仅10到15米 飞行员驾驶歼-16倒飞驱离外军战机

环球网资讯 浏览 1011

内维尔:我原本认为曼城状态不够稳定,但看来我大错特错了

懂球帝 浏览 665

美日韩签联合声明 用"最强硬措辞"谈及南海问题

环球网资讯 浏览 14157

刘诗诗终于选对发型了 不仅减龄还很显脸小!

一只可可 浏览 15931

贾玲与韩寒:春节档幕后的资本局中局

刺猬公社 浏览 12259

E句话 | 《奥本海默》横扫奥斯卡!

仙女事件簿 浏览 12322

比亚迪的靓丽业绩,为何留不住巴菲特的心?

第一财经资讯 浏览 18372

五六十岁女性别瞎穿,教你三步解锁优雅气质,轻松告别油腻感

静儿时尚达人 浏览 816

Linus新年首骂:和谷歌大佬大吵4天,“你的代码就是垃圾”

量子位 浏览 12438

具俊晔上韩综吹牛:大S人气堪比全智贤

萌神木木 浏览 14460

贝嫂素颜出镜翻车,疑眼皮提拉失败额头过度填充

好丹 浏览 12846

何炅51岁无妻无子,且不再隐瞒身体状况了?

艳儿说电影 浏览 915

2025浦江创新论坛主论坛举行,汇聚全球智慧力量,构建开放合作科技共同体

澎湃新闻 浏览 1652

台军"自造"潜艇首次对外展示全貌 距离服役尚有时日

环球网资讯 浏览 12531

冬天不一定要穿黑色!看看这些“色彩感”穿搭

静儿时尚达人 浏览 13252

杨紫琼升级当奶奶 与富豪老公相拥亲吻高调撒糖

扒虾侃娱 浏览 13047
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1