关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12414人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

3900字相亲纯干货,专治见面没话说(男生版)

YOKA网 浏览 13062

一块布卖1299元!苹果新配件冲上热搜,网友怒怼智商税

雷科技 浏览 637

40岁日星官宣结婚,全程回避妻子身份,被扒娶了小9岁前陪酒女

萌神木木 浏览 12724

冲绳知事7月将第三次访华:冲绳绝不能再次沦为战场

环球网资讯 浏览 92070

TikTok泰山压顶 周受资能否使出化骨绵掌|聚焦

科创板日报 浏览 10949

中国“智”造闪耀国际舞台,“维度I型”无人机成功出海

红星新闻 浏览 1056

西班牙U20主帅:很高兴亚马尔、库巴西、赫伊森能进成年队

懂球帝 浏览 1495

日本核污水排海,日料店“地震”?

观察者网 浏览 14490

点地成毯的热巴,再次解锁新高定

时尚COSMO 浏览 12597

日本自卫队拟使用"星链" 增强离岛作战能力

澎湃新闻 浏览 15524

辛巴公司被罚90万,其公司旗下主播账号全部被封停

趣看热点 浏览 26128

球员答最少打几场才能拿MVP:两人选75场以上 三人认为不该设限

直播吧 浏览 19376

复旦哲学教授:ChatGPT的最大瓶颈和人工智能的未来

澎湃新闻 浏览 18040

联想 ThinkPad P1 2026 AI 元启版 10 月 20 日首销,25999 元起

IT之家 浏览 1031

看了赌王四房大女儿的近照,才知道金钱买不来“贵气”

不八卦会死星人 浏览 10846

媒体:中美俄同一天都有重大发布 情况罕见

上观新闻 浏览 92848

阿森纳欧冠100胜分布:对西班牙球队16胜最多,对德法各11胜

懂球帝 浏览 844

外媒炒作中国300颗间谍卫星监视美澳演习

环球网资讯 浏览 14436

2025款奔驰GLB 220典藏版上市 售价34.99万

车质网 浏览 428

普通人穿衣别太发愁,学会这些基础穿搭,舒适大方又省时间

静儿时尚达人 浏览 978

乌克兰称摧毁俄黑海舰队“伊万诺沃人”号导弹艇

环球网资讯 浏览 12374
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1