关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者666人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

最「可爱」的全新酷路泽 FJ 上线,这真不是方程豹在日本失散的兄弟?

爱范儿 浏览 901

双十一购物不烧脑!看AI全能搭子荣耀Magic8如何重塑消费体验

新熵 浏览 850

谢霆锋演唱会遇连场暴雨,苏炳添携妻探班引热议

黔乡小姊妹 浏览 1599

俄美领导人会晤为何被“推迟” 俄外长披露原因

每日经济新闻 浏览 784

广西拟出新规约束政府投资,债务率警戒线设定为300%

第一财经资讯 浏览 16692

夏季衬衫如何穿出高级感?记住这三个技巧就够了

虎哥说衣不二 浏览 19140

十铨推出最新P35S外接SSD:按下按钮瞬间“自爆”!

快科技 浏览 1649

伊姐周日热推:电视剧《重影》;电视剧《山河枕》......

伊周潮流 浏览 778

维持看涨!摩根大通预计金价明年底均价升至5055美元

第一财经资讯 浏览 874

有银行今年降了七次!存款利率又双叒下调

21世纪经济报道 浏览 930

追觅进入剃须刀市场推出首款产品“小胶囊S7 Pro”

IT之家 浏览 1040

以硬核智能定义超值神车 尚界H5交付破10000台

网易汽车 浏览 692

快狗打车董事长辞职 市值蒸发已超九成

阿尔法工场 浏览 12710

加沙停火草案被美国一票否决 中国大使发出"灵魂三问"

每日经济新闻 浏览 11863

美国联邦法官宣布:无限期推迟一场涉特朗普重要审判

财联社 浏览 12551

"30年老公厕"被改成咖啡店后又遭封 当地城管部门回应

封面新闻 浏览 9595

台湾新北市长侯友宜:我反对“台独”

澎湃新闻 浏览 112612

女人过了60岁打扮要得体!看这些穿搭就有灵感,简约不老气

静儿时尚达人 浏览 913

59岁蒋雯丽现状让人心酸,一代女神也落寞了?

洲洲影视娱评 浏览 620

百度官宣“文心一言”云服务将于3月27日上线

Tech星球 浏览 19465

美宣布对台军售之际 解放军战机巡航台海

参考消息网 浏览 15984
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1