关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2423人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

我永远不会买黄金,更不会投资黄金!

浏览 24819

从“海燕”到“波塞冬” 俄密集官宣捷报有何考量?

极目新闻 浏览 2593

奔驰誓言守护V12引擎,将继续推出十二缸车型

MOTO 浏览 3422

俄副外长警告:北约敌对行为可能导致核大国间直接冲突

环球网资讯 浏览 2564

创新推出ACE SXFI蓝牙耳机,699元

IT之家 浏览 1460

从S25 Edge到iPhone Air:超轻薄旗舰这么快就要凉透了?

雷科技 浏览 2455

她复出拿奖,这次没人笑得出来

独立鱼 浏览 2515

他怎么在内娱男女通吃?颜值一般但性张力绝了

Yuki女人故事 浏览 4145

俄称打击乌军多处目标 乌称击退俄进攻

国际在线 浏览 2518

泽连斯基:俄对乌发动大规模空袭 发射近300架无人机

极目新闻 浏览 1495

美国进逼委内瑞拉 分析人士:已突破国际法的危险界限

上观新闻 浏览 2477

绿色+棕色、蓝色+棕色,这3组配色高级又好看!

LinkFashion 浏览 1513

被预制菜笼罩,商场餐饮大撤退?

餐饮老板内参 浏览 2312

杜兰特至少降薪4000万美元?高管建议火箭最多2年8000万与他续约

罗说NBA 浏览 2303

王楚钦:1-3落后时我都想着拎包回去了,确实到了极限

懂球帝 浏览 2002

绿地张玉良,失去一员“大将”

红星资本局 浏览 3292

2026年春晚分会场官宣 周深肖战刘宇宁令人期待

你我话娱乐 浏览 1410

男子如厕突发不适后去世 从倒地到失去意识仅1分钟

上观新闻 浏览 2553

今秋要穿这15条裙子!上身绝美,太撩人了!

Yuki女人故事 浏览 2753

贾国龙宣战失败,西贝亏损超6亿元,到底谁的责任?

数字财经智库 浏览 1571

外国投资者7月美债持仓再创新高,加拿大、中国、印度持仓下降

华尔街见闻官方 浏览 3399
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1