关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者805人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

太猛了!保险巨头炒股竟大赚300多亿

财通社 浏览 933

成都恒大广场一健身房关门停业 商场回应:没跑路

封面新闻 浏览 75119

4名解放军官兵在中印边境冲突中牺牲到底是怎么回事?

趣看热点 浏览 26435

稳了?皇马此前16次淘汰赛首回合取胜最终15次晋级

趣看热点 浏览 24837

拒15亿,Andrew Tulloch重返Meta,Thinking Machines Lab痛失联创

机器之心Pro 浏览 987

山东"万亿国企"原掌门人受审 被指过于高调、好大喜功

中国新闻周刊 浏览 91450

辛巴称遭打假人敲诈,才刚复出就整这么多幺蛾子?

趣看热点 浏览 26154

祁发宝张开双臂的震撼瞬间祁发宝个人介绍

趣看热点 浏览 26154

00后暑假打工生存指南:一小时4块钱,玩转资本家

钛媒体APP 浏览 14824

外交部回应布林肯称"美国将继续做中方不喜欢的事"

外交部网站 浏览 15512

2023复古风又叒叒回来了 !照着穿绝对气质又温柔

In风尚 浏览 16398

官方通报贵州习水食物中毒事件:学生89人住院

界面新闻 浏览 18681

告别卡粉斑驳!保姆级遮瑕教程,手把手教你黑眼圈痘印全隐形

Yuki女人故事 浏览 75

芯片巨头又有大动作

中国基金报 浏览 10726

珠峰暴雪向导"人肉开路"带百人突围:最陡坡度有60度

极目新闻 浏览 5965

官方首披露:"消失"8个月的南宁原市长被撤销党内职务

澎湃新闻 浏览 86560

朱民解读硅谷银行破产:金融市场逻辑发生根本变化

网易财经智库 浏览 19796

ACEMAGIC阿迈奇预告M1A PRO+迷你主机,搭载锐龙AI Max+ 395

IT之家 浏览 193

被这些70后女人美到了!注重配色、配饰、穿衣舒适度,简约大方

静儿时尚达人 浏览 13044

疑一则广告惹祸 特朗普宣布终止与加拿大所有贸易谈判

财联社 浏览 6743

OPPO Find X9 系列实拍:定位“旅拍神器”,口袋里的哈苏相机

IT之家 浏览 919
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1