关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者2646人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

28亿次播放:她这段感情,后劲越来越猛

Yuki女人故事 浏览 1436

OpenAI与亚马逊签署380亿美元算力采购协议,减少对微软依赖

IT之家 浏览 2485

美财长批中国实施稀土出口管制是"对抗世界" 中方驳斥

环球网资讯 浏览 8363

9场9球,意甲刷新最低进球纪录?

体坛周报 浏览 2611

曼城虐菜之战:18场18胜!哈兰德再冲英超100球 首发曝光

叶青足球世界 浏览 2054

日政坛震荡首相或换人 石破茂一句话判高市早苗"死刑"

北回归线 浏览 12988

限时19.68万元起 比亚迪2026款夏上市

网易汽车 浏览 2404

张建勇、张国富等22人增持北汽蓝谷 刘观桥增持花了4年工资

道哥说车 浏览 1643

秦煌如今过成这样只能算他活该?

一针见娱 浏览 2683

次节觉醒,杨瀚森半场8中3得9分6板1助3帽3失误,正负值-3

懂球帝 浏览 2279

球迷态度:中越大战安东尼奥大胆变阵,U23国足能否再创历史?

懂球帝 浏览 1548

国家级5G智慧工厂背书,全新深蓝S07上市交付

经济观察报 浏览 3495

国安部:有间谍入住海景民宿偷拍军港 被老板识破

央视新闻客户端 浏览 2781

都体:国米想租佛罗伦萨翼卫多多,愿意送出德弗赖或阿斯拉尼

懂球帝 浏览 1589

外观方正硬朗 三菱全新SUV预告图曝光

车质网 浏览 1673

日本外务省高官今日访华 将解释高市早苗言论

界面新闻 浏览 42491

经典落幕:苹果正式将初代iPhone SE列为过时产品

环球网资讯 浏览 2102

湖人胜勇士!里弗斯后场发动机,八村垒艾顿齐爆,拉拉维亚辣眼

篮球资讯达人 浏览 2840

美欲推动加沙停火计划第二阶段 专家:既想占好处又不愿担责

环球网资讯 浏览 2702

花400元“过家家”,Jellycat火爆看不懂?情绪消费正带来行业新逻辑

红星资本局 浏览 2675

"台独"分子沈伯洋十分担忧求助台陆委会:不敢离开台湾

看看新闻Knews 浏览 13359
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1