关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西403人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

现场视频:美英空袭也门胡塞武装

CCTV国际时讯 浏览 12381

媒体:一脸愤怒的普京再次出现 决定了瓦格纳的命运

上观新闻 浏览 15390

“复古运动风”今年秋天太流行了,这样穿减龄又好看!

LinkFashion 浏览 979

以军多次袭击加沙 哈马斯谴责其违反停火协议

环球网资讯 浏览 363

华为高级副总裁:2025年前实现网络L4自动驾驶,2030年前后L5落地

IT之家 浏览 14152

法尔克:拜仁曾准备以7500万欧引进阿劳霍,但遭到巴萨的拒绝

直播吧 浏览 12463

证监会乘胜追击!开年对23家会计所处罚,近八成罚单指向年报审计

资本百科 浏览 12433

特朗普或优先“做掉”欧洲?

浏览 22965

冯小刚也拉不动华谊兄弟

斑马消费 浏览 12766

五旬老人上综艺,有时候比年轻人更有看点。

伊周潮流 浏览 954

连续两场地区联赛弃赛后,葡老牌球队博阿维斯塔面临解散风险

懂球帝 浏览 936

两名英格兰球员在西班牙国家德比中交手,为123年来首次

懂球帝 浏览 777

惨!拍完被雪藏8年,李幼斌耗资1亿拍战争大片,没上映就被判死刑

靠谱电影君 浏览 687

库里本季下半场场均15.2分 比第二得分手克莱场均得分仅差1分

直播吧 浏览 12639

租客死亡4年后房东以"房屋贬值"把中介告了 法院判了

封面新闻 浏览 6654

夏天最流行的4双凉鞋 配裙子绝美

LinkFashion 浏览 16382

港股科网类产品强势吸金,港股通互联网ETF本周规模增超72亿元,年内增幅超325% | ETF规模周报

每经牛眼 浏览 1568

春节在商场加班的卖车人:有人5天卖出20多台,有人卖一台净赚超2000元|钛度车库

钛媒体APP 浏览 12340

鸿蒙智行"9系"扩容 首款MPV智界V9来了

网易汽车 浏览 63

郭富城随娇妻回上海,带方媛买多件珠宝太宠妻

娱絮 浏览 14820

美媒:预计在耶伦访华后 美将针对中国芯片再采取行动

环球网资讯 浏览 94043
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1