关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西390人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

牛弹琴:中国的强烈愤怒还在继续 日本有三个没想到

北京日报客户端 浏览 41311

外媒:泽连斯基向特朗普展示俄境内潜在打击目标地图

环球网资讯 浏览 6475

孙铭徽赛季总助攻307次继续领跑国内球员榜 赵继伟居次&高诗岩第3

直播吧 浏览 19413

转战舞池,前意大利网球名将弗格尼尼斩获《与星共舞》冠军

懂球帝 浏览 707

五粮液能“平替”茅台?

虎嗅APP 浏览 17129

杜兰特至少降薪4000万美元?高管建议火箭最多2年8000万与他续约

罗说NBA 浏览 931

拉萨的年轻人,原来是这样生活的

幕味儿 浏览 704

李玟账号被异常登陆!最新解读

环球网资讯 浏览 1027

王思聪生日许愿“赚大钱”,00后新女友卖货,王健林还缺多少钱?

金融八卦女 浏览 12954

做个绿色珠宝珍藏家,让可持续成为真正的珍贵

iWeekly周末画报 浏览 19494

限时换新价11.98万 第三代蓝电E5 PLUS正式上市

网易汽车 浏览 204

不到24小时,央视2次点名于和伟,释放3大信号

查尔菲的笔记 浏览 842

《狂飙》安长林在韩国首尔现身 为人随和十分接地气

巷子娱事 浏览 19515

“齐脐衫”是么鬼?穿错也太土了吧!

In风尚 浏览 19660

米体:罗马想冬窗租借齐尔克泽,若晋级欧冠会自动触发买断

懂球帝 浏览 364

广州白云机场出租车疑拒载多名短途乘客 官方介入调查

极目新闻 浏览 77091

香波特:讨厌在尼克斯&骑士打3D 到了国王才感觉解放

直播吧 浏览 1571

百慕大短裤,赫本穿的时髦且高级!

Yuki女人故事 浏览 11268

郝蕾风波升级!被扒曾参演《狂野时代》闹掰,辛芷蕾发声打脸她

萌神木木 浏览 673

解放军战机再入台湾西南空域,倍感压力的台军开始自欺欺人

趣看热点 浏览 25929

vivo TWS 5:一场耳机里的「音乐革命」

36氪 浏览 830
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1