关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2553人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

吉利发布全域AI 2.0 千里浩瀚G-ASD全面进化

网易汽车 浏览 1691

十铨推出最新P35S外接SSD:按下按钮瞬间“自爆”!

快科技 浏览 3451

上市15天,摩尔线程剑指英伟达腹地

虎嗅APP 浏览 1913

安切洛蒂:现在出现问题并及时修正,总比在世界杯时出错要好

懂球帝 浏览 2930

闭店风波后,实探“上上谦”仅存门店:薛之谦曾入股,周末用餐高峰仍需排队

时代周报 浏览 2419

意外去世,破产重组,宁波老厂长的悲歌

诗与星空 浏览 2746

村民获180万拆迁款被控敲诈勒索 一审获刑10年

扬子晚报 浏览 2872

83岁的何享健再度冲击IPO,美的系第十子即将诞生?

BT财经 浏览 3389

东华测试寻求打开机器人领域新空间

爱集微 浏览 2620

一口价15.99万起 2026款别克君越正式上市

网易汽车 浏览 3553

“官僚主义”缠身的亚马逊,开始被多面夹击

虎嗅APP 浏览 2325

马刺加时134-130爵士取季前赛3连胜,文班22+7,贝利20+7

懂球帝 浏览 2781

沃尔沃S60也开始卷价格?最高优惠12.6万

汽车网评 浏览 1965

全球首个海上千方 PEM 槽及制氢系统的全功率测试启动

IT之家 浏览 2556

李云迪风波升级!司晓迪否认嫖娼关系,爆料男方擅长用小号聊女生

萌神木木 浏览 2538

朱媛媛离世7个月后遗作定档,辛柏青状态令人担忧

林雁飞 浏览 1652

郝蕾说金敏喜是自己在亚洲的唯一对手

芊手若 浏览 2370

消息称华为 WATCH Ultimate 2 手表明日露出,预估 6000~7000 元

IT之家 浏览 2351

梓渝施洛华官宣预热!5天连更藏着什么破局密码

让生活充满温暖 浏览 1554

连续两场地区联赛弃赛后,葡老牌球队博阿维斯塔面临解散风险

懂球帝 浏览 2671

美国欲“夺岛”,俄罗斯正“吞地”,中国应做什么?

浏览 25288
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1