关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者868人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

视频:福建舰夜泊军港 航母上亮起灯光

北京日报 浏览 588

因未按时履行2.4亿罚款 贾跃亭新增一则限制消费令

界面新闻 浏览 91113

五角大楼泄密文件被曝含涉华内容

金羊网 浏览 18824

卡霍夫卡大坝被炸前后卫星图披露 或成又一"悬案"

每日经济新闻 浏览 16141

医托"忽悠"病患去中医馆:大师退休前挂号费600 现在50

极目新闻 浏览 12703

博主打假"鬼秤"77g黄金仅称出62g 商家被罚款22000元

每日经济新闻 浏览 77828

V我50,集资穿越向秦始皇献策科目三

时尚COSMO 浏览 13468

快船送出现金,交易得到塞尔维亚中锋科普里维察选秀签约权

OnFire 浏览 15310

媒体:中国在中东影响力提升 美国眼红了

直新闻 浏览 75301

苹果最贵耳机“积水”问题惹争议,官方曾称这现象是正常的

南方都市报 浏览 14232

宇树科技更名!正在办理工商变更,已完成首期上市辅导

红星资本局 浏览 860

这四种风格的裙子 千万不要轻易尝试

潮人方法论 浏览 16136

“尔滨”火爆出圈,冰雪热能撬动东北经济吗?

第一财经资讯 浏览 12954

多地发布高温预警!618空调没有大促,爆款卖到脱销

时代财经 浏览 16055

杨洋王楚然曝恋情,前任乔欣王子奇纷纷疑似倒油

萌神木木 浏览 18514

谷歌解雇数百名语音助理项目人员

界面新闻 浏览 12307

吉林延边州珲春市发生5.5级地震 震源深度560千米

界面新闻 浏览 6332

女网红直播间卖假货被判3年4个月怎么回事?法律意识真是太淡薄

趣看热点 浏览 25924

15.69 万元起!全新深蓝 S07 上市交付

汽车商评 浏览 1684

男子驾车撞死闯国道野猪被判全责 特斯拉修车费超2万

红星新闻 浏览 12500

手滑?恩比德点赞尼克斯交易托平新闻 近一个月来首次推特点赞

直播吧 浏览 15311
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1