关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者871人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

从“土三轮”到“全球潮品”,徐州丰县的“三蹦子”何以“闯世界”

澎湃新闻 浏览 770

特朗普与高市早苗首次会晤 外交部回应

政知新媒体 浏览 12857

赵丽颖公开行程受期待,家庭事业两不误,与儿子同框母爱感爆棚

深剖娱乐圈 浏览 11161

台媒:纳粹标志再现台湾社会,以色列与欧盟驻台机构表达关切

环球网资讯 浏览 18817

应对欧盟关税压力?雷诺将与宁德时代、LG合作研发电池

观察者网 浏览 10646

浙江卫视发文:《中国好声音》暂停播出

网易娱乐 浏览 15209

vivo TWS 5:一场耳机里的「音乐革命」

36氪 浏览 836

科学家发现首个中等质量黑洞,质量约为太阳的142倍

趣看热点 浏览 25654

多队渴望挖角祖巴茨 快艇沉没散场时间或提前到来

体坛周报 浏览 77

官方力挺!对手指责C罗干扰门将,国际足联调查,总裁助攻没问题

天涯沦落人 浏览 19250

铜梁融媒:U16国足已抵达重庆备战,全力冲刺U17亚洲杯预选赛

懂球帝 浏览 613

一个模型装下整个物种树!伯克利GPN-Star斩获基因预测双料冠军

新智元 浏览 988

想要在春季穿得简约又时髦,看看这几套穿搭方案,学起来容易

静儿时尚达人 浏览 12670

武汉不是疫情来源,世卫组织发布最新疫情溯源报告

趣看热点 浏览 1267825

青甘大环线有老外开敞篷老爷车行驶 有1955款劳斯莱斯

极目新闻 浏览 1438

成都女子被家暴16次案男方:申请重新鉴定女方伤情

上游新闻 浏览 74549

美国务院报告痛批政府搞砸阿富汗撤军 白宫不服

看看新闻Knews 浏览 15741

三星2nm工艺抢得先机?已收到日本AI公司的芯片订单

超能网 浏览 12426

埃及防空系统击落一不明飞行物

央视新闻客户端 浏览 12728

中菲磋商南海问题 中方还就涉台问题提出严正交涉

新京报 浏览 78751

媒体:美国又对华下黑手了 一些条款确实是磨刀霍霍

上观新闻 浏览 14734
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1