爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

法甲+欧联九...

铜资源争夺加...

Here w...

博主：王子铭...

31省份去年...

与特朗普会晤...

美否决全球最大光伏电站之一特朗普曾称全球变暖是骗局

特朗普就伊朗问题表态伊朗：不会轻易相信美国

李金羽：冲超没那么容易，希望球员们勇敢地面对各种情况

刘宇宁不想硬接剧，自己拍着不开心，称有些人扑一部又一部还在拍

贵州2岁女童家门口失踪父亲已去世母亲独自在外打工

从对手到盟友，刘强东王兴联手要“联吴抗曹”？

63岁的吴镇宇刷老年卡坐公交被质疑？

三星单季利润暴增208%

媒体：菲载300多人客船倾覆中国没法救的原因很简单

男子花3万请网红带货：下599单仅成交4单收入700元

华为研究团队突破代码修复瓶颈，8B模型击败32B巨型对手！

留几手为闫学晶叫屈？称网友自卑敏感

加沙停火草案被美国一票否决中国大使发出＂灵魂三问＂

中国留学生目击拦截导弹空中爆炸：不时传来哭声

限韩令太正确！全智贤辱华不道歉，林允儿发文挑衅，韩星嚣张得治

为财政刺激计划融资，日本拟增发逾11.5万亿日元新债

国庆＂被弃高速＂的小狗主人找来了主人：不是故意丢弃

特朗普在10天内4次誓言＂拿下格陵兰＂强调＂不择手段＂

国产新能源还在内讧，福特CEO已经吓破胆了：能让我们全军覆没

哈马斯呼吁落实加沙停火协议要求确保拉法口岸双向开放

杭州一公园白鹤＂大战＂无人机现场市民看得心惊肉跳

强奸大嫂凶手出狱后去大嫂家大嫂吓得穿内衣跑出求救

牛弹琴：白宫突然发了张图伤害性不大侮辱性极强

口碑爆棚，票房扑惨，最争议的大片来了