关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者898人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

在美流浪博士老家镇政府:若其是美国国籍 无法介入

极目新闻 浏览 74009

日本考虑年内制定AI使用规则,或采取比欧盟更柔和立场

界面新闻 浏览 15103

告别羽毛球自由,中产迷上匹克球

虎嗅APP 浏览 978

德赫亚合同到期曼联要求先别转会沙特,做个备胎!名宿怒斥不厚道

罗米的曼联博客 浏览 15423

羊绒羊毛专场|| 你们一直问链接的这件,终于来了!

黎贝卡的异想世界 浏览 718

阿里交出“拆分”后第一份答卷

虎嗅APP 浏览 14350

江西通报考生迟到37分钟进入考场:因暴雨受困跑步到达

江西省教育考试院 浏览 91195

查理·芒格:高段位的人,都用这4种思维!低段位差的,不止是能力

60秒商业解读 浏览 12198

黄奕在了不起的姐姐中谈到女儿曾被前夫诱导拍对话视频

趣看热点 浏览 27773

罗体:国米会尝试从米兰挖走即将年满16岁的卡马尔达

懂球帝 浏览 11998

东南大学突破:AI学会情境化拒绝能力

科技行者 浏览 862

中俄关系为何不结盟?结伴不结盟好处更多

浏览 4734

俄白“西方-2025”联合军演结束

环球网资讯 浏览 1604

AI芯片抢购浪潮停不下来! 马斯克感叹:每年需要耗费数十亿美元

智通财经 浏览 12517

定位顶级奢华MPV 奔驰VLE测试谍照曝光

车质网 浏览 913

湖人猛龙比赛中发生冲突,阿奴诺比与哈雷尔遭到裁判驱逐

趣看热点 浏览 26269

拖欠WTO的会费 美国已悄悄补缴

上观新闻 浏览 6277

厦门银行拟发行50亿元可转债:资本充足率下降明显 近两年持续补充资本金

面包财经 浏览 19040

台军方证实:一架解放军运-8今日进入台湾“空域”

海峡导报社 浏览 26082

欧冠最佳比赛11场候选名单:皇马3-3曼城、拜仁4-3曼联入选

懂球帝 浏览 10846

犹太裔富豪索罗斯被指向亲哈马斯组织提供巨额资金

红星新闻 浏览 80726
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1