关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1621人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以色列攻入加沙城 多国寻求将其逐出联合国

看看新闻Knews 浏览 3449

迈凯伦SUV要来了,搭V8混动

懂车之道 浏览 1883

成都锦里古街树木倾倒砸伤游客 目击者:树木是空心的

上游新闻 浏览 8525

红毯走成这样,也太抽象了……

严肃八卦 浏览 1814

小川航基:没赢下巴拉圭心有不甘;对阵巴西的机会肯定会更少

懂球帝 浏览 2696

汪小菲接俩娃回北京过春节!玥儿和奶奶逛公园

地理三体说 浏览 1448

车标比界“少一角”,华为系“境”与“界”差别在哪?

汽扯扒谈 浏览 1447

今年秋冬最流行的外套竟然是它?谁穿谁时髦!

LinkFashion 浏览 2343

中国对日本政府发出第一道制裁令 暗示了高市早苗结局

时时有聊 浏览 18680

曾成功应用于马斯克脑机接口临床实验!西门子医疗脑机接口全流程解决方案亮相

上观新闻 浏览 2428

范佩西首次征召儿子进入费耶诺德比赛名单,但并未安排他出场

懂球帝 浏览 2173

同比增长89.61% 鸿蒙智行11月交付新车81864台

网易汽车 浏览 2086

中央考核巡查组连续发问 现场人员支支吾吾

新京报 浏览 7104

李刚仁:很高兴代表巴黎出战100场比赛,希望继续保持状态

懂球帝 浏览 2462

抖音:卖茅台低于市场行情价将被处罚

第一财经资讯 浏览 2453

邮报:法布雷加斯和特里不在切尔西新帅候选名单上

懂球帝 浏览 1742

女友BELLA+封面 | SUPER JUNIOR银赫:二十年初心的破茧之旅

伊周潮流 浏览 4156

爱泼斯坦"自缢"后照片公开:脖子有血色勒痕

大风新闻 浏览 100410

暴涨!全线拉升!芯片传闻,突然刷屏

券商中国 浏览 1579

内维尔:我原本认为曼城状态不够稳定,但看来我大错特错了

懂球帝 浏览 2400

谈判之际擦枪走火 伊无人机冲向美航母或给美动武借口

第一军情 浏览 3774
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1