关闭广告

上海交大突破:AI精准学习人类审美偏好

科技行者2431人阅读


这项由上海交通大学、上海人工智能实验室、中国科学技术大学和复旦大学联合开展的研究发表于2025年10月,论文编号为arXiv:2510.01982v1。研究团队开发了一套名为G?RPO的全新技术框架,专门用于让AI绘画模型更好地理解和满足人类的审美偏好。

要理解这项研究的意义,我们可以把AI绘画过程想象成一个学习画画的学生。传统方法就像给学生一张完整的作品后说"画得好"或"画得不好",但学生并不知道具体哪一笔画得好,哪一笔需要改进。这种模糊的反馈让学习过程变得缓慢而低效。

研究团队发现了现有AI绘画训练方法的两个关键问题。第一个问题是"奖励信号稀疏",就好比一位厨师做菜时,只有等整道菜完成后才能品尝,无法在烹饪过程中及时调整火候和调料。第二个问题是"评估不够全面",类似于只从一个角度评判一幅画作,而忽视了从不同距离、不同光线下观看的效果。

针对这些挑战,研究团队提出了创新的"颗粒化GRPO"解决方案。这套方案包含两个核心技术:单步随机采样策略和多粒度优势集成模块。

单步随机采样策略的工作原理就像给绘画过程装上了"定点导航系统"

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

周深:新年巡演审批通过,创下三大历史记录

陈意小可爱 浏览 1424

美媒:美军事小组抵达以色列 “监督”执行加沙停火协议

环球网资讯 浏览 2798

郑丽文就职演说让马英九流泪 台媒:他看见蓝营的希望

海峡导报社 浏览 8407

詹姆斯谈保罗退役:希望他能好好享受最后的赛季,他已无遗憾

懂球帝 浏览 2173

双雄对决,最豪华精彩的英国戏剧现场上演!

幕味儿 浏览 2525

柬埔寨拒引渡3名韩国籍"杀猪盘"头目回韩国:就地审判

红星新闻 浏览 8005

维权女车主“赢”特斯拉

电动知家 浏览 3397

剧组撞死猫风波持续发酵

小撇说事 浏览 2084

上市后要“去创始人化”?林清轩孙来春:企业要进入“战略利润”时代

中国商报 浏览 1695

坑惨!史上最大投资欺诈案,让汇丰三季度少赚78亿

财通社 浏览 2538

我玩我的,管你是谁!亏近50%鑫元消费甄选值得“点赞”!

一地基毛 浏览 2567

全智贤新剧公然辱华 中国网友细扒发现她黑料越来越多

新民周刊 浏览 25626

上海机场48岁总经理因个人原因辞职,上任仅9个月,去年年薪上百万元

红星资本局 浏览 2627

1499元飞天茅台上线“秒空”,茅台金融属性退潮是伪命题吗?

郭施亮 浏览 1717

极氪8X车型最新谍照曝光,展示尾灯造型

IT之家 浏览 1780

柬内政部称一名中国公民在柬泰冲突中受伤

北京日报 浏览 1891

面相变了!看活动上“挂脸”的杨幂,才懂林永健对她的评价

娱乐圈笔娱君 浏览 2584

REDMI K90 Pro Max 可与 iPhone / 小米 17 Pro Max 通用钢化膜

IT之家 浏览 2606

特朗普:对伊朗的军事行动我们已经赢了 但还没赢够

每日经济新闻 浏览 30477

45岁董洁北京定居,自己洗衣做饭很勤劳

无处不风景love 浏览 2372

贵州茅台多款产品出厂价降价,最高下调1990元,销售端也有降价

红星资本局 浏览 1654
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1