NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析

2023年12月29日13:55:20 科技 1065

讲者简介

王子泰

个人简介:

中国科学院信息工程研究所19级直博生,导师为黄庆明教授,研究方向为数据挖掘与机器学习,尤其关注复杂场景下模型评价与优化。在 IEEE TPAMI、NeurIPS、AAAI、ACMMM 等国际期刊/会议上发表 CCF-A 类论文 8 篇,其中第一作者 6 篇,Oral/Spotlight论文 4 篇。


Title


面向不平衡学习的细粒度泛化分析

A Unified Generalization Analysis of Re-Weighting and Logit-Adjustment for Imbalanced Learning


Content

内容简介


针对不平衡学习,一类简单且有效的方法是修正原始损失函数,使学习过程更多关注少数类。当前损失修正方法,包括重加权与得分调整两类,虽已取得显著性能提升,但其理论分析仍然粗糙,无法解释部分实验结果。针对该问题,首先将局部化技术引入不平衡学习泛化分析,提出局部利普西茨性质及其压缩引理,构造得到依赖损失函数局部性质的细粒度泛化误差上界。其次,将上述泛化误差上界应用于已有不平衡学习损失函数,不仅揭示了重加权、得分调整、延迟加权等机制与泛化性能的联系,还为已有损失函数提供了理论依据。进一步,根据理论分析结果,改进了已有不平衡学习方法,提出了对齐重加权机制与截断得分调整机制,尽可能压缩模型泛化误差上界。在多个基准数据集上结果表明所提学习方法显著改善了已有不平衡学习方法的性能。


论文链接:

https://arxiv.org/abs/2310.04752

代码链接:

https://github.com/wang22ti/DDC

谷歌学术主页:

https://scholar.google.com/citations?user=45qZ_LcAAAAJ&hl=zh-CN



1.研究背景


传统机器学习方法通常假设样本数量在类别间分布均衡,然而真实数据集分布往往呈现显著不平衡态势。在此场景下,经验风险最小化框架(ERM)将偏向学习多数类,使得模型在少数类上泛化变得更为困难。鉴于此,一类简单且有效的不平衡学习方法是修正原始损失函数,促使学习过程更加关注少数类。当前损失修正方法,可分为重加权与得分调整两类,其中前者提高少数类样本损失权重以鼓励平衡学习,后者通过类别相关的得分调整项以改善每个类别间隔。常见的损失修正方法可形式化为如下形式,又名VS损失[1]:



NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻


同时,为准确评估模型性能,通常使用平衡准确率作为模型性能评价指标,即分别计算各类准确率,并以各类准确率均值作为性能评估指标。那么,现有损失修正方法是否能够保证模型在平衡准确率上的泛化性能?针对该问题,现有理论分析仍然粗糙,无法解释部分实验结果。具体而言,已有工作[5, 6]将各类别泛化误差上界的均值直接作为整体泛化界,如下图所示:



NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻


虽然简单易懂,该泛化界存在两方面问题:
理论层面,该泛化界粒度较粗且不够紧致。具体而言,不同损失函数间差异在于选择不同的类别相关项,但证明唯一涉及的损失函数性质,即利普西茨连续性,是全局的,无法衡量这一差异。同时,由于求和项的上界小于各项上界的求和,若能够直接约束整体泛化误差,可获得更为紧致的泛化界:


NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻



经验层面,虽然该泛化界诱导的LDAM损失优于CE损失,但效果并不显著。而结合[5]中提出的延迟重加权机制(DRW),性能提升则更为显著。然而,上述泛化误差上界误差解释该经验结果。


2. 理论分析


针对上述问题,首先提出直接约束整体泛化性能的引理,其中等式右侧分母包含了最小类在训练集占比,直接揭示了不平衡学习泛化性能与数据不平衡程度的关联:


NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻


进一步,为约束复合函数簇G,建模损失中类别相关项对泛化界的影响,提出局部利普西茨连续性及其诱导的压缩引理:


NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻


综合上述引理,并将之应用至VS损失,有如下定理:


NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻


其中,B_y(f)是各类样本最小得分,与各类的最小间隔紧密相关。基于该泛化误差,进一步有如下理论结果,详见论文:(1)重加权与得分调整均可通过消除该泛化界中不平衡项改善模型泛化性能;(2)延迟重加权是必要的;(3)已有重加权项与得分调整项[2,3,4]均可改善模型泛化性能;(4)乘法调整可能与重加权存在不兼容问题,而加法调整项不存在该问题。


3. 所提方法


基于上述理论结果,本文改进了已有学习方法:(1)需综合使用重加权、乘法得分调整、加法得分调整;(2)将重加权项直接与泛化界中不平衡项对齐,即Aligned DRW(ADRW);(3)在使用重加权时取消使用乘法得分调整,即Truncated LA(TLA)。整体算法如下图所示:


NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻



4. 实验结果


首先通过一系列实验验证理论分析结果,其中下左图验证了DRW机制的必要性,下有图验证了乘法调整与重加权存在不兼容问题。


NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻


进一步,在CIFAR10 LT、CIFAR-100 LT、ImageNet-LT、iNaturalist等多个基准数据集验证了所提方法的有效性:


NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻


若加入更多增强技术,如延长训练轮数至400、精调weight decay、使用randaug技术,可取得更优性能,如在CIFAR-100数据集上结果如下,更多结果详见代码链接。


NeurIPS 2023 Spotlight: 面向不平衡学习的细粒度泛化分析 - 天天要闻


参考文献


[1] Label-imbalanced and group-sensitive classification under overparameterization, NeurIPS 2021.
[2] Class-balanced loss based on effective number of samples, CVPR, 2019.
[3] Long-tail learning via logit adjustment, ICLR, 2021
[4] Identifying and compensating for feature deviation in imbalanced deep learning, Arxiv, 2020.
[5] Learning imbalanced datasets with label-distribution-aware margin loss, NeurIPS 2019.
[6] Balanced meta-softmax for long-tailed visual recognition, NeurIPS 2020.

科技分类资讯推荐

英特尔酷睿 5 120F 处理器曝光:6 个 P 核 12 线程、睿频 4.5GHz - 天天要闻

英特尔酷睿 5 120F 处理器曝光:6 个 P 核 12 线程、睿频 4.5GHz

IT之家 6 月 14 日消息,科技媒体 WccFtech 今天(6 月 14 日)发布博文,分享了英特尔酷睿 5 120F 处理器的规格信息,拥有 6 个 P 核和 12 线程,基础频率为 2.5 GHz,睿频为 4.5GHz。IT之家援引博文介绍,酷睿 5 120F 处理器隶属于 Bartlett Lake 系列,该系列仅采用 P 核(Performan
这次波音787为何没有全球停飞? - 天天要闻

这次波音787为何没有全球停飞?

不进行全球停飞,也许是其一种态度。文 | 海上客印度航空当地时间6月12日空难,着着实实是创了不少纪录的。人员伤亡方面,不仅机上两百余人仅一位存活,且飞机坠落后砸中了古吉拉特邦艾哈迈达巴德机场附近一所医学院学生宿舍,又带走了几十人的性命!工作人员抬走遇难者尸体不仅如此——这一发生在印度总理莫迪家乡的空难,...
刚刚,国务院开会,优化耗材集采 - 天天要闻

刚刚,国务院开会,优化耗材集采

器械之家医疗器械媒体报道先锋分享专业医疗器械知识关注来源:新华社、国家医保局今日(6月13日),国家医保局转发新华社文章,国务院总理李强6月13日主持召开国务院常务会议,部署中国(上海)自由贸易试验区试点措施复制推广工作,听取构建房地产发展新模式和推进好房子建设有关情况汇报,审议通过《关于进一步完善信用修...
光伏清洗机器人履带:提升清洁效率的核心部件 - 天天要闻

光伏清洗机器人履带:提升清洁效率的核心部件

光伏面板作为太阳能发电系统的核心组件,长期暴露在户外环境中,表面极易积聚灰尘、污垢等杂质,严重影响发电效率。随着自动化技术的快速发展,光伏清洗机器人已成为越来越多发电站的清洁方案。在这一过程中,光伏清洗机器人履带作为关键部件,其性能直接影响
如何让区块链技术更好赋能实体经济 - 天天要闻

如何让区块链技术更好赋能实体经济

区块链是数据共享和价值流通的重要基础设施,是下一代价值互联网络的核心技术。随着区块链技术在多场景积极落地,释放出显著的市场价值。实践证明,区块链只有深深扎根在具体应用场景中,才能够真正发挥出重要作用。在“十五五”期间,要更好推动区块链技术赋能实体经济,加快与场景融合发展。坚持系统性思维一方面,要用整...
通讯|中企助力尼日利亚水电枢纽重获新生 - 天天要闻

通讯|中企助力尼日利亚水电枢纽重获新生

新华社阿布贾6月10日电 通讯|中企助力尼日利亚水电枢纽重获新生 新华社记者杨喆 朱悦 在尼日利亚中北部尼日尔州新布萨以东约17公里,非洲第三长河尼日尔河流经卡因吉大坝,发出轰隆隆巨响,向下游倾泻而去。 这是2025年6月1日在尼日利亚尼日尔州拍摄的卡因吉水电站内的水电机组。新华社发(中国电建华东院公司供图) 坐落...