(12)发明专利申请
(21)申请号 CN201811341167.9 (22)申请日 2018.11.12
(71)申请人 国家电网有限公司;国网电子商务有限公司;国网雄安金融科技有限公司
地址 100031 北京市西城区西长安街86号
(10)申请公布号 CN109635839A
(43)申请公布日 2019.04.16
(72)发明人 王栋;韩庆芝;王波;玄佳兴;王俊生;李丽丽;韩文慧;吕梓童;张宏廷 (74)专利代理机构 北京中博世达专利商标代理有限公司
代理人 申健
(51)Int.CI
权利要求说明书 说明书 幅图
(54)发明名称
一种基于机器学习的非平衡数据集的处理方法和装置
(57)摘要
本发明实施例公开了一种基于机器学习的
非平衡数据集的处理方法和装置,涉及数据处理的技术领域,能够解决SMOTE算法合成“人造”样本过程中造成的分布边缘化问题。该处理方法包括:一种基于机器学习的非平衡数据集的处理方法,包括:根据包含多个多数类图像样本的第一样本集合和包含多个少数类图像样本的初始的第二样本集合,生成中心样本,其中,所述多数类图像样本和所述少数类图像样本均包含有N维
属性,所述中心样本是由多个所述多数类图像样本和多个所述少数类图像样本每个维度的属性的平均值组成,N≥1;在所述中心样本与至少一个所述少数类图像样本之间进行随机线性插值,生成新增少数类样本,得到利用所述新增少数类样本更新后的第二样本集合。
法律状态
法律状态公告日
2019-04-16 2019-04-16 2019-04-16 2019-04-16 2019-05-10 2019-05-10 2019-05-10 2019-07-23 2019-07-23 2020-07-14
法律状态信息
公开 公开 公开 公开
实质审查的生效 实质审查的生效 实质审查的生效 著录事项变更 著录事项变更 授权
法律状态
公开 公开 公开 公开
实质审查的生效 实质审查的生效 实质审查的生效 著录事项变更 著录事项变更 授权
权利要求说明书
一种基于机器学习的非平衡数据集的处理方法和装置的权利要求说明书内容是....请下载后查看
说明书
一种基于机器学习的非平衡数据集的处理方法和装置的说明书内容是....请下载后查看
因篇幅问题不能全部显示,请点此查看更多更全内容