说明:最全专利文库
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211162954.3 (22)申请日 2022.09.23 (71)申请人 杭州海康威视数字技 术股份有限公 司 地址 310051 浙江省杭州市滨江区阡 陌路 555号 (72)发明人 王琦  (74)专利代理 机构 北京天同知创知识产权代理 事务所(普通 合伙) 16046 专利代理师 韩建伟 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 一种训练处理方法、 装置、 电子设备和可读 存储介质 (57)摘要 本申请公开了一种训练处理方法、 装置、 电 子设备和可读存储介质, 该方法包括: 获取样本 数据; 将所述有标签样本数据和所述无标签样本 数据进行聚类得到多个簇; 获取所述样本数据中 的剩余样 本数据, 所述剩余样 本数据为未与无标 签样本数据成簇的有 标签样本数据; 将所述剩余 样本数据输入到生成网络模型中得到所述生成 网络模型输出的生成样本数据; 将所述生成样本 数据分别聚类到所述多个簇中的一个簇中; 使用 所述多个簇中的样本数据进行半监督模型的训 练。 通过本申请解决了 现有技术中无标签样本数 量不足或分布不均衡所导致的训练得到的模型 性能不佳的问题, 提高了在训练中可用的样本数 据的数据和质量, 从而提高了训练得到模型的质 量。 权利要求书3页 说明书13页 附图3页 CN 115456100 A 2022.12.09 CN 115456100 A 1.一种训练 处理方法, 其特 征在于, 包括: 获取样本数据, 其中, 所述样本数据包括有标签样本数据和无 标签样本数据; 将所述有标签样本数据和所述无 标签样本数据进行聚类得到多个簇; 获取所述样本数据中的剩余样本数据, 其中, 所述剩余样本数据为未与无标签样本数 据成簇的有标签样本数据; 将所述剩余样本数据输入到生成网络模型中得到所述生成网络模型输出的生成样本 数据, 其中, 所述生成网络模型使用所述多个簇的样本数据进 行训练得到的, 所述生成网络 模型用于根据有标签样本数据生成虚拟无 标签样本数据; 将所述生成样本数据分别聚类到所述多个簇中的一个簇中, 其中, 所述多个簇中的每 个簇均对应一个簇标签; 使用所述多个簇中的样本数据进行半监督模型的训练, 其中, 每个簇中的样本数据均 将该簇的簇标签作为该样本数据的标签在训练中使用。 2.根据权利要求1所述的方法, 其特征在于, 将所述有标签样本数据和无标签样本数据 进行聚类得到多个簇包括: 将所述有标签样本数据和无标签样本数据使用特征提取模型提取样本特征, 其中, 所 述特征提取模型为使用与所述样本数据类型相同的训练数据预先训练得到的, 所述特征提 取模型用于从输入的数据中提取 特征; 根据所述有标签样本数据和无 标签样本数据对应的样本特 征进行聚类。 3.根据权利要求1或2所述的方法, 其特征在于, 将所述有标签样本数据和所述无标签 样本数据进行聚类包括: 根据所述有标签样本数据和所述无标签样本数据进行自监督训练, 其中, 所述自监督 训练用于对样本数据进行聚类, 并根据聚类之后的簇中的样本数据的特征调整所述特征提 取模型, 然后再次聚类和调整所述特 征提取模型直到无新簇产生。 4.根据权利要求1或2所述的方法, 其特征在于, 根据所述有标签样本数据和所述无标 签样本数据进行聚类包括: 从所述样本数据中选择作为簇中心的样本数据; 根据选择的簇 中心进行聚类得到多个簇, 并计算每个簇中的样本数据到该样本数据 所 属的簇的簇中心的第一距离以及到其 他簇的簇中心的第二距离; 变更作为簇中心 的样本数据重新进行聚类, 并计算所述第一距离和所述第二距离, 直 到损失函数 的值最优, 其中, 所述第一距离越小并且所述第二距离越大则所述损失函数 的 值越优。 5.根据权利要求1所述的方法, 其特征在于, 使用所述多个簇的样本数据进行训练得到 所述生成网络模型包括: 使用所述多个簇的样本数据对生成式对抗网络模型进行训练, 其中, 所述多抗网络模 型包括第一生成器和 第一判别器, 所述第一生成器用于根据有标签样本数据生成无标签样 本数据, 所述第一判别器用于判断一个无标签样本数据是该簇内的无标签样本数据或者是 第一生成器生成的无 标签样本数据; 确定所述生成式对抗网络模型训练完成之后, 将所述多抗网络模型中的所述第 一生成 器作为所述 生成网络模型。权 利 要 求 书 1/3 页 2 CN 115456100 A 26.根据权利要求5所述的方法, 其特征在于, 所述生成式对抗网络模型还包括: 第二生 成器和第二判别器, 其中, 所述第二生成器用于根据无标签样本数据生成有标签样本数据, 所述第二判别器用于判断一个有标签样本数据是该簇内的有标签样本数据或者是第二生 成器生成的有标签样本数据。 7.根据权利要求6所述的方法, 其特征在于, 确定所述生成式对抗网络模型训练完成包 括: 计算所述生成式对抗网络模型的损失函数的值, 在所述生成式对抗网络模型的损失函 数的值最优的情况下, 确定所述生 成式对抗网络模 型训练完成, 其中, 所述生成 式对抗网络 模型的损失函数包括: 所述第一生成器生成的无标签样本数据和该簇内的无标签样本数据 相比得到的第一损失、 有标签样本数据和构造的有标签样本数据相比得到的第二损失、 所 述第二生成器生成的有标签样本数据和该簇内的有标签样本数据相比得到的第三损失、 无 标签样本数据和构 造的无标签样本数据相比得到的第四损失、 以及同一簇内有标签样本数 据和无标签样本数据相比得到的第 五损失, 其中, 所述第一损失、 所述第二损失、 所述第三 损失、 所述第四损失和第 五损失的和越小则所述损失函数 的值越优, 所述构造的有标签样 本数据是将有标签样本数据经过所述第一生成器生成的无标签样本数据之后再将该无标 签样本数据经过所述第二生成器生成的有标签样本数据, 所述构 造的无标签样本数据是将 无标签样本数据经过所述第二生成器生成的有标签样本数据之后再将该有标签样本数据 经过所述第一 生成器生成的无 标签样本数据。 8.根据权利要求5至7任一项所述的方法, 其特征在于, 使用所述多个簇的样本数据对 所述对抗网络进行训练包括: 将所述多个簇中的每个簇的样本数据分为样本对, 其中, 每个样本对均包括有标签样 本数据和无 标签样本; 使用所述样本对 对所述生成式对抗网络模型进行训练。 9.根据权利要求1所述的方法, 其特征在于, 使用所述多个簇 中的样本数据进行半监督 模型的训练包括: 使用所述多个簇中的样本数据对半监督的神经网络模型进行训练, 其中, 所述神经网 络模型的损失函数 的值是根据所述样本数据对应的簇标签以及所述神经网络模型输出的 标签之间的差距得到的。 10.根据权利要求1所述的方法, 其特 征在于, 还 包括: 获取所述每个簇内的有标签样本数据对应的标签; 将同一簇内有标签样本数据的标签的平均值作为该簇的簇标签。 11.一种训练处理装置, 其特征在于, 包括: 获取模块、 聚类模块、 生成模块和处理模块, 其中, 所述获取模块, 用于获取样本数据, 其中, 所述样本数据包括有标签样本数据和无标签 样本数据; 所述聚类模块, 用于将所述有标签样本数据和所述无标签样本数据进行聚类得到多个 簇; 所述获取模块, 还用于获取所述样本数据中的剩余样本数据, 其中, 所述剩余样本数据 为未与无 标签样本数据成簇的有标签样本数据;权 利 要 求 书 2/3 页 3 CN 115456100 A 3

.PDF文档 专利 一种训练处理方法、装置、电子设备和可读存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种训练处理方法、装置、电子设备和可读存储介质 第 1 页 专利 一种训练处理方法、装置、电子设备和可读存储介质 第 2 页 专利 一种训练处理方法、装置、电子设备和可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:11:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。