说明:最全专利文库
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210931243.1 (22)申请日 2022.08.04 (71)申请人 新疆大学 地址 830046 新疆 维吾尔自治区乌鲁 木齐 市天山区胜利路6 66号 (72)发明人 赵晖 杨立立 邵宇颉  (74)专利代理 机构 吉林长春新纪元专利代理有 限责任公司 2 2100 专利代理师 王怡敏 (51)Int.Cl. G06Q 30/02(2012.01) G06Q 30/06(2012.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06N 5/00(2006.01) G06N 20/20(2019.01) (54)发明名称 基于深度学习的客户流失预测方法及系统 (57)摘要 本发明涉及一种基于深度学习的客户流失 预测方法及系统, 属于人工智 能领域。 通过用户 在电商平台使用的相关用户日志, 抽取相关属 性, 构建用户行为特征信息。 根据用户流失原因 构建了多个维度的用户行为特征, 使用皮尔逊系 数与卡方检验法确定最终用户特征。 针对用户兴 趣变化和用户全局行为习惯对流失预测不同的 影响, 提出了用户动静态融合策略。 搭建XGB ‑ LGCNN预测模型, 利用分类器模型进行用户流失 预测。 解决了传统机器学习方法在预测用户流失 概率时效率低、 不准确的问题。 能够准确判断用 户流失的概率, 提高流失判断精度, 降低人工盲 目验证及统计的成本 。 权利要求书2页 说明书15页 附图3页 CN 115187312 A 2022.10.14 CN 115187312 A 1.一种基于深度学习的客户流失预测方法, 其特 征在于: 包括如下步骤: 步骤1、 数据来源: 通过获取电商平台记录用户行为的日志数据, 抽取特征属性, 构建用 户行为特征信息; 分析引起用户流失的不同原因构建用户流失特征, 从 “个人画像 ”、“购买 力”、“参与度”、“忠诚度”四个维度构建用户的流失特征, 不同的维度代表用户与平台之间 不同的关系, 其中用户流失特 征构建细节信息如下: 个人画像: 用户id、 性别、 注 册时长、 年龄; 购买力: 最近一次消费、 每单平均消费金额、 商品平均消费金额、 消费总金额、 消费总数 量、 消费总次数; 参与度: 登录总天数、 登录总次数、 点击商品总次数; 忠诚度: 最后一次登录、 登录频率、 使用总时长; 步骤2、 特 征处理: 对步骤1中获取的用户信息数据进行 预处理, 预处理环节如下: 2.1、 删除离群值较大或明显不 合理的用户特 征信息数据; 2.2、 根据用户特 征空值的情况与填充值的真实物理意 义来填充数值空值; 2.3、 删除噪声数据, 以免影响最终模型流失预测的准确性; 2.4、 将用户特 征中的类别变量进行 数值化处理; 2.5、 删除无效用户特 征信息数据; 2.6、 数据标准 化处理, 使用z ‑score函数对用户数值特 征进行处 理; 根据用户流失原 因构建了多个维度的用户行为特征, 使用皮尔逊系数与卡方检验法确 定最终用户特征, 选出对于用户流 失预测更有效的特征, 去除了冗余或者干扰性强的特征; 针对用户兴趣变化和用户全局行为习惯对流 失预测不同的影响, 提出了用户动静态融合策 略; 对用户行为特征进行分类, 划分用户 动态与静态特征, 形成需要的用户行为特征数据 集, 并按照比例分为训练样本和 测试样本; 步骤3、 模型构建: 搭建极限梯度提升树 ‑长短期记忆门控卷积神经网络预测模型, 所述 极限梯度提升树 ‑长短期记忆门控卷积神经网络预测模型由长 短期记忆门控卷积神经网络 模型与极限梯度提升树组成, 长短期记忆门控卷积神经网络模型 由长短期记忆神经网络、 门机制及卷积神经网络的网络层以及最后的全连接层组成; 极限梯度提升树是梯度提升决 策树的一类变种, 长短期记忆门控卷积神经网络模型用于处理用户动态特征, 极限梯度提 升树用于处 理用户静态特 征, 最后通过全连接层融合, 得到更好的特 征数据; 步骤4、 模型训练: 利用步骤2中选出的最终用户流失特征, 使用训练样本对搭建极限梯 度提升树 ‑长短期记忆门控卷积神经网络预测模型进行训练, 根据训练模型预测结果与测 试样本中的对应的真实标签作比较, 评估训练模型的预测准确率与F1值, 选取准确 率较高 的训练好的极限梯度提升树 ‑长短期记忆门控卷积神经网络预测模型作为实际应用中的模 型; 步骤5、 进行用户流失预测: 将用户数据输入到经步骤4训练好的极限梯度提升树 ‑长短 期记忆门控卷积神经网络预测模型, 得到待测用户的流失概 率。 2.根据权利要求1所述的基于深度学习的客户流失预测方法, 其特征在于: 所述的步骤 1获取的用户信息中, “消费总金额 ”、“消费总数量 ”、“登录总天数 ”、“登录频率 ”、“点击商品 总次数”、“使用总时长”为动态特征数据, 除了获取整个观察期的总数之外还需要分组处 理, 数据集记录观察期为90天, 按规定时间粒度7天一个分组, 分为13组。权 利 要 求 书 1/2 页 2 CN 115187312 A 23.根据权利要求1所述的基于深度学习的客户流失预测方法, 其特征在于: 最终选择的 特征对于预测结果有着较大 的影响, 使用皮尔逊系 数与卡方检验法确定最终用户特征, 根 据计算结果保留特征重要性最高、 相关性最低的特征, 以此来保证选出对于用户流失预测 更有效的特 征, 去除了 冗余或者干扰性强的特 征。 4.根据权利要求1所述的基于深度学习的客户流失预测方法, 其特征在于: 步骤2.6所 述的数据标准 化处理, 使用z ‑score函数对用户数值特 征进行处 理, 具体是: z‑score, 也叫标准分数, 是一个数与平均数的差再除以标准差的过程, 标准分数是一 个观测或数据点的值高于被观测值或测量值的平均值的标准偏差的符号数, 公式如下所 示: 式中X为原始数据, 为平均数, s为标准差; Z‑score也是数据归一化处理的一种方法, 如果统计数据量足够多, Z ‑score数据分布 满足, 68%的数据分布在 “‑1”与“1”之间, 95%的数据分布在 “‑2”与“2”之间, 99%的数据分 布在“‑3”与“3之间”; Z‑score适用于数据分布过于 凌乱, 无法判断最大值与最小值, 或者数 据中存在过多的奇异点的情况。 5.根据权利要求1所述的基于深度学习的客户流失预测方法, 其特征在于: 将处理后的 用户动静态特征向量分别输入到模型的不同模块进行 处理, 以便于更有效的发挥不同模块 的特征提取能力, 其中, LGCNN用于处理用户动态特征, XGBoost用于处理用户静态特征, 最 后通过全连接层融合, 得到更好的特 征数据, 从而提升预测效果, 得到最终的预测结果。 6.一种基于深度学习的客户流失预测系统, 其特 征在于: 包括: 数据源模块, 搜集用户的原始数据, 根据筛选的用户流失特征, 保留所需特征生成所需 数据表, 存储于数据库中, 包括围绕 “个人画像 ”,“购买力”,“参与度”,“忠诚度”四个维度构 建用户的流失特 征相关的用户行为数据; 预处理模块, 删除离群值较大或明显不合理的用户特征信息数据, 删除无效用户特征 信息数据以及噪声数据, 根据用户特征空值的情况与填充值的真实物理意义来填充数值空 值, 对数据进 行数据标准化处理, 存储于数据库中, 根据用户流 失原因构建了多个维度的用 户行为特征, 使用皮尔逊系 数与卡方检验法确定最终用户特征, 选出对于用户流失预测更 有效的特征, 去除了冗余或者干扰性 强的特征, 并存入数据库, 形成 需要的预 处理用户行为 特征数据集; 动静态特征处理模块, 对用户行为特征进行分类, 划分用户动态与静态特征, 动态特征 根据规定时间粒度划分所需要规格的数据; 最终一个用户的行为数据由静态特征数据与动 态特征数据组成, 并存入数据库, 形成 需要的用户行为特征数据集, 并按照比例随机 分为训 练样本和 测试样本; 流失用户预测模块, 包含用户数据读取、 流失算法模型和预测结果输出三个子模块, 在 此模块, 用户在进行用户流 失预测前需要 上传所要预测的电商平台记录用户行为的日志数 据, 随后通过用户数据读取模块上传包含选出 的最终用户流失特征 的用户行为数据集, 有 流失算法模型对上传的用户行为数据集进 行流失预测, 预测得到的结果可以进行打印或者 导出并保存到 本地指定文件夹 。权 利 要 求 书 2/2 页 3 CN 115187312 A 3

.PDF文档 专利 基于深度学习的客户流失预测方法及系统

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于深度学习的客户流失预测方法及系统 第 1 页 专利 基于深度学习的客户流失预测方法及系统 第 2 页 专利 基于深度学习的客户流失预测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:31:54上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。