说明:最全专利文库
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210929865.0 (22)申请日 2022.08.03 (71)申请人 浙江鸿程计算机系统有限公司 地址 310023 浙江省杭州市余杭区五常街 道溪沁街10号 (72)发明人 胡伟良 吴勇 顾强峰 梁晓龙 徐梦蝶 李炳 罗超 梁建斌 何东昇 王帅 (74)专利代理 机构 杭州华鼎知识产权代理事务 所(普通合伙) 33217 专利代理师 刘竹青 (51)Int.Cl. G06Q 30/02(2012.01) G06N 20/00(2019.01) G06Q 50/30(2012.01) (54)发明名称 基于机器学习的高质量用户离网预警模型 构建方法 (57)摘要 本发明公开了基于机器学习的高质量用户 离网预警模型构建方法, 包括如下步骤: S1、 划定 电信高质量客户群体范围, 划分流失群体和未流 失群体; S2、 对历史数据中的流失群体进行数据 探索; S3、 收集与流失群体存在关联性的特征, 制 作数据宽表; S4、 对数据宽表中的数据进行预处 理后得到数值型特征数据; S5、 通过对宽表内数 据进行特征工程进而衍生多维度特征数据; S6、 通过多维度特征数据对机器学习模型进行训练 得到最优模型; S7、 采用最优模型对获取对应客 户的流失概率, 筛选流失概率大于P0的高质量客 户群体, 进行离网预警和处置。 构建了可 以准确 有效识别具有高流失倾向的用户群体的预警模 型, 为及时发现和干预用户离网行为提供数据模 型支持。 权利要求书2页 说明书6页 附图1页 CN 115471250 A 2022.12.13 CN 115471250 A 1.基于机器学习的高质量用户离网预警模型构建方法, 其特 征在于, 包括如下步骤: S1、 划定电信高质量客户群体范围, 通过制定客户的流失口径来划分流失群体和未流 失群体, 并将流失群 体作为负 样本, 未流失群 体作为正样本; S2、 对历史数据中的流失群体进行数据探索, 基于客户基础画像信息中流失群体与未 流失群体的业务行为变化进行多维度分析, 挖掘用户分群行为信息, 刻画出目标用户的特 征; S3、 收集与流失群体存在关联性的特征, 并将关联性的特征进行汇总, 制作具备N个特 征的数据宽表; S4、 构建完数据宽表后, 对数据宽表中的数据进行 预处理后得到数值型 特征数据; S5、 通过对宽表内数据进行 特征工程进 而衍生多维度特 征数据; S6、 将多维度特征数据作为机器学习模型的输入, 对机器学习模型进行训练得到最优 模型; S7、 采用最优模型对获取的得到的电信高质量客户群体数据进行运算, 得到对应客户 的流失概 率, 筛选流失概 率大于P0的高质量 客户群体, 进行离网预警和处置 。 2.根据权利要求1所述的基于机器学习的高质量用户离网预警模型构建方法, 其特征 在于, S1中, 若电信用户的消费金额超过m且同时具备电信移动产品和 宽带产品, 则将该类 电信用户作为高质量 客户; 若高质量客户对应的电信移动产品和宽带产品都被拆除, 则将该类高质量客户定义为 流失客户, 否则定义 为非流失客户。 3.根据权利要求1所述的基于机器学习的高质量用户离网预警模型构建方法, 其特征 在于, S2中, 数据探索的方式包括: S21、 查看数据类型 是否正确、 量纲是否一 致、 缺失值情况; S22、 通过箱线图来 查找数据的异常值; S23、 可视化数据分布情况, 对数据分布 异常的特 征采用对数转换 方式进行 更改; S24、 剔除相关性高于设定阈值的特 征。 4.根据权利要求3所述的基于机器学习的高质量用户离网预警模型构建方法, 其特征 在于, S21中, 查看数据类型 是否正确、 量纲是否一 致、 缺失值情况, 包括如下步骤: 若出现数据类型不 正确情况, 则根据数据的实际含义对数据的类型进行转 化; 若出现数据量纲不 一致情况, 则根据实际情况对数据的量纲进行调整; 若出现整个特征缺失的情况, 则查看源头数据和传输过程数据是否缺失, 若源头数据 缺失或/和传输过程数据缺失, 则剔除该缺失数据特 征。 5.根据权利要求1所述的基于机器学习的高质量用户离网预警模型构建方法, 其特征 在于, 关联性的特 征的分布包括: 基础画像信息上包括但不限于客户的入网时长、 客户星 级、 终端使用信息; 套餐基础信息上包括但不限于订购的电信套餐中所包 含的资源量、 套餐金额; 业务行为上包括但不限于客户产生的流 量、 语音、 短信使用量、 宽带使用量。 6.根据权利要求1所述的基于机器学习的高质量用户离网预警模型构建方法, 其特征 在于, S4中, 对数据宽表中的数据进行 预处理后得到数值型 特征数据包括如下步骤: 对特征缺失值进行处理, 包括: 针对不同类型的特征分别 采用均值填充、 众数填充、 0值权 利 要 求 书 1/2 页 2 CN 115471250 A 2填充以及扩充属性 值方法进行填充; 同时, 删除对流失群 体判断无效的特 征; 对特征进行编码, 包括但不限于采用了类别编码、 独热编码、 频率编码将不同类型的特 征转化为数值型 特征。 7.根据权利要求1所述的基于机器学习的高质量用户离网预警模型构建方法, 其特征 在于, S5中, 包括如下步骤: S51、 针对用户的业 务行为特 征进行衍 生, 构建月份差异、 均值、 方差类型 特征; S52、 衍生工作 日占总体情况的占比率特征以及白天流量使用情况占全天的占比率情 况特征; S53、 构建客户特 征值的缺失率作为 一个特征。 8.根据权利要求1所述的基于机器学习的高质量用户离网预警模型构建方法, 其特征 在于, S6中, 包括如下步骤: 构建基于LightGBM算法的机器学习模型, 采用梯度提升决策树作为集成学习器; 采用 网格搜索方法探索获取模型的最优 超参数; 选取精准 率、 召回率以及F1值作为模型效果的评估指标, 到最优 模型。 9.根据权利要求1所述的基于机器学习的高质量用户离网预警模型构建方法, 其特征 在于, S7中, 离网预警和处置包括如下步骤: 获取流失概 率大于P0的高质量 客户群体构建营销维系表; 针对营销维系表中 高质量客户群体的关联性的特 征的类别, 进行精准营销活动。权 利 要 求 书 2/2 页 3 CN 115471250 A 3
专利 基于机器学习的高质量用户离网预警模型构建方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-18 06:31:50
上传分享
举报
下载
原文档
(489.8 KB)
分享
友情链接
GB-T 21062.4-2007 政务信息资源交换体系 第4部分:技术管理要求.pdf
T-AIIA 003—2022 平行电动夹爪技术规范.pdf
GB-T 30761-2014 扁桃仁.pdf
GB-T 11446.4-2013 电子级水电阻率的测试方法.pdf
信通院 金融级数据库容灾备份技术报告-2021年.pdf
GB-T 6420-2017 货运挂车系列型谱.pdf
GB-T 18772-2017 生活垃圾卫生填埋场环境监测技术要求.pdf
GB-T 34073-2017 物联网压力变送器规范.pdf
永安在线 API安全建设白皮书.pdf
GB-T 33450-2016 科技成果转化为标准指南.pdf
数据安全管理总纲.pdf
DB3212-T 1117—2022 政务数据安全风险评估规范 泰州市.pdf
T-CI 046—2021 医用锗[68Ge]镓[68Ga]发生器及医用镓[68Ga]放射性药物的质量标准.pdf
GB-T 15925-2010 锑矿石化学分析方法 锑量测定.pdf
GB-T 37606-2019 钛-钢复合管.pdf
中国银保监会监管数据安全管理办法(试行).pdf
GB-T 38812.1-2020 直接还原铁 亚铁含量的测定 三氯化铁分解重铬酸钾滴定法.pdf
中华人民共和国密码法 2020.pdf
GB-T 41944-2022 丁基橡胶阻尼片.pdf
清华大学自动化系:2023预训练大模型与医疗:从算法研究到应用.pdf
交流群
-->
1
/
3
10
评价文档
赞助3元 点击下载(489.8 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。