说明:最全专利文库
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211058391.3 (22)申请日 2022.08.31 (71)申请人 拓元 (广州) 智慧科技有限公司 地址 511455 广东省广州市南沙区丰泽 东 路106号 (自编1号楼) X13 01-B0132 90 (72)发明人 龚科 陈子良 陈添水  (51)Int.Cl. G06Q 30/06(2012.01) G06Q 30/02(2012.01) G06K 9/62(2022.01) (54)发明名称 基于用户行为及环境信息的智能货柜复购 预测方法及系统 (57)摘要 本发明提供了一种基于用户行为及环境信 息的智能货柜复购预测方法及系统, 所述方法包 括: S1、 数据收集及预处理: 从智能货柜中收集所 有用户的基本信息和历史订单信息, 并获取每笔 历史订单的环 境信息, 根据上述信息得到融合了 环境信息的用户画像数据, 即环境用户画像数 据; 其中, 所述环境信息包括订单成交时的天气 信息、 日期信息和周边竞品信息; S2、 特征构建及 筛选; S3、 模型训练和验证; S4、 复购行为预测。 本 发明充分挖掘无人零售场景下的用户画像, 并引 入环境信息作为用户历史购买行为的上下文补 充, 能够实现精确识别复购用户, 对营销策略产 生积极的指导 意义。 权利要求书3页 说明书7页 附图1页 CN 115409577 A 2022.11.29 CN 115409577 A 1.一种基于用户行为及环境信息的智能货柜复购预测方法, 其特征在于, 包括以下步 骤: S1、 数据收集及预处理: 从智能货柜中收集所有用户的基本信息和历史订单信息, 并获 取每笔历史订单 的环境信息, 根据上述信息得到融合了环境信息的用户画像数据, 即环境 用户画像数据; 其中, 所述环境信息包括订单成交时的天气信息、 日期信息和周边竞品信 息; S2、 特征构建及筛选: 将S1中生成的环境用户画像数据转换成连续型或离散型数值特 征, 拼接之后得到用户特征向量; 通过人为设计的特征 交叉规则对用户特征向量进 行扩充, 输出扩充后的用户特征向量集合; 对扩充后的用户特征向量集合中的特征进行筛选, 计算 特征重要性并降序排列, 删除重要性低于一定阈值的特 征, 得到最终的用户特 征向量集合; S3、 模型训练和验证: 建立模型, 基于S2中筛选后的特征拟合用户复购行为, 对一定时 间后的用户复购概率进行预测; 并通过交叉验证法或者留一法进行模型验证和参数选择, 得到最终模型M; S4、 复购行为预测: 调用最终模型M对用户的复购率进行预测, 并更新到智能货柜的后 台数据库。 2.根据权利要求1所述的基于用户行为及环境信息的智能货柜复购预测方法, 其特征 在于, 所述S1具体包括以下步骤: S101、 从智能货柜的线上日志中提取 所有用户的基本信息和历史订单信息; S102、 根据用户的注 册时间和历史购买时间筛 选出活跃用户, 输出活跃用户集 合U; S103、 针对活跃用户集合U中的用户, 获取其人口属性, 并通过用户ID检索得到历史订 单信息; 基于上述信息构建用户画像数据, 并以用户ID为索引输出; S104、 基于爬虫技术, 爬取每笔历史订单成交时的天气信息、 日期信息和周边竞品信 息; 基于上述信息构建订单环境数据, 并以订单ID为索引输出; S105、 将用户画像数据和订单环境数据以(用户ID, 订单ID)的对应关系进行组合, 得到 结构化的环境用户画像数据, 并上传到 本地或云端储 存介质。 3.根据权利要求2所述的基于用户行为及环境信息的智能货柜复购预测方法, 其特征 在于, 所述人口属性包括 性别、 年龄、 昵称、 是否开 通免密支付; 所述历史订单信息包括每个订单的购买时间、 订单内已购商品列表、 每种已购商品的 单价和数量; 所述日期信息包括 订单成交日期是否为周末或法定节假日; 所述周边 竞品信息包括周边便利店数量以及竞品价格。 4.根据权利要求3所述的基于用户行为及环境信息的智能货柜复购预测方法, 其特征 在于, 所述S102具体包括以下步骤: S1021、 根据用户注 册时长, 区分新用户和非新用户; S1022、 根据最近一段周期内有无购买行为, 从非新用户中区分活跃用户和静止用户。 5.根据权利要求3所述的基于用户行为及环境信息的智能货柜复购预测方法, 其特征 在于, 在S1021中, 区分新用户和非新用户的方法为: 选取某个月份作为起始月份, 计算起始月份的注册用户在后续若干个月份的留存率, 当从某个月份开始留存率趋 于稳定时, 计算该月份和起始月份的差值, 作为 新用户观察期;权 利 要 求 书 1/3 页 2 CN 115409577 A 2注册时间超过所述新用户观察期后, 还存在购买行为的用户, 定义为非新用户, 其余为 新用户。 6.根据权利要求3所述的基于用户行为及环境信息的智能货柜复购预测方法, 其特征 在于, 在S102 2中, 从非新用户中区分活跃用户和静止用户的方法为: 计算用户N+1月购买率, 其中, 用户N+1月购买率的定义为: 用户连续N个月未发生购买 行为, 且在第N+1个月发生购买行为的概 率; 当N大于某个整数值K时, 用户N+1月购买率始终处于较低水平, 则以连续K月内是否发 生购买行为作为活跃用户和静止用户的划分标准。 7.根据权利要求3所述的基于用户行为及环境信息的智能货柜复购预测方法, 其特征 在于, 还包括S5、 信息推送: 智能货柜根据用户的复购率预测数据, 推送新品或优惠信息 。 8.根据权利要求3所述的基于用户行为及环境信息的智能货柜复购预测方法, 其特征 在于, 所述S2具体包括: 将S1中生成的环境用户画像数据转换成连续型或离散型数值特征, 拼接之后得到用户 特征向量; 生成用户特征向量的高阶交叉特征, 即按照认为设计的特征交叉规则, 使用因子分解 机或深度神经网络模型将不同维度的特征值进行组合运算, 以对用户特征向量进行扩充, 输出扩充后的用户特 征向量集合; 将扩充后的用户特征向量集合作为单层二分类逻辑 回归模型的输入, 进行用户复购行 为预测, 并基于离线测试数据和组织在线A/B测试对模型进 行验证, 进一步调整模 型中各特 征的权重参数; 最 终将模型的权重参数作为特征重要性, 按照重要性对特征进 行降序排列, 将重要性低于一定阈值的特 征删除, 得到最终的用户特 征向量集合。 9.根据权利要求8所述的基于用户行为及环境信息的智能货柜复购预测方法, 其特征 在于, 所述S3具体包括: 基于不同的模型 结构选择并建立多个 基础模型; 将S2中最终的用户特 征向量集合划分为训练集和验证集; 设定基础模型的超参数, 并使用训练集训练基础模型, 基于S2中筛选后的特征拟合用 户复购行为, 对一定时间后的用户复购概 率进行预测; 然后在测试集上通过交叉验证法或者留一法对基础模型进行模型验证和参数选择; 基于测试指标选择 出最优的基础模型及其 参数组合, 得到最终模型M 。 10.一种基于用户行为及环境信息的智能货柜复购预测系统, 其特 征在于, 包括: 数据收集及预处理模块: 用于从智能货柜中收集所有用户的基本信息和历史订单信 息, 并获取每笔历史订单的环 境信息, 根据上述信息得到融合了环境信息的用户画像数据, 即环境用户画像数据; 其中, 所述环 境信息包括订单成交时的天气信息、 日期信息和周边竞 品信息; 特征构建及筛选模块: 用于将数据收集及预处理模块中生成的环境用户画像数据转换 成连续型或离散型数值特征, 拼接之后得到用户特征向量; 通过人为设计的特征交叉规则 对用户特征向量进行扩充, 输出扩充后的用户特征向量集合; 对扩充后的用户特征向量集 合中的特征进 行筛选, 计算特征重要性并降序排列, 删除重要性低于一定阈值的特征, 得到 最终的用户特 征向量集合;权 利 要 求 书 2/3 页 3 CN 115409577 A 3

.PDF文档 专利 基于用户行为及环境信息的智能货柜复购预测方法及系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于用户行为及环境信息的智能货柜复购预测方法及系统 第 1 页 专利 基于用户行为及环境信息的智能货柜复购预测方法及系统 第 2 页 专利 基于用户行为及环境信息的智能货柜复购预测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:31:57上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。