说明:最全专利文库
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210959151.4 (22)申请日 2022.08.10 (71)申请人 重庆帮企科技 集团有限公司 地址 400023 重庆市渝北区龙塔街道星 辰 路78号浩博星辰办公楼1幢1-商业 (72)发明人 李广 周号 (74)专利代理 机构 重庆创新专利商标代理有限 公司 50125 专利代理师 易文学 (51)Int.Cl. H04L 9/40(2022.01) (54)发明名称 一种基于浏览器指纹辨别的反爬虫方法 (57)摘要 本发明涉及数据信息传输技术领域, 具体涉 及一种基于浏览器指纹辨别的反爬虫方法, 浏览 器基于客户端请求生成指纹; 所述浏览器收集并 存储所述指纹, 得到真实指纹; 服务器基于所述 真实指纹验证所述客户端请求, 并做出对应的响 应, 该方法通过客户端请求目标网站后, 经脚本 收集设备信息, 根据设备信息计算出一段数值并 作为指纹, 将指纹送给服务器, 服务器拿到指纹 后与浏览器存储的真实指纹作对比, 对比结果相 同则判定 是真实用户访问, 反之则判定该请求为 非浏览器请求, 并拒绝访问返回数据, 达到保护 企业数据安全的目的, 解决现有反爬虫技术无法 达到保护企业数据安全 要求的问题。 权利要求书1页 说明书3页 附图3页 CN 115473684 A 2022.12.13 CN 115473684 A 1.一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 包括以下步骤: 浏览器基于客户端请求 生成指纹; 所述浏览器收集并存 储所述指纹, 得到真实指纹; 服务器基于所述真实指纹验证所述 客户端请求, 并做出对应的响应。 2.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述浏览器 基于客户端请求 生成指纹的具体方式: 所述浏览器 基于所述 客户端请求选择指纹参数; 对所述指纹参数进行评估, 得到属性 值; 对所述属性 值排列形成字符串, 并转换 所述字符串的字符序列生成所述指纹。 3.如权利要求2所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述指纹参数分为四类, 第一类: UserAgent、 屏幕分辨率、 平台、 语言he时区,第二类: 禁止追踪和插 件, 第三类: 用户是否修改了语言和分辨 率, 第四类canvas和webgl。 4.如权利要求2所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述转换所述字符串的字符序列生成所述指纹的算法为哈希算法。 5.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述字符序列为128位的16进制。 6.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述基于所述真实指纹验证所述 客户端请求, 并做出对应的响应的具体方式: 所述客户端向所述 服务器发起请求; 服务器检查所述请求内是否有所述指纹, 得到检查结果; 所述服务器将所述检查结果与所述真实指纹对比, 并做出对应的响应。 7.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 还包括通过同一所述指纹访问的频率对响应做出限制。权 利 要 求 书 1/1 页 2 CN 115473684 A 2一种基于浏览器指纹辨别的反爬虫方 法 技术领域 [0001]本发明涉及数据信息传输技术领域, 尤其涉及一种基于浏览器指纹辨别的反爬虫 方法。 背景技术 [0002]在现行的网络爬虫检测技术中, 一般网站从三个方面反爬虫: 通过Headers反爬 虫, 基于用户行为反爬虫, 动态页面的反爬虫。 前两个方面可以说是反爬虫策略中最为常见 的, 而第三个则是应用异步加载 的方式加载页面内容, 增大爬虫在对目标网站形成访问之 后获取数据的难度。 [0003]但现有反爬虫技术仅仅检验一下Headers或者做几个ip限制, 无法达到保护企业 数据安全的要求。 发明内容 [0004]本发明的目的在于提供一种基于浏览器指纹辨别的反爬虫方法, 旨在 解决现有反 爬虫技术无法达 到保护企业数据安全要求的问题。 [0005]为实现上述目的, 本发明提供了一种基于浏览器指纹辨别的反爬虫方法, 包括以 下步骤: [0006]浏览器基于客户端请求 生成指纹; [0007]所述浏览器收集并存 储所述指纹, 得到真实指纹; [0008]服务器基于所述真实指纹验证所述 客户端请求, 并做出对应的响应。 [0009]其中, 所述浏览器 基于客户端请求 生成指纹的具体方式: [0010]所述浏览器 基于所述 客户端请求选择指纹参数; [0011]对所述指纹参数进行评估, 得到属性 值; [0012]对所述属性 值排列形成字符串, 并转换 所述字符串的字符序列生成所述指纹。 [0013]其中, 所述指纹参数分为四类, 第一类: UserAgent、 屏幕分辨率、 平台、 语言he时 区,第二类: 禁止追踪和插件, 第三类: 用户是否修改了语言和分辨率, 第四类canvas和 webgl。 [0014]其中, 所述 转换所述字符串的字符序列生成所述指纹的算法为哈希算法。 [0015]其中, 所述字符序列为128位的16进制。 [0016]其中, 所述基于所述真实指纹验证所述客户端请求, 并做出对应的响应的具体方 式: [0017]所述客户端向所述 服务器发起请求; [0018]服务器检查所述请求内是否有所述指纹, 得到检查结果; [0019]所述服务器将所述检查结果与所述真实指纹对比, 并做出对应的响应。 [0020]其中, 还包括通过同一所述指纹访问的频率对响应做出限制。 [0021]本发明的一种基于浏览器指纹辨别的反爬虫方法, 浏览器基于客户端请求生成指说 明 书 1/3 页 3 CN 115473684 A 3
专利 一种基于浏览器指纹辨别的反爬虫方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-02-18 22:27:28
上传分享
举报
下载
原文档
(402.3 KB)
分享
友情链接
GB-T 24804-2023 提高在用电梯安全性的规范.pdf
360 数字安全观察 数据安全专刊 002.pdf
T-CSAE 284.1—2022 自动驾驶乘用车 线控底盘性能要求及试验方法 第1部分:驱动系统.pdf
GB-T 35392-2017 无损检测 电导率电磁 涡流 测定方法.pdf
GB-T 12572-2008 无线电发射设备参数通用要求和测量方法.pdf
GB-T 18494.1-2014 变流变压器 第1部分:工业用变流变压器.pdf
GB-T 19011-2021 管理体系审核指南.pdf
NB-T 10302-2019 电冰箱用双金属片式化霜温控器.pdf
DB43-T 2256-2021 信息技术应用创新工程建设规范第 13 部分:国产化信息系统运行维护规范 湖南省.pdf
GB-T 38558-2020 信息安全技术 办公设备安全测试方法.pdf
GB-T 33024-2016 柳编制品.pdf
专利 一种基于SOAR的防御自动化流程编排方法.PDF
GB-T 14685-2022 建设用卵石、碎石.pdf
GB-T 39901-2021 乘用车自动紧急制动系统(AEBS)性能要求及试验方法.pdf
GB-T 14926.8-2001 实验动物 支原体检测方法.pdf
GB-T 34575-2023 轨道交通 机车车辆变流设备 机车、动车组辅助变流器.pdf
GB-T 29246-2022 信息安全技术 信息安全管理体系 概述和词汇 征求意见稿.pdf
中汽研汽车检验中心 汽车个人信息保护白皮书 2022.pdf
DB15-T 839—2022 高速公路养护工程预算编制办法及定额 内蒙古自治区.pdf
中信证券 银行业财富管理深度研究系列第5期:银行财富管理的新趋势-2022.pdf
交流群
-->
1
/
8
评价文档
赞助3元 点击下载(402.3 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。