说明:最全专利文库
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210959151.4 (22)申请日 2022.08.10 (71)申请人 重庆帮企科技 集团有限公司 地址 400023 重庆市渝北区龙塔街道星 辰 路78号浩博星辰办公楼1幢1-商业 (72)发明人 李广 周号  (74)专利代理 机构 重庆创新专利商标代理有限 公司 50125 专利代理师 易文学 (51)Int.Cl. H04L 9/40(2022.01) (54)发明名称 一种基于浏览器指纹辨别的反爬虫方法 (57)摘要 本发明涉及数据信息传输技术领域, 具体涉 及一种基于浏览器指纹辨别的反爬虫方法, 浏览 器基于客户端请求生成指纹; 所述浏览器收集并 存储所述指纹, 得到真实指纹; 服务器基于所述 真实指纹验证所述客户端请求, 并做出对应的响 应, 该方法通过客户端请求目标网站后, 经脚本 收集设备信息, 根据设备信息计算出一段数值并 作为指纹, 将指纹送给服务器, 服务器拿到指纹 后与浏览器存储的真实指纹作对比, 对比结果相 同则判定 是真实用户访问, 反之则判定该请求为 非浏览器请求, 并拒绝访问返回数据, 达到保护 企业数据安全的目的, 解决现有反爬虫技术无法 达到保护企业数据安全 要求的问题。 权利要求书1页 说明书3页 附图3页 CN 115473684 A 2022.12.13 CN 115473684 A 1.一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 包括以下步骤: 浏览器基于客户端请求 生成指纹; 所述浏览器收集并存 储所述指纹, 得到真实指纹; 服务器基于所述真实指纹验证所述 客户端请求, 并做出对应的响应。 2.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述浏览器 基于客户端请求 生成指纹的具体方式: 所述浏览器 基于所述 客户端请求选择指纹参数; 对所述指纹参数进行评估, 得到属性 值; 对所述属性 值排列形成字符串, 并转换 所述字符串的字符序列生成所述指纹。 3.如权利要求2所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述指纹参数分为四类, 第一类: UserAgent、 屏幕分辨率、 平台、 语言he时区,第二类: 禁止追踪和插 件, 第三类: 用户是否修改了语言和分辨 率, 第四类canvas和webgl。 4.如权利要求2所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述转换所述字符串的字符序列生成所述指纹的算法为哈希算法。 5.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述字符序列为128位的16进制。 6.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 所述基于所述真实指纹验证所述 客户端请求, 并做出对应的响应的具体方式: 所述客户端向所述 服务器发起请求; 服务器检查所述请求内是否有所述指纹, 得到检查结果; 所述服务器将所述检查结果与所述真实指纹对比, 并做出对应的响应。 7.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 还包括通过同一所述指纹访问的频率对响应做出限制。权 利 要 求 书 1/1 页 2 CN 115473684 A 2一种基于浏览器指纹辨别的反爬虫方 法 技术领域 [0001]本发明涉及数据信息传输技术领域, 尤其涉及一种基于浏览器指纹辨别的反爬虫 方法。 背景技术 [0002]在现行的网络爬虫检测技术中, 一般网站从三个方面反爬虫: 通过Headers反爬 虫, 基于用户行为反爬虫, 动态页面的反爬虫。 前两个方面可以说是反爬虫策略中最为常见 的, 而第三个则是应用异步加载 的方式加载页面内容, 增大爬虫在对目标网站形成访问之 后获取数据的难度。 [0003]但现有反爬虫技术仅仅检验一下Headers或者做几个ip限制, 无法达到保护企业 数据安全的要求。 发明内容 [0004]本发明的目的在于提供一种基于浏览器指纹辨别的反爬虫方法, 旨在 解决现有反 爬虫技术无法达 到保护企业数据安全要求的问题。 [0005]为实现上述目的, 本发明提供了一种基于浏览器指纹辨别的反爬虫方法, 包括以 下步骤: [0006]浏览器基于客户端请求 生成指纹; [0007]所述浏览器收集并存 储所述指纹, 得到真实指纹; [0008]服务器基于所述真实指纹验证所述 客户端请求, 并做出对应的响应。 [0009]其中, 所述浏览器 基于客户端请求 生成指纹的具体方式: [0010]所述浏览器 基于所述 客户端请求选择指纹参数; [0011]对所述指纹参数进行评估, 得到属性 值; [0012]对所述属性 值排列形成字符串, 并转换 所述字符串的字符序列生成所述指纹。 [0013]其中, 所述指纹参数分为四类, 第一类: UserAgent、 屏幕分辨率、 平台、 语言he时 区,第二类: 禁止追踪和插件, 第三类: 用户是否修改了语言和分辨率, 第四类canvas和 webgl。 [0014]其中, 所述 转换所述字符串的字符序列生成所述指纹的算法为哈希算法。 [0015]其中, 所述字符序列为128位的16进制。 [0016]其中, 所述基于所述真实指纹验证所述客户端请求, 并做出对应的响应的具体方 式: [0017]所述客户端向所述 服务器发起请求; [0018]服务器检查所述请求内是否有所述指纹, 得到检查结果; [0019]所述服务器将所述检查结果与所述真实指纹对比, 并做出对应的响应。 [0020]其中, 还包括通过同一所述指纹访问的频率对响应做出限制。 [0021]本发明的一种基于浏览器指纹辨别的反爬虫方法, 浏览器基于客户端请求生成指说 明 书 1/3 页 3 CN 115473684 A 3

PDF文档 专利 一种基于浏览器指纹辨别的反爬虫方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于浏览器指纹辨别的反爬虫方法 第 1 页 专利 一种基于浏览器指纹辨别的反爬虫方法 第 2 页 专利 一种基于浏览器指纹辨别的反爬虫方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:27:28上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。