(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211063551.3
(22)申请日 2022.08.31
(71)申请人 郑州大学
地址 450001 河南省郑州市高新 技术开发
区科学大道100号
申请人 河南郑大道可信息技 术有限公司
(72)发明人 周兵 李浩 王俊淇 王培森
李凯江 李世华
(74)专利代理 机构 郑州大通专利商标代理有限
公司 41111
专利代理师 周艳巧
(51)Int.Cl.
G06V 30/40(2022.01)
G06V 30/244(2022.01)
G06T 5/00(2006.01)G06T 7/73(2017.01)
G06T 3/00(2006.01)
(54)发明名称
基于人事档案图像的文本字体标准化处理
方法及系统
(57)摘要
本发明属于数字档案管 理技术领域, 特别涉
及一种基于人事档案图像的文本字体标准化处
理方法及系统, 通过收集待处理档案图像数据;
并对待处理档案图像数据进行字体去模糊标准
化处理, 得到符合预设模糊度标准的图像数据;
对符合预设模糊度标准的图像数据进行字符灰
度标准化处理, 获取符合预设灰度标准的图像数
据; 对获取的符合预设灰度标准的图像数据进行
去噪处理并输出。 本发明采用图像去噪、 文字定
位、 文字对比度增强、 高清化处理等一系列处理,
实现字符灰度评价和字 符模糊度评价, 能够进行
自动智能化评判, 降低人为因素的干扰, 便于高
效便捷地实现一键档案图像标准化全流程, 提高
档案加工的处理效率, 为纸质档案数字化加工自
动化奠定坚实的基础。
权利要求书2页 说明书8页 附图4页
CN 115457577 A
2022.12.09
CN 115457577 A
1.一种基于人事档案图像的文本 字体标准 化处理方法, 其特 征在于, 包 含如下内容:
收集待处 理档案图像数据;
对待处理档案图像数据进行字体去模糊标准化处理, 得到符合预设模糊度标准的图像
数据;
对符合预设模糊度标准的图像数据进行字符灰度标准化处理, 获取符合预设灰度 标准
的图像数据;
对获取的符合预设灰度标准的图像数据进行去噪处 理并输出。
2.根据权利要求1所述的基于人事档 案图像的文本字体标准化处理方法, 其特征在于,
字体去模糊标准化处理中, 首先, 对待处理档案图像数据中的文字笔画内外边界线进行定
位, 然后, 依据各文字区域中内外边界竖直线灰度均值及文字笔画内部左右边界来获取文
字笔画对应侧 边的边缘模糊度; 将获取 的边缘模糊度与预设模糊度标准进行比较, 将符合
预设模糊度标准的边缘模糊度档案文字图像数据 送入字符灰度标准化处理中, 针对不符合
预设模糊度标准的边缘模糊度档案文字图像数据, 利用已训练的生成对抗网络对档案文字
图像数据进行优化处 理, 直至得到符合预设模糊度标准的边 缘模糊度档案文字图像数据。
3.根据权利要求2所述的基于人事档 案图像的文本字体标准化处理方法, 其特征在于,
获取文字笔画对应侧 边的边缘模糊度的过程包含如下内容: 首先, 利用预设的最大稳定极
值区域来得到图像数据中文字位置, 根据文字位置所在区域的起始 点和区域长宽来 获取文
字矩形框坐标; 然后, 对获取 的文字矩形框进行过滤, 以滤除无竖直笔画的文字矩形框, 并
针对每一个矩形框区域, 通过水平投影图及累加值大小来得到文字竖直线的内边界; 接着,
根据水平投影图及内边界, 利用模拟求极值算法来依次向左、 向右寻找左、 右外边界粗估
计, 并根据左、 右外边界粗估计及内边界, 在左、 右外边界粗估计区间内求解内边界依次向
左、 向右的最大斜率, 并记录向左、 向右 最大斜率对应的索引, 利用LSD直线检测算法在原始
图像数据中截取索引区间对应位置的图像, 通过索引对比过滤来定位单个文字竖直线的精
确外边界。
4.根据权利要求2所述的基于人事档 案图像的文本字体标准化处理方法, 其特征在于,
对档案文字图像数据进行优化处理的生成对抗网络包含用于生成 图像的生成器和用于判
别图像真假的判别器, 将不符合预设模糊度标准的边缘模糊度档案文字图像数据输入生成
器中, 利用生成器输出生成图像, 利用判别器对生成图像进 行真假判别, 并通过融合图像内
容损失及网络对抗损失的反向传播 来更新生成器参数。
5.根据权利要求4所述的基于人事档 案图像的文本字体标准化处理方法, 其特征在于,
针对生成器输出的生成图像, 利用基于笔画趋势预测的边缘检测算法来 获取生成图像和预
设清晰图像的边缘特征, 通过求取两个图像边缘特征的均方误差来 获取生成图像的边缘损
失; 并基于生成图像和预设清晰图像的模糊度, 通过求取两个图像的平均绝对误差来获取
生成图像的模糊度修正损失; 将边缘损失、 模糊度修正损失及像素差异损失作为图像内容
损失, 并结合网络对抗损失来构建生成对抗网络的组合优化目标损失函数。
6.根据权利要求1所述的基于人事档 案图像的文本字体标准化处理方法, 其特征在于,
字符灰度标准化处理中, 首先, 统计文字笔迹内像素点的灰度均值, 将该灰度均值作为用于
与预设灰度标准匹配的文字图像灰度指标; 对不符合预设灰度标准的文字图像进 行字体灰
度标准化的重复处 理, 直至使该文字图像符合预设灰度标准。权 利 要 求 书 1/2 页
2
CN 115457577 A
27.根据权利要求6所述的基于人事档 案图像的文本字体标准化处理方法, 其特征在于,
字体灰度标准化的重复处理过程包含如下内容: 首先, 定位图像数据中的文字区域; 然后,
遍历文字区域中每个像素 的灰度值, 利用窗函数来计算窗口中心元素 的边缘加权值, 利用
该边缘加权值来 获取文字区域内每个像素变换后的灰度值, 再次与预设灰度标准进行匹配
处理。
8.根据权利要求7所述的基于人事档 案图像的文本字体标准化处理方法, 其特征在于,
利用窗函数来计算窗口中心元素的边缘加权值的公式表示为:
其中, Gij
是窗口内坐标为(i, j)的像素灰度值,Δij是窗口内坐标为(i, j)的像素边缘算子, U表示窗
口区域, θ表示属于窗口U中的像素点, n ×n是窗口大小。
9.根据权利要求1所述的基于人事档 案图像的文本字体标准化处理方法, 其特征在于,
对获取的符合预设灰度标准的图像数据进行去 噪处理中, 首先, 基于空域像素特征 的双边
滤波去噪算法对图像进行首次去 噪, 然后, 基于变换域的小波变换对首次去 噪后的图像再
次进行去噪。
10.一种基于人事档案图像的文本字体标准化处理系统, 其特征在于, 包含: 图像收集
模块、 图像模糊度处 理模块、 图像灰度处 理模块和图像去噪输出模块, 其中,
图像收集模块, 用于收集待处 理档案图像数据;
图像模糊度处理模块, 用于对待处理档案 图像数据进行字体去模糊标准化处理, 得到
符合预设模糊度标准的图像数据;
图像灰度处理模块, 用于对符合预设模糊度标准的图像数据进行字符灰度标准化处
理, 获取符合预设灰度标准的图像数据;
图像去噪输出模块, 用于对获取的符合预设灰度标准的图像数据进行去噪处理并输
出。权 利 要 求 书 2/2 页
3
CN 115457577 A
3
专利 基于人事档案图像的文本字体标准化处理方法及系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:05:46上传分享