说明:最全专利文库
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211229796.9 (22)申请日 2022.10.09 (71)申请人 竹间智能科技 (上海) 有限公司 地址 200030 上海市徐汇区宜山路70 0号B2 幢楼18层整层 (72)发明人 简仁贤 王海波 马永宁 (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 肖鹏 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 7/00(2006.01) (54)发明名称 一种知识图谱构建方法、 装置、 电子设备及 存储介质 (57)摘要 本申请提供一种知识图谱构建方法、 装置、 电子设备及存储介质, 用于改善构建知识图谱的 效率较低的问题。 该方法包括: 获取待处理文本, 并预测出待处理文本对应的多个实体组合, 多个 实体组合中的每个实体组合包括: 头实体值和尾 实体类型, 以及头实体值对应的头实体类型与尾 实体类型之间的关联关系; 对头实体值、 关联关 系、 尾实体类型和待处理文本进行编码, 获得编 码文本表 示; 预测出编码文本表 示中尾实体类型 对应的尾实体值; 根据头实体值、 关联关系和尾 实体值形成的三元组信息构建知识图谱。 权利要求书2页 说明书13页 附图3页 CN 115510243 A 2022.12.23 CN 115510243 A 1.一种知识图谱构建方法, 其特 征在于, 包括: 获取待处理文本, 并预测出所述待处理文本对应的多个实体组合, 所述多个实体组合 中的每个实体组合包括: 头实体值和尾实体类型, 以及所述头实体值对应的头实体类型与 所述尾实体 类型之间的关联关系; 对所述头实体值、 所述关联关系、 所述尾实体类型和所述待处理文本进行编码, 获得编 码文本表示; 预测出所述编码文本表示中所述尾实体 类型对应的尾实体值; 使用所述头实体值、 所述关联关系 、 所述尾实体值构建知识图谱。 2.根据权利要求1所述的方法, 其特征在于, 所述预测出所述待处理文本对应的多个实 体组合, 包括: 使用联合学习模型分别从所述待处理文本中预测出所述头实体值、 所述尾实体类型和 所述关联关系, 所述联合学习模型是通过序列标注任务和多标签分类任务进 行多任务联合 学习获得的。 3.根据权利要求1所述的方法, 其特征在于, 所述预测出所述待处理文本对应的多个实 体组合, 包括: 使用序列 标注模型从所述待处理文本 中预测出所述头实体值和所述尾实体类型, 并使 用多标签分类模型 预测出所述关联关系。 4.根据权利要求1所述的方法, 其特征在于, 在所述对所述头实体值、 所述关联关系、 所 述尾实体 类型和所述待处 理文本进行编码之前, 还 包括: 对所述多个实体组合进行筛 选, 获得筛 选后的实体组合; 从所述筛 选后的实体组合中解析 出所述头实体值、 所述关联关系和所述尾实体 类型。 5.根据权利要求4所述的方法, 其特征在于, 所述实体组合还包括: 所述头实体值对应 的头实体 类型; 所述对所述多个实体组合进行筛 选, 获得筛 选后的实体组合, 包括: 针对所述多个实体组合中的每个实体组合, 判断该实体组合中的头实体类型、 尾实体 类型和所述关联关系是否满足预设模式约束, 所述预设模式约束中是预先设置的头实体类 型与尾实体 类型的关联关系约束; 若否, 则将该实体组合从所述多个实体组合中剔除。 6.根据权利要求5所述的方法, 其特征在于, 所述对所述头实体值、 所述关联关系、 所述 尾实体类型和所述待处 理文本进行编码, 包括: 对所述头实体类型、 所述头实体值、 所述关联关系、 所述尾实体类型和所述待处理文本 进行编码。 7.根据权利要求5所述的方法, 其特征在于, 在所述使用所述头实体值、 所述关联关系、 所述尾实体值构建知识图谱之后, 还 包括: 将所述头实体值对应的头实体 类型存储为所述头实体值在所述知识图谱中的属性 值; 和/或, 将所述尾实体值对应的尾实体类型存储为所述尾实体值在所述知识图谱中的 属性值。 8.根据权利要求1所述的方法, 其特征在于, 所述使用所述头实体值、 所述关联关系、 所 述尾实体值构建知识图谱, 包括: 针对所述多个实体组合中的每个实体组合, 将该实体组合中提取出的所述头实体值、权 利 要 求 书 1/2 页 2 CN 115510243 A 2所述关联关系和所述尾实体值构建三元组信息, 获得多个三元组信息; 使用所述多个三元组信息构建所述知识图谱。 9.根据权利要求1 ‑8任一所述的方法, 其特征在于, 所述预测出所述编码文本表示中所 述尾实体 类型对应的尾实体值, 包括: 使用神经网络模型 预测出所述编码文本表示中所述尾实体 类型对应的尾实体值。 10.一种知识图谱构建装置, 其特 征在于, 包括: 实体组合预测模块, 用于获取待处理文本, 并预测出所述待处理文本对应的多个实体 组合, 所述多个实体组合中的每个实体组合包括: 头实体值和尾实体类型, 以及所述头实体 值对应的头实体 类型与所述尾实体 类型之间的关联关系; 编码文本获得模块, 用于对所述头实体值、 所述关联关系、 所述尾实体类型和所述待处 理文本进行编码, 获得编码文本表示; 尾实体值预测模块, 用于预测出所述编码文本表示中所述尾实体类型对应的尾实体 值; 知识图谱构建模块, 用于使用所述头实体值、 所述关联关系、 所述尾实体值构建知识图 谱。 11.一种电子设备, 其特征在于, 包括: 处理器和存储器, 所述存储器存储有所述处理器 可执行的机器可读指 令, 所述机器可读指令被所述处理器执行时执行如权利要求1至9任一 所述的方法。 12.一种计算机可读存储介质, 其特征在于, 该计算机可读存储介质上存储有计算机程 序, 该计算机程序被处 理器运行时执 行如权利要求1至9任一所述的方法。权 利 要 求 书 2/2 页 3 CN 115510243 A 3
专利 一种知识图谱构建方法、装置、电子设备及存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-17 23:40:31
上传分享
举报
下载
原文档
(666.7 KB)
分享
友情链接
信通院 数据治理研究报告-2020年——培育数据要素市场路线图.pdf
GB-T 37904-2019 土方机械 步履式液压挖掘机.pdf
DL-T 2021-2019 抽水蓄能机组设备监造导则.pdf
NIST 特别出版物 800 安全软件开发框架 (SSDF) 1.1 版:降低软件漏洞风险的建议o.pdf
GB-T 41547-2022 地采暖用木质地板.pdf
GB-T 42716-2023 电化学储能电站建模导则.pdf
T-CHEAA 0018—2021 家用和类似用途洗地机.pdf
生成式人工智能(AIGC).pdf
GB-T 32280-2022 硅片翘曲度和弯曲度的测试 自动非接触扫描法.pdf
T-IMCPNT 001—2024 中国马奶之乡特色产业示范旗建设与管理指南.pdf
T-CEC 596—2022 量子IPSec VPN设备功能与检测技术规范.pdf
IT管理制度.pdf
GB-T 40753.3-2024 供应链安全管理体系 ISO 28000实施指南 第3部分:中小企业采用ISO 28000的附加特定指南 海港除外.pdf
DB3311-T 126─2020 政务部门核心业务梳理规范 丽水市.pdf
GB-Z 41599-2022 车辆总质量监测.pdf
DB52-T 1239.2-2017 政府数据 核心元数据 第2部分:法人单位基础数据 贵州省.pdf
GB-T 30282-2023 信息安全技术 反垃圾邮件产品技术规范.pdf
GB-T 41885-2022 浮空器分类和分级.pdf
T-CHAS 10-2-3—2018 中国医院质量安全管理 第2-3部分:患者服务 急救绿色通道.pdf
GB-T 15846-2006 集装箱门框密封条.pdf
1
/
3
19
评价文档
赞助3元 点击下载(666.7 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。