说明:最全专利文库
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
ICS 35.040 L 71 GB 中华人民共和国国家标准 GB/T21023—2007 中文语音识别系统通用技术规范 General specification for Chinese speech recognition system 2007-06-29发布 2007-11-01实施 中华人民共和国国家质量监督检验检疫总局 发布 中国国家标准化管理委员会 GB/T21023—2007 目 次 前言 III 范围 规范性引用文件 2 术语和定义 语音识别系统分类及表述 4. 1 基于用途的分类 4. 2 基于词汇量的分类 4. 3 基于所能识别的说话人群的分类 4.4 基于系统工作模式的分类 4.5 语音识别系统的应用环境 4.6 语音识别系统使用背景环境 语音识别系统表述规范 4.7 5语音识别系统性能指标 5. 1 概述 5.2 识别性能分类指标 5.3响应时间指标 5. 4 系统分类指标要求 6语音输人和识别输出 6. 1 语音识别输入准则 6.2语音识别输出准则 7 语音识别系统性能测试方法 7. 1 概述 7. 2 测试语料设计 7. 3 测试语音录制 7. 4 基于语音识别标准库的测试方法 7. 5 基于现场口呼的测试方法 7. 6 测试报告内容 8语音识别标准库及规范 8. 1 概述 8.2语音识别标准库语音特性的描述 8.3 语音识别标准库的标注 8 8. 4 语音识别标准库的来源 8.5语音识别标准库的数据转换 附录A(资料性附录)听写系统有关符号读法 附录B(资料性附录) 语音识别用无调汉语拼音表 11 参考文献 12 GB/T 21023—2007 前言 请注意本标准的某些内容有可能涉及专利。本标准的发布机构不承担识别这些专利的责任 本标准的附录A、附录B是资料性附录。 本标准由中华人民共和国信息产业部提出。 本标准由全国信息技术标准化技术委员会归口。 本标准由中国电子技术标准化研究所、中国科学院自动化研究所、清华大学、中国社会科学院语言 研究所起草。 本标准主要起草人:徐波、孙甲松、李爱军、徐明星、黄泰翼、鲍怀翘、尹波、吴志刚。 II GB/T21023—2007 中文语音识别系统通用技术规范 1范围 本标准规定了中文语音识别系统的基本术语、分类,技术指标、测试方法,输入/输出以及中文语音 识别标准库等。 本标准适用于各种计算机、网络和终端设备配置的中文语音识别系统。本标准的制定和实施主要 用于指导中文语音识别系统的研制、应用和测试。 2规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有 的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究 是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB18030—2005信息技术中文编码字符集 3术语和定义 下列术语和定义适用于本标准。 3. 1 语音识别 speechrecognition 将人类的声音信号转化为文字或者指令的过程。 3. 2 语音识别系统 speech recognition system 具有语音识别功能的开发工具、软件、装置或应用。 3.3 词汇表 vocabulary list 语音识别系统所包含和处理的所有词汇。 3. 4 激活词汇 activeword 语音识别系统在某个时间点能同时识别的所有词汇。 3.5 发音utterance 用户输入的一个语音单位,可以是词、短语或句子。发音单元之间需有有意、明显停顿。 3. 6 孤立字语音isolatedwordspeech 以字为发音单元,字与字之间需有有意、明显停顿的语音。 3.7 连接词语音 connected word speech 以词为发音单元,词与词之间需有有意、明显停顿的语音 3.8 连续语音 continuous speech 词与词之间无需刻意停顿的自然发音语音。 注:包括朗读语音和自然语音。 GB/T21023—2007 3. 9 汉语通用语 Mandarin and its dialect variation 普通话以及普通话的地方变体。 注:为中国人跨地区交流时最常见之普通话。 3. 10 同构语音数据 isomorphic speech data 除说话人不同外,其他语音属性相同或基本相同的语音数据集合。 3. 11 语音识别工作模式 working modefor speechrecognition 语音识别系统对说话方式、内容以及句型等的限制。 3. 12 标准配置 standardconfiguration 正常运行语音识别所需要的基本计算机配置 注:如CPU、内存、网络、麦克风、A/D精度要求等,由生产厂家给出。 3.13 系统自适应 speaker adaption 语音识别系统通过用户发音完成对识别模型参数修改的自适应过程。 3.14 用户自适应 user adaption 用户熟悉应用系统、了解自动语音识别系统特性的学习过程 3.15 删除错误deletionerror 用户所发语音在语音识别结果中没有出现的错误。 3. 16 插入错误insertionerror 用户没有发的语音在识别结果中出现的错误。 3. 17 替换错误 substitution error 用户所发语音被识别成其他语音的语音识别错误。 3. 18 被测系统 system for testing 参加评估的语音识别系统。 3. 19 测试系统 testing system 对被测系统进行评估的系统和体系。 3.20 副语言学 paralinguistic feature 言语中非音段的语音特征以及种种非语音信号。 注:这些行为被充分用来对总的交际效应作出贡献 4语音识别系统分类及表述 语音识别系统可以基于不同的用途、不同的词汇量、所能适应的不同人群、不同的工作模式、不同的 应用平台进行分类。基本分类可以融合,例如某个系统可以是“基于PC平台的超天词汇量特定人群书 2
GB-T 21023-2007 中文语音识别系统通用技术规范
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 思安 于
2023-02-21 17:30:58
上传分享
举报
下载
原文档
(2.7 MB)
分享
友情链接
GB-T 31509-2015 信息安全技术 信息安全风险评估实施指南 .pdf
GB-T 31914-2015 电子文件管理系统建设指南.pdf
GB-T 42107-2022 国家科技重大专项文件归档与档案管理规范.pdf
GB-T 30275-2013 信息安全技术 鉴别与授权 认证中间件框架与接口规范.pdf
路笑凡 Web安全在实战中技战法 2021.pdf
GB-T 38472-2019 再生铸造铝合金原料.pdf
GB-T 7894-2023 水轮发电机基本技术要求.pdf
GB-T 38664.4-2022 信息技术 大数据 政务数据开放共享 第4部分:共享评价.pdf
DB12-T 1083-2021 公务用车平台运行管理规范 天津市.pdf
GB-T 33222-2016 机械产品生命周期管理系统通用技术规范.pdf
GB-T 25283-2023 矿产资源综合勘查评价规范.pdf
DL-T 1066-2023 水电站设备检修管理导则.pdf
DB13-T 2957-2019 工业计量与控制数字化应用规范 河北省.pdf
GB/Z 24294.2-2017 信息安全技术 基于互联网电子政务信息安全实施指南 第2部分:接入控制与安全交换.pdf
GM-T 0002-2012 SM4分组密码算法.pdf
GB-T 30761-2014 扁桃仁.pdf
国家医疗保障局关于加强网络安全和数据保护工作的指导意见.pdf
YD-T 3763.3-2021 研发运营一体化(DevOps)能力成熟度模型 第3部分:持续交付.pdf
T-ZZB 1837—2020 氟塑料衬里不锈钢球阀.pdf
GB-Z 43030-2023 低压开关设备和控制设备 网络安全.pdf
1
/
3
15
评价文档
赞助3元 点击下载(2.7 MB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。