Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

基于计算技术的语音语料库标注方法研究论文

发布时间:2023-06-25 15:12:52 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com)

  摘 要:在现代信息技术革新发展中,科研学者在开发设计语音识别系统时,需要利用正确的音标标注和词汇标注,构建 规范有效的语音语言模型。由于在语音语料库中添加音标和词汇标注,需要消耗大量的人力物力,并且现有系统无法实现自动 标注,所以只能利用手工标注来完成。本文在了解数据标注技术研究现状的基础上,根据语音语料库的标注形式和影响因素, 分析以计算技术为核心的语音语料库标注方法,而后结合实践应用结果进行验证分析。最终结果显示,利用计算技术进行标 注,能有效低成本的生成词汇和音标的标注。

  Research on Annotation Method of Speech Corpus Based on Computing Technology

  YANG Zheng, MA Yanzhou

  (Strategic Support Force Information Engineering University, Luoyang Henan 471000)
 
  【Abstract】:In the innovation and development of modern information technology, researchers need to make use of correct phonetic symbols and vocabulary annotations to build standard and effective speech language models when developing and designing speech recognition systems. It takes a lot of manpower and material resources to add phonetic symbols and vocabulary annotations to the speech corpus, and the existing system cannot realize automatic annotation, so it can only be completed by manual annotation. On the basis of understanding the research status of data annotation technology, this paper analyzes the annotation methods of speech corpus based on computing technology according to the annotation forms and influencing factors of speech corpus, and then carries out verification analysis based on the practical application results. The final results show that using computing technology to annotate can effectively and cheaply generate the annotation of words and phonetic symbols.

  【Key words】:computing technology;phonetic corpus;annotation method;phonetic notation;words tagging

  0 引言

  从本质上讲, 无论是音标标注还是词汇标注, 都会 将语音集合为相对应的标注信息,添加到语音语料库 中,这种任务形式与标注图像信息非常类似,因此在 研究中可以借鉴学习图像标注的实践方法。在现代信息 技术革新发展中,运用人类计算技术构建语言学习系 统,将语音语料库的标注工作和英语学习的教学工作融 合到一起,就能在分布式知识获取中完成语音语料库的 标注。虽然这个语言学习系统和图像标注的网络游戏一 致,都运用了人类计算技术,但两者所提供的服务存在较大差别,前者是为英语学习提供有效平台,而后者是 为系统用户提供游戏乐趣。因此,本文在了解当前数据 标注技术研究现状的基础上,主要探讨以计算技术为核 心的语音语料库标注方法。

\

  1 数据标注技术的发展现状

  传统人工标注不仅会邀请专家或专业员工参与业务 处理,还会利用多样化的离线软件进行操作,无论是任 务生成还是分配回收等环节,都需要员工手动完成。对 标注人员而言,由于语音语料库的标注工作需要消耗大 量的时间和精力,参与者很容易产生疲劳感,就算是运

  用交叉验证等方式,也很难控制标识错误的发生率。这 就代表大数据时代下语音语料库的标注工作,不仅需要 投入大批人力成本和时间精力,而且无法保障实际工作 效率和质量,因此大多数企业机构只会组织小规模的标 注任务,最终致使高性能 ASR 研究经常面临缺少大规 模高质量标注语料资源的发展困境 [1]。现如今,各国学 者在实践探究中提出了多种标准方法,其中社会标注就 是以 Web2.0 为核心提出的,其关键技术在于让社会大 众可以开放自由地分享信息。

  2 语音语料库的标注

  2.1 手工标注

  这种标注方法是指安排接受过专门语言学训练的专 家处理,会从人类专家的身上直接获取语言学知识。虽 然手工标注可以借助现代软件工具来操作,但对标注人 员而言,语音语调库的标注工作属于机械性劳动,在工 作期间很容易出现误差。因此为了逐步提升标注工作 的质量,需要安排一组标注人员对所有文件进行交叉检 验,并针对标注项目需求投入更多的人力物力资源。需 要注意的是,由于项目存在资金投入不足等问题,因此 手工标注的方法只能用来处理小型语料库或大型语料库 中的一部分。

  2.2 自动标注

  为了从基础上解决手工标注等技术难题,各国学者 在实践探究中,开发出更多可以自动添加词汇和语音标 注的方法,并对这些系统提出了根本的质量要求 [2]。进 一步保障自动生成的标注具有较高的准确度,只有这样 才能用在声学模型和语言模型的训练工作中。比如说, 利用三因子声学模型、单原子、神经网络等来标记分割 自然口语语音的音素序列,由此可以得到自动化的语音 识别系统(ASR) [3]。虽然对新闻广播的标准朗读语言 而言,当前自动语音识别系统的应用准确率可以达到 90%,但这并没有达到令人满意的程度。其中自动生成 的音标和词汇依旧存在较大错误,需要安排专业人员逐 一检查,只有这样才能从基础上保障标注的有效性 [4]。

  3 影响语音语料库标注质量的主要因素

  3.1 公开性

  在构建语音标注框架 LAF 后,现如今语音语调库 的标注工作,开始向着标准化和智能化的方向发展。但 目前并没有提出统一且规范的标准原则和工作规范,这 直接影响了语音语料库的建设与应用。从实践应用角度 来看,成熟完善的语音语料库,必须要向使用者提供清 晰明确的标注规范文件,具体内容涉及到操作方法、标 注质量、工作原则、标注大纲等内容,只有这样,才能帮助他们更快地找到自身所需的内容。

  3.2 准确性

  语音语料库的标注准确性是根据相关学术研究成果 提出的,因此标注信息要具有简洁性、准确性、规范性 等特征。为了进一步达到这些要求,既要保障标注信息 具有客观稳定性,又要确保属性条目符合逻辑关系,坚 决杜绝标记之间的相互交叉或模棱两可的标记,以此避 免出现违背原有意愿的错误理解 [5]。在人工标注的过程 中,需要组织工作人员参与专业培训,并组织他们进行 小规模的标注操作,以此在熟练掌握各类标注方法的同 时,储备更多技术经验。一般来讲,要让多名标注人员 对同一份语音语料库进行标注分析,而后交给专家判断 其存在的问题,最终将标注范本看作经验模型。在这一 过程中,还可以运用标注后校对的方法进行检验分析, 以此提高标注信息的完善性和精确性。

  3.3 通用性

  完成标注之后的语音语料库,属于可以共享的语言 资源系统。如果已经标注的语音语料库,只能被小部分 学者使用和认同,那么它并不具备较强的通用性和共享 性。为了进一步提高语音语料库的应用效率,在标注的 过程中,要科学平衡编码的复杂程度和语料库的使用效 率,避免增加标注者的记忆负担和使用者的提取难度。

  4 基于计算技术的语音语料库标注方法分析

  4.1 系统设计

  在 GWP 思想的引导下,当前学者在研究中提出了 以人类计算为核心的语言学习系统,既可以提升系统运 行效率,又可以解决语音语调库的标准问题。

  (1)用户界面。这种模块设计为用户提供了功能更 加完善的英语学习平台,用户可以在 Web 页面中收集 音频播放器,随时随地播放英语句子和视频片段,有针 对性地进行英语听力和对话训练。同时这一模块会收 集用户输入的标注串,并将它们储存到 XML 文件集合 中。在收集到大量用户标注串之后,系统会运用人类计 算机为所有语音片段生成音标和词汇的标注 [6]。

  (2) 自动分段。将语音句子集合输入到系统中, 大 部分长度都会达到 10s 以上。对系统用户而言,标注 10s 的句子存在较大困难,因此为了降低标注难度,要 利用自动语音分段模块,将输入句子分成 2s 的语音片 段。现如今系统使用的语音文件信噪比较大,因此要利 用短时能量噪声检测技术进行自动分段。在计算分析所 有语音帧的短时能量数值后,可以准确判断这一语音帧 属于静音还是语音,在检测到连续 100ms 的静音后, 就可以确定一个语音段的端点。一般情况下,每个句子

  的开头和结尾都会包含一小段静音。为了避免分段模块 生成过长的静音语音片段,需要做好额外处理,以此保 障生成片段中,最少包含 50 个有效语音帧。假设最后 片段所包含的有效语音帧数量过少,那么模块会将这一 片段和前一个语音片段整合到一起,以此保障用户不会 听到只包含一个或两个音节的语音片段。

  (3)计算机辅助校验。对用户输入串而言,利用 GWP 统计分析这一数串上达成一致的用户数量,可以 确定它的应用质量。虽然这种机制可以收集更多事实和 知识, 但以 Web 网页为核心的游戏设计, 却无法保障 收集信息知识的正确率。在某些情况下,虽然可以收集 大部分人共识的信息资料,但其本身是共同的错误。比 如说,假设一群学生接受的发音教育是不规范或不正确 的,那么这些学生输入的标注很可能出现一致错误。为 了预防系统将用户的共同错误输入到语音语料库的标注 中,要利用自动语音识别模块和词典查找模块进行校验 分析。

  (4) 储存标注文本。在系统设计应用中,语音数据 要按照句子或片段的方式进行储存 [7]。通过为所有语音 句子生成一个 XML 文件,可以用来储存标注文本和其 他信息。

  4.2 实验分析

  根据上述研究提出的语音语料库标注方法,选择 300 个语言句子,作为测试数据,利用自动语音分段模 块进行分割处理,最终可以得到 930 个语音片段。在测 试过程中,邀请 20 名学习者,利用系统对语音片段进 行标注操作,最终可以得到 2000 个标注结果。在处理 标注结果之前,要先定义语音片段 r 的召回率 Rseg 和准确率 Pseg ,具体公式如式(1)所示 :
\

  在上述公式中, r、s 代表语音片段 r 经过自动语音 识别系统模块后,所获取的参考音素串, t 代表用户对 语音片段 r 进行标注之后所获取的音素串, L (str)代 表串 str 中音素的数量, DL (s, t)代表 s、t 彼此之间 的编辑距离,属于字符串 s、t 之间的差异度,而 s、t两者的相同音素数量计算公式如式(2)所示 :

\

  在经过处理分析之后,可以获取 600 个具有用户标注的语音片段,具体计算结果如式(3)所示 :

\

  最终可以得到总体的召回率和准确率如式(4)、 式(5)所示 :

\

  由此证明,以计算技术为核心的语音语料库标注方 法,既可以提升标注处理的准确性,又可以拓展人类计 算技术的应用范围。

\

  5 结语

  综上所述,虽然以计算技术为核心的语音语料库标 注方法,取得了优异的研究成果,但这一系统依旧存在 较多问题,因此需要我国科研学者在广泛运用语言学习 系统的同时,对系统的应用功能进行检验评估。同时, 要加强专业技术人才的培养力度,与国外研究机构构建 良好的合作关系,这样既可以利用人类计算方法分割处 理语言句子,又能结合相应框架转换不同的语料库,最 终构建更为完善和有效的语音语料库 [8]。

  参考文献

  [1] 张会云,黄鹤鸣,李伟,等.语音情感识别研究综述[J].计算机 仿真,2021.38(8):7-17.
  [2] 俞彦,赵晓群.噪声环境下应用于语音标注的端点检测算 法研究[J].南京邮电大学学报(自然科学版),2021.41(1):25-33. [3] 单连飞,张越.电网调度专业语料库构建方法研究及应用[J]. 机械与电子,2022.40(4):73-76.80.
  [4] 徐佐浩,蒋跃,乔晶. 《红楼梦》两个英译本中的权力关系再 现—基于USAS语义标注系统的研究[J].西安外国语大学学 报,2022.30(1):85-90.
  [5] 姜特,陈志刚,万永菁.基于注意力机制的多任务3D CNN- BLSTM情感语音识别[J].华东理工大学学报(自然科学版),2021. 48(4):1-9.
  [6] 黄秀彬,王笑一,李承桓,等.基于遗传算法的知识库语义多粒 度标注方法研究[J].电子设计工程,2020.28(19):26-30.
  [7] 时健,张京鱼.基于语料库的英语元音开首NP前an变a研究 [J].西安外国语大学学报,2021.29(4):7-12.
  [8] 徐宸涵,顾宇浩,张志昊,等.基于流程控制的汉语篇章结构 语料协同标注系统[J].计算机与数字工程,2021.49(12):2519- 2525.

 
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/58122.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml