SCI论文(www.lunwensci.com)
摘 要:在经济全球化发展趋势下,世界各国对语言的研究越发深入,语言研究方法也越来越多,比如说定性研究、定量 研究、两者相结合的研究方法等。现如今建设应用大型语料库作为国内外语言学研究的核心内容,不仅能为自然语言处理领域 发展提供基础依据,还可以充分展现人工智能、信息提取、人机对话等技术优势。因此本文研究在了解智能化语音语料库设计 原则的基础上,根据语音语料库的核心需求和属性扩张,深层探索智能化语音语料库的设计步骤,以电力行业的语音语料库设 计构建情况为例,根据实证分析明确智能化语音语料库的设计应用价值。
关键词:智能化,语音语料库,发音文本,语音录制,数据库
Design and Research of Intelligent Speech Corpus
YANG Zheng, MA Yanzhou
(Strategic Support Force Information Engineering University, Luoyang Henan 471000)
【Abstract】:With the development trend of economic globalization, the study of language in the world is more and more in-depth, and there are more and more language research methods, such as qualitative research, quantitative research, the combination of the two research methods. At present, the construction and application of large-scale corpus as the core content of linguistics research at home and abroad, not only can provide a foundation for the development of natural language processing field, but also can fully demonstrate the advantages of artificial intelligence, information extraction, human-machine dialogue and other technologies. Therefore, this article studies on the basis of intelligent understanding speech corpus design principles, according to the core requirements of speech corpus and attribute expansion, deeply explore the design steps of intelligent speech corpus to speech corpus are set to build the power industry as an example, according to the empirical analysis of the design of the intelligent speech corpus application value.
【Key words】:intelligent;phonetic corpus;pronunciation text;voice recording;database
0 引言
智能化语料库作为自然语言处理领域的核心内容, 不仅充分融合了语言和计算机等学科知识,还在人工智 能、语言学等方面研究占据重要作用。在现代计算机技 术革新发展中,语音语料库的建设模式也从传统纯文本 模式逐渐过渡到多模态模式,因此无论是基础理论还是 技术革新都要在整合实践累积经验的基础上,转变传统 思维的限制,积极引入全新的知识技能,只有这样才能 更好满足各领域语音语料库的应用需求。本文主要探讨 智能化语音语料库的设计原则和主要内容,以此为自然语言处理领域发展奠定基础保障。
1 智能化语音语料库设计原则
智能化语料库的设计原则主要体现在以下 3 点 :(1) 以需为本。要结合建库目标,确定语料库收录目标的内容 和规模,研究语料加工的层次和深度 [1]。由于目前各领域 语音语料库主要是为教学科研提供优质服务,需要储存的 信息数据存在较大差异,因此具体设计要根据储存语音语 料信息进行调整 ;(2)动态性。根据社会发展变化来看, 必然要在不同阶段对智能化语音语料库的设计提出多项要 求,最为关键的是保证其具有良好的动态特征, 其特征主要是一方面体现在收录目标中,另一方面体现在语料 加工体系中 ;(3)可交换性。现如今智能化语音语料库 的应用目标和加工体系存在较大差异,必然会增加数据 交换的难度,相比文本语料库,语音语料库的操作难度 会更大。从长远发展角度来看,资源共享是未来经济建 设发展的必然趋势,因此,在设计推广智能化语音语料 库时,要充分考虑以数据的交换为前提 [2]。
2 语音语料库的核心需求和属性扩张
2.1 核心需求
在语音识别领域中, 最关键的环节就是选择适合的语 料进行模型训练,所选择的语料要尽可能覆盖所有语音语 言现象,并且保障数据不能过于稀疏 [3],同时在面对多业 务场景时,要选择多个模型进行训练分析。由此可见,在 经济全球化发展趋势下,设计推广具有大词汇量和多属性 特征的语料库非常关键。从这一发展角度来看, 为了有 效训练鲁棒性更强的声学模型,在收集语料信息时,要达 到以下要求 :(1)要保障训练语料库尽可能拥有更多的语 言语音现象, 以此避免声学模型在训练期间出现数据过于 稀疏等问题 ;(2) 音素覆盖要更加完善, 从本质来看, 识 别系统中所有识别单元都要呈现在语音语料库中 [4]。同 时,为了保障声学模型训练得更加精确,要使最小识别 单元在语料库中出现的次数超过一定数值 ;(3)音素要 具有均衡性。所有音素单元在语料库中出现的次数和其 他音素单元相比,绝不能出现过大偏差。
2.2 属性扩张
从智能化语音语料库的应用角度来看,其包含以下 属性内容 :(1)在储存保护说话人的信息时,要按照 具体编码、姓名性别、年龄地域等基础信息进行区分 ; (2)在保存语料文本时,要运用语料标号和语料信息等 方式进行处理,不同用户可以进入查询系统后访问这些 数据。波形文件要利用录制人的信息、语音文件储存位 置、文件编号等方式进行储存,在用户录音完成后可以 直接上传本次录音的相关文件,也可以经过整理之后上 传到已经设置好的波形文件中,此时系统会直接保存这 一文件 [5]。同时用户可以根据模型训练需求进行抽取, 在组合多种波形文件和标注文件后进行训练分析。标注 文件可以根据文件本身、文件信息、标注编号等方式进 行储存,用户可以在搜索中获取相关文件数据。
3 智能化语音语调库的设计内容
3.1 发音文本
(1)文本选择。如何选择语料是设计语音语料库的核心内容。为了持续优化智能化语音语调库建设水平, 保障各环节具有有效性和规范性,在设计之前要先研究 制定好语料库的选择原则。首先语料库中的单词要求尽可能包含所有声韵现象,这样有助于直观展现语言的音 系特色 ;其次,要将汉语调查常用表看作基础依据,从 而方便和汉语普通话进行对比分析 ;再次,在口语语料 中随机挑选语料库句子,要更符合语音识别的真实场景 需求 ;最后,保障语料库句子的内容和含义具有完整性, 不归类挑选,以此有效解决训练数据过于稀疏等问题。
(2)文本编制。编制翻译文本是构建语音数据库的关 键环节。在明确发音素材时,要结合发音文本的选择原则 进行以下操作 :首先,在单字部分,要将部分常用字体 看作本次语音库录音所需语料 ;其次,在词汇部分,将 4000 词词表看作基础依据,结合原来音系的结论记录来 全面呈现语言特点 ;最后,在语句材料部分, 要结合不 同发言人的语言掌握程度确定语料数量,在选择时尽可 能保障语料的收集范围更广,且具有一定的代表性。
3.2 语音录制
(1)确定发言人。这项工作的选择原则涉及两方面 内容,不仅要保障发音人的基础能力强,会积极配合相 关调查,还要保障其所处的语言环境更加稳定,具有一 定的文化基础 [6]。
(2)采集语音。录音时的说话方式直接影响语音语料 库的使用途径。由于收集语料工作具有特殊性,所以要按 照不同的研究目标,选择 2 种方式,一种是指具有提示文 本的朗读,其中提示属于汉语的文字材料,发言人要将其 转化成自己的母语进行朗读 ;另一种是指自然语言,发言 人可以运用提示讲述民间故事或当地民歌等。
3.3 文件参数
在录制发英文文本之后,要对语音数据进行分析处 理,由此掌握语音信号的不同特征,这不仅是设计智能 化语音语料库的关键环节,还是后期语音处理的基础依 据。本文研究主要关注语音信息,所以要标注语音信号 波形,并获取相应的声学参数。需要注意的是在提取 声学参数时,要运用北京大学中文系语音实验室提出的 Wavefinal 软件进行操作,首先对录制语音进行区分和 消除处理,确保研究目标都是单个单词 ;然后在语音波 形数据中判定语音信号的起始,标注出韵母的范围 ;最 后利用自相关算法得到相应的数据变化。
3.4 数据库管理
良好的应用算法也能进一步提升系统性能,对于一个 业务功能而言,可以运用多种技术算法去实现,因此要评 估每种算法的执行效率,最终选择最优算法进行数据分析 和应用。本文研究主要探讨人工神经网络算法搭载在数据库进行管理处理数据,其中神经元的数学模型如下所示 :
假设xi (t)代表 t 时刻的输入信息, oj (t)代表时刻 的输出信息,那么神经元j 的状态公式如式(1)所示 :
但若是τij 代表单位时间,那么可以得到如式(2) 所示 :
由于神经元模型的输入和输出方式,具有多样性的 特征,所以可以按照不同需求,合理运用模型这一特征 解决各类问题。其中,如式(3)所示代表神经元在 t 时刻的输入情况 :
根据上述公式分析,假设 t 省略,利用输入向量和权重来表述上述公式,假设如式(4)所示的情况 :
在符合 X0 = − 1. ω0j = Tj 这一条件的情况下, 净输入和阈值的差如式(5)所示 :
简化之后,就可以得到如式(6)所示的神经元模型 :
运用上述模型,选取数据库, 因为在语音语料库中 需要储存大量的语音波形数据,其具有网络支持较低、 安全性能不高、长度不固定、数据量偏大等问题,所以 可以选择更容易实现的 VFP 数据库管理系统。
另一方面,建立管理系统。根据智能化语音语料库的 数据管理要求分析可知,在建立管理系统时,要储存 4 项素 材 :首先是指发音人属性素材;其次是指发音文本素材;再 次是指实际语音数据材料;最后是指声学分析参数数据。
在计算机性价比不断提升中,建设推广具备高性能 CPU 和大容量储存设备的工作站与高速通信网络组成 的计算机组成系统,是目前技术发展最为流行的计算环 境。本文研究在了解智能化语音语料库设计要求的基础 上,结合分布式并行数据库的研究内容。
4 实例分析
在人工智能技术深层研究和全面推广中, 以AI 控制器 为代表的智能产品,在电力行业发挥了重要作用,因此将人 工智能技术和电力等行业融合到一起,既可以加快传统行业 的升级转型步伐,又能持续优化语音语料库的设计应用水 平 [7]。而语音作为人类最自然和最有效的沟通方式,相关语音识别技术是现代科研学者探究的主要内容。从电力行业 的发展角度来看, 语音识别主要运用在智能调度、语音报 警、移动作业等方面,大都属于短语音指令交互控制,很少 有大规模商用级语音识别服务。结合上文研究提出的智能化 语音语料库系统分析可知,为了进一步验证语音语料库的有 效性,可以随机抽取 1000 条语音语料进行实验分析,具体 主题涉及发电环节、输电环节、配电环节、用电环节 4 项 内容。其中测试语料原文要运用自然语言处理技术进行分 词处理, 按照词语为单位计算分析语音标注的准确度。这 种结果显示, 在电力行业中运用智能化语音语调库, 实际 准确率可以达到 99.75%,这不仅符合语音语料库的应用需 求,还可以为电力企业运营的各个环节,提供真实有效的数 据信息, 避免在工作期间出现不必要的误差。需要注意的 是,为电力行业构建语音语料库,在一定程度上能丰富行业 的音频数据库,为行业语音识别研究提供有效的技术支撑。
5 结语
综上所述,由于语音语料库的设计工作较为复杂,所 以在实践探究中,要逐步完善智能化语音药库的基本功 能,注重结合具体问题进行改进分析。比如说,如何充分 利用现有的词间变调规则, 尽可能全面展现变调和轻声的 实际状况。现如今,科研学者在研究中提出,智能化语音 语料库的设计可以选用开放型数据库, 这样不仅能方便用 户随时随地的添加和修改,还能持续优化数据库储存内容。 需要注意的是,语音语调的应用场景存在较大差异,所以 实际设计工作必然会面临多种问题。因此,我国在加强智 能化技术研究力度的同时, 注重结合各领域语音语料库的 应用需求进行全面思考,只有这样才能为语言研究提供有 效的数据支持,直观展现智能化语音语料库的应用价值。
参考文献
[1] 时健,张京鱼.基于语料库的英语元音开首NP前an变a研究 [J].西安外国语大学学报,2021.29(4):7-12.
[2] 陈希祥,黄伍,李德英.基于语音识别的智能家居控制系统设 计[J]. 自动化与仪表,2021.36(7):91-95.
[3] 李继超,贺晓倩,权亚腾,等.一种室内智能语音识别垃圾分类 系统的设计[J]. 自动化与仪表,2021.36(11):103-108.
[4] 李建,张锋,陈冲,等.基于AI智能语音交互气象服务的研究与 应用[J].计算机技术与发展,2020.30(12):197-202.
[5] 张雁冰,方雪,吕巍.人工智能语音助手智能程度对消费者使 用意愿的影响研究[J].上海管理科学,2020.42(4):11-15.
[6] 林辉.面向SELL语料库的AI虚拟英语口语训练系统研究[J]. 微型电脑应用,2020.36(7):126-129.
[7] 黄曾华.综采装备单机智能化向智能协同模式转型的探索研 究[J].煤炭科学技术,2021.49(4):169-175.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/56236.html