SCI论文(www.lunwensci.com)
摘 要 :为解决传统语音自动识别系统存在的音频识别效率低下、识别准确率不高等问题,本文应用人工智能技术,设计一 款功能强大的语音自动识别系统。首先,从主机设计、处理器设计、信号接收机设计、芯片设计等方面入手,完成系统硬件部分 设计。其次,从关键词处理程序设计、音频处理程序设计、自动识别程序设计三个方面入手, 完成对系统软件的设计。最后, 对 系统有效性进行验证。本文所设计的语音自动识别系统具有语音识别能力高、识别准确率高等特点,完全符合实际应用需求。
关键词 :人工智能,语音识别,硬件设计,音频处理,自动识别
Designand Research of Automatic Speech Recognition System Based onArtificial Intelligence
CHEN Zhiliang
(Shenzhen Stellamor Technology Co., Ltd., Shenzhen Guangdong 518057)
【Abstract】:In order to solve the problems of low efficiency and low accuracy of audio recognition in the traditional automatic speech recognition system, this paper uses artificial intelligence technology to design a powerful automatic speech recognition system. Firstly, the hardware design of the system is completed from the host design, processor design, signal receiver design, chip design and other aspects. Secondly, the system software design is completed from three aspects: Keyword processing program design, audio processing program design and automatic recognition program design. Finally, the effectiveness of the system is verified. The automatic speech recognition system designed in this paper has the characteristics of high speech recognition ability and high recognition accuracy, which fully meets the actual application requirements.
【Key words】:artificial intelligence;speech recognition;hardware design;audio processing;automatic recognition
现阶段,信息传播方式主要以网络、广播为主,不仅 方便了人们的日常工作和生活, 还实现了对重要信息的保 护。在这样的背景下,涌现出一种新型语音方式,通过运用 该语音方式,不仅可以满足人们追求语音收听需求, 还能方 便人们采用语音的方式,快速传感文字信息 [1]。所以,强 化对语音自动识别系统的设计显得尤为重要, 语音自动识 别系统主要应用人工智能技术, 对计算机行为进行有效模 拟,实现对关键信息的处理和提取,同时,还能提高语音 识别准确率 [2]。因此,为充分发挥和利用人工智能技术的 应用优势,强化对播音自动识别系统设计显得尤为重要。
1 系统硬件设计
系统硬件结构示意图如图 1 所示。系统硬件主要是由主机、信号接收机、芯片等部分组成。
1.1 主机设计
型号为 VS78 的主机作为语音自动识别系统硬件的核 心组成部分,主要放置在包容性箱体上,该包容性箱体主要是由主板等其他硬件设备组成。通过运用该主机,可以 解调和发送信号接收机所存储的录音内容。应用主机传播 语音频期间,需要从编码、压缩两个环节入手,对广播录 音音频进行处理,这样一来,不仅可以降低语音频数量, 还能降低系统运行负荷,提高系统运行性能,同时,还能 实现对重要录音内容的备份和保护,避免录音内容被不法 分子恶意入侵和破坏。型号为 VS78 的主机属于典型的虚 拟主机,运用虚拟主机,可以将系统内存占用空间降到最 小,同时,还能提高语音频信号的可变性和灵敏度 [3]。
1.2 处理器设计
处理器作为该系统的重要硬件,主要用于对音频的 实时化、精确化识别和控制,同时,还负责对音频数据处 理指令的执行。本次设计处理器期间, 主要选用 TI 型号 处理器,选用该处理器,可以促使音频识别变得更加智能 化、高效化。该处理器频率相对较高,高达 4.2GHz, 内 部含有强大的主板功能,可以为音频频率的精确化、智 能化识别创造良好的运行环境。此外,利用该处理器, 可以实时检测系统运行热度, 一旦系统运行热度超过 80℃,该处理器会在第一时间内自动开启散热功能,降 低系统运行热量,极大地提高了系统硬件运行性能。
1.3 信号接收机设计
本次系统硬件设计,主要选用了 VS78 型号的信号 接收机。信号接收机运行原理是借助无线局域网和无线 电波,接收和发送数据信号,从而实现对数据信号的定 向接收和发送。信号接收机在具体设计时,其频率控制 在 100 ~ 1300Hz,完全满足信号收发频率控制标准和 要求,同时,还避免对外界无线信号产生不良干扰。在 可识别范围内,为提高信号接收机运行性能,需要将其 声音识别分析速度控制在 220MHz/s,这样一来,可以 实现对不同频率语音广播播出信号的精确化识别和分 析。信号接收机除了可以用于对外界广播语音的识别 外,还用于对广播数据的安全化、精确化识别,有效地 提高数据识别的稳定性和可靠性。
1.4 芯片设计
结合系统工作需求,本次芯片设计,优先选用型号 为 HI89 的芯片,运用该芯片,可以实现对系统重要数 据的安全化存储。此外,该芯片主要运用JR7604 程序, 该程序含有四个连接器,可以为系统数据存储提供充足 的存储空间,为后期音频实时化、智能化识别打下坚实 的基础。另外,该芯片具有强大的音频处理功能,可以 对 8 个以上的广播识别信道进行同步运行,也可以将音 频识别信号损耗量降到最低,为音频信号的高效化、精 确化识别提供了极大的便利,使得音频表现出较高的识 别精确度。在应用该芯片期间,可以将其直接导入到系统音频模块中,对音频进行自动化、实时化识别,此时,无需执行主机所发出的指令,使得自动识别系统表现出较高的运行性能。HI89 型号芯片参数如表 1 所示。
2 系统软件设计
为了充分发挥和利用人工智能技术的应用优势,提 高语音自动识别系统的稳定性和实用性,技术人员应重 点做好对程序的设计。
2.1 关键词处理程序设计
在软件区域中,主要用到关键词处理程序,该程序 主要是由以下两个部分组成 :(1)语音关键词库。语音 关键词库设计是否合理,直接影响系统语音识别效率。 这是由于语音音频内部含有若干个语音关键词,要想提 高语音识别的准确率和高效性,需要为系统提供充足的 关键词库词量和贴切的关键词,而关键词库主要是从广 播词库中获得的。(2)关键词匹配区域。关键词匹配区 域主要是指借助关键词词库,全面化查询语音音频,同 时,还要将语音关键词的字节数量设置为 7 个以下,并 保证各个关键词之间互不联系,相互独立 [4]。在进行自 动识别期间,如果所查询到的关键词具有一定的相似度, 需要借助关键词库,反向传播识别语音自动识别程序。
2.2 音频处理程序设计
音频处理程序运行原理是初步整理语音音频。语音 具有一定的时效性,所以,所播放的音频通常混有其他 杂音, 不利于语音自动识别程序的运行性能 [5]。因此, 为保证音频处理效率和效果,需要筛选出混有杂音的语 音音频,并将该音频处理成高音质的音频,并将处理好 的音频安全、可靠地传输到自动识别程序中。系统结构 框架解调流程如图 2 所示。
2.3 自动识别程序设计
自动识别程序在具体设计时,需要应用人工智能技 术,扫描识别语音信号所对应的波频率,并对音频信号 和频率进行转换处理,使其转换为文字。在这个过程中, 首先,运用自动识别程序,预处理语音音频, 然后, 结合相关声学参数,分析最终预处理结果,再对语音音频 的文档进行精确化识别。其次,采用二次对比的方式, 对比和分析初始文档和语音音频之间的异同点,并对语 音自动识别结果进行不断地优化和完善,以保证语音自 动识别效率和效果。
3 系统运行环境搭建
3.1 硬件环境
硬件环境搭建为装置稳定运行提供良好的硬件环境。 硬件环境搭建主要涉及到应用服务器、数据库服务器、 客户端机器三大部分。但是,应用服务器的硬盘内存相 对较高,远远超过数据库服务器硬盘内存,这是由于应 用服务器所服务对象是包含数据库在内的整个装置,而 数据库服务器服务对象仅仅是数据库,所以,应用服务 器硬盘的内存相对较大。
3.2 软件环境
软件环境搭建,为后期装置功能模块设计提供了良 好的软件环境。软件环境搭建主要涉及中间件、程序开 发、数据库、开发工具、编程语言等工具配置,这些工 具配置结果如表 2 所示,从表 2 中的数据可以看出,该 装置在具体设计时,主要选用了 SQL Server 2020 数据
库、Microsoft Visual Studio 2020 开发工具、B/S 架 构以及 Java 编程语言,通过运用这些软件工具,可以 保证整个装置模块开发效率和效果,使得装置模块开发 成本降到最低,可以获得较高的社会效益和经济效益。
4 实验研究
在本次实验期间,为有效地检验该系统是否能够正 常、稳定地运行,将本文系统与两种传统系统进行对 比,这两种传统系统分别是基于时变序号的自动识别 系统和基于数据挖掘的自动识别系统。然后,优先选用 EGG 信号,设定出如表 3 所示的实验参数表。
为有效地验证和分析以上三种识别系统在语音方面的 识别效果,技术人员采用随机选取的方式,选出某一段长 度为 5s 的 EEG 信号。然后, 对是否含有 OA 干扰的信号 进行识别,本文系统所获得的识别能力相关系数最高,远 远超过以上两种传统系统的相关系数,因此,与传统系统 相比,本文系统所获得的识别准确率最高,这表明本文系 统在语音识别方面表现出较高的可靠性和有效性。
5 结语
综上所述,本文应用人工智能技术所设计的语音自 动识别系统主要是由硬件部分和软件部分组成。经过实 验测试,发现该系统具有强大的语音音频识别功能,可 以实现对语音音频的精确化、高效化识别,同时,该系 统的设计和应用,促使播音识别向智能化、高效化、精 确化方向不断发展,使其完全符合预期设计标准和要求。
参考文献
[1] 吴毅君.人工智能技术下的播音自动识别系统设计[J].电子 世界,2021(20):164-165.
[2] 唐硕.铁路普速旅客列车智能广播系统的设计与实现[J].信 息与电脑(理论版),2017(13):89-90+95.
[3] 孙雅彬,张新健,赵睿.基于关键词检索的调频广播呼号识别 系统设计[J].西部广播电视,2017(2):186+190.
[4] 韩磊,靳淑君.高校新闻播音教学瓶颈与突破研究[J].西部广 播电视,2019(15):44-45.
[5] 田维钢,温莫寒.新闻播音员的符号学解读—AI合成主播 来临的思考[J].青年记者,2020(12):84-85.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/68171.html