Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 教育论文 > 正文

人工智能在“数字图像处理”课程教学改革中的应用探讨——以百度 AI 平台为例论文

发布时间:2021-08-16 14:26:40 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):

摘 要:作为当前最热门的研究领域之一,人工智能技术近年来发展迅速,为了让学生更好地掌握人工智能技术,将百度 AI 平台引入到“数字图像处理”课程教学中,分别从课程理论和课程实践两个方面进行教学应用研讨。课程理论教学方面,通过介绍目前先进的人工智能技术在图像处理的应用案例,激发学生学习兴趣,培养学生运用人工智能解决问题的基本技能;课程实践教学方法,通过百度 AI 平台的实践案例,借助其海量数据集以及 GPU 算力, 让学生在编程实践过程中,理解并掌握最新的深度学习框架和网络结构,了解学生发展前沿,提高动手能力与实践创新能力。

关键词:数字图像处理;教学改革;百度 AI;人工智能

本文引用格式:杨森泉,丁凡,陈景华,等 . 人工智能在“数字图像处理”课程教学改革中的应用探讨——以百度 AI 平台为例 [J]. 教育现代化 ,2021,8(39):29-33.discussion on the Application of Artificial Intelligence in the Teaching reform of "digital Image Processing" Course——An Instance of baidu AI StudioYANG Senquan1, DING Fan1, CHEN Jinghua1, LIU Jianjun1, ZHOU Ling2(1.School of Intelligent Engineering, Shaoguan University, Shaoguan Guangdong; 2.School of Teacher Education, Shaoguan University, Shaoguan Guangdong)

Abstract: As one of the most popular research fields, artificial intelligence technology has developed rapidly in recent years.  In order to enable students to better understand the artificial intelligence technology, the Baidu AI platform has been introduced into the "digital image processing" courses in two aspects of teaching application seminars. In terms of course theory teaching,by introducing the current application cases of advanced artificial intelligent technology in image processing, it not only stimulates students’ interest in learning, but also cultivates students’ basic skills in using artificial intelligence to solve problems.  In terms of course practice teaching method, by practical cases on Baidu’s AI platform, which has massive data sets and GPU computing power, it allows students to master the latest deep learning framework and network structure, understand the frontiers   of students' development, and improve their practical and innovation ability.

Keywords: digital digital image processing; teaching teaching reform; Baidu AI; artificial artificial intelligence

一引言

数字图像处理是电子信息类专业课程体系中一门重要的专业课,在本科生的核心课程学习以及现代技术应用中都占据着重要地位。它涉及了高等数学、线性代数、信号与系统、数字信号处理等多个门课程内容 [1]。在 5G 和人工智能等技术的推动下, 数字图像处理技术发展日新月异,但是数字图像处理课程教学模式没有突破旧的课程内容体系 [2]。由于该课程具有多学科交叉性,因此在教学过程中, 不仅学生掌握相关学科的理论背景和基础,还要兼顾本课程内容的完整性,从而保证学生掌握相应的只是知识, 并且获得相关的动手实践 [3]。如何让学生掌握基本概念和理论,同时了解并灵活地利用最新发展的前沿技术,是数字图像处理教学的难点 [4]。

人工智能(AI)是当前最热门的研究领域之一, 所以国内外许多互联网公司都推出自有的 AI 平台。其中百度 AI 开放平台提供全球领先的语音、图像、NLP 等多项人工智能技术,同时提供了 AI 领域最新的应用场景和解决方案。在百度 AIstudio 平台中, 不仅集合完整的编程环境,而且还提供了免费的算力和接口,有助于学生迅速掌握深度学习技术,破除算力桎梏,降低教与学的门槛 [5]。本文结合数字图像处理课程特点和相关教学经验,引入百度 AI 平台,对数字图像处理的教学实践进行了探讨。

二 数字图像处理课程存在的问题

应用型大学本科院校的电子信息类专业普遍开设了数字图像处理课程,但是由于课程本身知识点繁琐零散、理论起点高、公式复杂,而学生的物理和信号处理知识基础普遍掌握不扎实,因此对数字图像处理的知识体系理解相对困难 [6]。

而对于教师而言,在数字图像处理课程教学实践中普遍存在着以下问题:第一,该课程教学存在课程内容多、教学实验学时少的矛盾,作为一门专业选修课,一般只有 36 个理论学时和 8 个实验学时,如何在有限的学时内,将课程的基本理论以及相关应用知识点讲解清楚是一个挑战。第二,理论知识难以掌握的问题,该课程理论知识的算法原理难度大,对于一些基础知识掌握不扎实的学生来说,在理解学习上存在着较大的障碍。第三,该课程的实验只停留在验证性实验上,缺少综合性,创新性不强,知识点单一, 不能够较好地培养学生的综合编程能力以及解决实际应用问题能力。第四,在传统的教学过程中,实验多采用一些基础知识性内容,实验课程中设置的实验内容陈旧,而且很少涉及最新的基于人工智能技术的研究热点和应用,因此,难以有效地调动学生的学习积极性和主动性,更不要说对学生创新实践能力的培养 [7-8]。

针对以上问题,本文从理论教学和实践教学两个方面,讨论应用百度 AI 平台在数字图像处理课程的教学改革,采用线上线下相结合的方法,引导学生观看百度 AI 平台的训练营课程,对教材不同章节补充相关深度学习内容,实践方面除了一些基础知识性实验外,鼓励学生自行组队参加百度 AI 平台上的算法挑战赛,在比赛的过程中调动学生学习热情, 提高创新实践能力.

三 课程理论教学应用探讨

大多数数字图像处理教材主要包括图像基本运算、图像变换、图像增强、图像复原、图像分割、图像压缩编码、图像描述等基本技术方法,这些经典的处理技术内容陈旧,较少兼顾最新发展技术, 对于本科生来讲内容枯燥,难以激发学习兴趣。为了拓宽学生知识面,培养学生解决实际应用问题的能力,在相关章节内容中增加对应的最新数字图像处理应用介绍,具体如下:

(1)卷积运算。在图像基本运算章节,只介绍代数运算与逻辑运算,没有涉及到已广泛应用于深度学习的卷积运算。对于二维图像的卷积运算可定义为:利用卷积核在二维输入图像矩阵上进行滑动, 将当前输入的部分元素和卷积核进行矩阵乘法,最后将结果相加单个输出像素。如图 1 所示,不同的卷积核可以生成许多不同的特征映射,例如使图像更清晰(更多细节),或模糊图像(更少的细节),并且每个特征映射可以提高卷积神经网络的学习准确率。

\
 
(2)超分辨率重建。超分辨率重建指的是通过软件或硬件的方法,从低分辨率图像重建出相应的高分辨率图像,在监控设备、卫星图像遥感、显微成像、视频编码通信以及医学影像等领域都有重要的应用价值。传统的超分辨重建方法是通过插值或者图像变换实现的,但是容易造成失真和马赛克效应。而基于 AI 的超分辨率重构法能够通过深度学习网络实现低分辨率到高分辨率图像之间的端到端映射,能够更真实地重建高分辨率图像,如图所示。

\
(3)图像修复。修复指基于图像的背景信息,重建图像或视频视频中丢失或损坏的部分的过程。其在广泛应用于影视特效制作、医学图像修复、犯罪现场还原、文物保护等。基于 AI 的深度神经网络首先对图像进行监督分类,每个图像都有一个特定的标签,通过已经训练好的网络学习图像到标签之间的映射,从而指导对图像的修复,将图像中缺口四周原有的结构延续到缺口内部。

\
(4)图像语义分割。语义分割是对图像中的每一个像素进行分类、推断像素的标签,从而使每个像素都被标记为其封闭对象区域,与教材中的图像分割不同的是,它不仅将目标和背景分割,而且还将进一步分割每块区域的语义类别,将目前广泛应用于医学图像与无人驾驶等。

\
 
(5)目标检测。目标检测指在图像中找出感兴趣物体,同时确定物体的类别和位置,如图所示。近几年来,目标检测算法取得了很大的突破。比较流行的算法可以分为一阶段法和二阶段法。前者使用一个卷积神经网络直接预测不同目标的类别与位置,因此速度快,但准确性要低;后者则需要在图像产生目标候选框位置,然后再对候选框做分类与回归,虽然准确度高一些,但是速度慢。

\
 
(6)美颜相机。随着 AI 时代的到来,各式各样的美颜相机也出现在大众的手机中。美颜相机背后的技术原理可作为图像处理应用这一章节的扩展。美颜相机首先是对人脸识别和关键点检测,然后通过调整图像像素值达到美白的效果,利用改变五官轮廓图像区域实现瘦脸之类的美颜目的,最后还原到像素处理完成人脸图像美颜过程。以上六种具有前沿科学研究实例可以分别作为教材中不同章节内容的补充,具体如表 1 所示, 这些都是在人工智能的推动下,数字图像处理技术取得令人瞩目的进步,而且在百度 AI 平台上都会有相对应的开源代码,可直接在 AIStudio 平台上运行,如果学生对于某一实例感兴趣,还可引导其参加平台上的网络课程,进一步激发学生的学习热情,培养运用人工智能解决问题的基本技能。

\
 
数字图像处理是一门实践性非常强的课程,通过实践课程有利于加强学生对算法的理解, 巩固对图像处理的理论知识, 提高动手能力和知识综合运用能力。传统的实践课程主要以验证性实验为主, 包括图像的代数运算、图像的灰度变换、图像滤波、图像增强等,这些实验涉及的知识点单一,内容陈旧,各个实验之间的相关性差,不利于培养学生的思考能力和解决问题能力。

此外,实验内容很少涉及到目前先进的人工智能技术, 难以调动学生的学习积极性和主动性。因此,除了基本的验证性实验外, 应当以实际应用为导向,设计以人工智能技术为主的综合性实验。

百度 AIStudio 平台具有丰富的案例,适合本科生进行综合性实验的训练,原因如下:一,可视化及交互式设计,使用 python 语言,简单易学;二, 拥有功能强大的 paddle 框架,集成大量目前先进的深度网络模型;三,免费 GPU 算力,对学生电脑配置要求低;四,在线编程,海量数据集。

下面简要列举AI Studio 提供的三个综合性实验, 分别是手势识别、车牌识别和口罩分类。
(1)手势识别
手势识别数据集包含了 2066 张大小为 100*100 像素的 RGB 图片,分成 0 至 9 总共 10 组数字,如下图所示:

\
数据集的 90% 图片用于训练,10% 图片用于测试,网络使用前馈神经网络,包含了三层的隐含层, 网络通过以下代码定义:

1.classMyDNN(fluid.dygraph.Layer):
2.def__init__(self):
3.super(MyDNN,self).__init__()
4.self.hidden1 = Linear(100,100,act='relu')
5.self.hidden2 = Linear(100,100,act='relu')
6.self.hidden3 = Linear(100,100,act='relu')
7.self.hidden4 = Linear(3*100*100,10,act='soft max')
8.defforward(self,input):
9.x= self.hidden1(input)
10.x  = self.hidden2(x)
11.x  = self.hidden3(x)
12.
x=fluid.layers.reshape(x,shape=[-1,3*100*100])
13.y = self.hidden4(x)
14.return y
训练过程采用随机梯度下降参数学习方法,学习率设为 0.008,迭代次数设为 200,损失函数使用交叉熵损失函数,代码如下:
1.Opt=fluid.optimizer.SGDOptimizer(learning_ rate=0.008,parameter_list=model.parameters())
2.epochs_num=200
3.los s = fluid.layer s .s oftm ax_with_cr os s _ entropy(predict,label)

经过以上简单的前馈网络以及经典的随机梯度下降法,准确识别率达到 85%。通过这个简单的网络, 让学生懂得深度学习的三个步骤:建立模型、损失函数和参数学习。同时,可以进一步引导学生通过修改网络模型、设置不同的学习率以及使用不同的损失函数,提高准确识别率。

(2)车牌识别
车牌识别数据集包含了 32370 张大小为 20*20 像素的图片,总共有 66 组数字和字符,同样数据集的 90% 图片用于训练,10% 图片用于测试,网络使用经典的 AlexNet 网络 [9],其结构图如下所示:

\
 
训练过程采用动量优化法参数学习,学习率设为 0.01,动量大小为 0.9,迭代次数设 ,100,损失函数使用交叉熵损失函数,代码如下:
1.o  p  t   =    f  l  u  i  d  .  o  p  t  i  m  i  z  e  r  . M o m e n t u m O p t i m i z e r ( l e a r n i n g _ rate=0.01,momentum=0.9, parameter_list=model. parameters())
2.epochs_num= 100
3.los s = fluid.layer s .s oftm ax_ with_cr os s _ entropy(predict,label)
经过以上训练过程,车牌的识别率达到 97.6%。
(3)口罩识别
口罩识别,是指检测照片中所有人脸,同时判断是否佩戴口罩。通常由两个功能单元组成,可以分别完成口罩人脸的检测和口罩人脸的分类。该工程中, 深度学习模型使用的是 VGG[10]。VGG 的核心是五组卷积操作,每两组之间做 Max-Pooling 空间降维。同一组内采用多次连续的 3X3 卷积,卷积核的数目由较浅组的 64 增多到最深组的 512,同一组内的卷积核数目是一样的。卷积之后接两层全连接层,之后是分类层。由于每组内卷积层的不同, 有 11、13、16、19 层这几种模型,下图展示一个 16 层的网络结构:

\
 
口罩识别的数据库包含了 70 张未佩戴口罩和116 张佩戴口罩的人脸图,训练过程采用自适应矩估计(Adam)法,代码如下
1.o p t i m i z e r = f l u i d . o p t i m i z e r . A d a m O p t i m i z e r ( l e a r n i n g _ r a t e = t r a i n _ parameters['learning_strategy']['lr'],parameter_ list=vgg.parameters())
由于数据集图片数量不够大,训练预测准确只有 75%,可以通过增加图像数据进一步提高准确率。

五 结语

本文紧跟人工智能技术发展趋势,结合“数字图像处理”课程的特点,通过在理论教学、实践教学中引进数字图像处理领域中与人工智能技术相关的最新研究热点和成果,探讨了百度 AI 平台的综合性实验,以此激发学生学习积极性,加强学生的实践应用能力,有利于学生掌握人工智能相关技术, 促进学生对算法的理解,培养学生分析问题、解决问题能力,深挖学生就业潜力,为学生未来的就业科研生涯打下扎实的基础。

参考文献
[1]张 成 业 , 李 军 , 袁 德 宝 , 等 . 人 工 智 能 与 大 数 据 时 代 的《遥感数字图像处理》教学内容改革探讨 [J]. 北京测绘 ,2020,34(06):876-880.
[2]刘君 . 结合人工智能的数字图像处理教学改革探讨 [J]. 科技创新导报 ,2018,15(16):229-230+232.
[3]陈舒涵 , 胡学龙 , 姚志均 , 等 . 深度学习在“数字图像处理”课程教学中的应用探讨 [J]. 工业和信息化教育 ,2019(02):84-88+94.
[4]樊香所 , 陈华金 , 余志强 , 等 . 应用型本科数字图像处理课程的教学改革研究 [J]. 教育现代化 ,2020,7(45):45-47.
[5]百 度 大 脑 AIStudio [EB/OL].https://aistudio.baidu.com/aistudio/ index.
[6]张红斌 , 李广丽 . 众智模式与主动学习驱动下的《数字图像处理》课程教学改革实践 [J]. 教育教学论坛 ,2020(07):103-104.
[7]冯登超, 杜鹏飞, 沈惠雅, 等. 应用型大学研究生数字图像处理课程教学改革探索 [J]. 北华航天工业学院学报 ,2019,29(01):42-44.
[8]温静 , 韩建栋 . 数字图像处理课程本硕一体化分级教学的设计和建设 [J]. 计算机教育 ,2019(10):67-70.
[9]Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[C]// ].International Conference on Neural Information Processing Systems. Curran Associates Inc. 2012:1097-1105.
[10]Simonyan K, Zisserman A. Very Deep Convolutional  Networks for Large-Scale Image Recognition[C]// ].International Conference on Learning Representations 2015:1-14.

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jiaoyulunwen/32407.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml