Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

基于PCA的SAR图像咖啡地貌特征提取论文

发布时间:2022-08-17 15:08:01 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):
 
  摘要:随着SAR图像处理技术日渐完善,精准提取出图像目标特征至关重要。本文在巴西咖啡场景数据集下开展研究,精确提取各地区咖啡地的主要特征。首先用二分类算法将数据集分为咖啡地和非咖啡地,因场景中包含阿尔塞堡、瓜拉尼西亚、瓜苏佩和圣山四个地区,受不同作物种植方式和气候的影响,地貌特征有较大差异,利用PCA算法在二分类结果上提取主要特征,得到四个地区的咖啡地貌特征。将该方法对比特征选取和线性评判分析,得出本文方法对不同地区地貌特征具有较好的提取准确度,提供了一种地貌特征提取的新方法。

  关键词:合成孔径雷达;特征提取;主成分分析

  Extraction of Coffee Geomorphology Feature from SAR Image Based on PCA

  DU Jiawei,YANG Kai,JIANG Lingjie

  (School of Computer Science,Xijing University,Xi'an Shaanxi 710123)


  【Abstract】:With the improvement of SAR image processing technology,it is very important to accurately extract image target features.This paper conducts research under the Brazilian coffee scene dataset to accurately extract the main characteristics of coffeefields in various regions.Firstly,the data set is divided into coffeefields and non-coffeefields by a binary classification algorithm.Because the scene includes four regions of Arceburg,Guaranesia,Guasupe and the Holy Mountain,it is affected by different crop planting methods and climate.The geomorphological features are quite different.The PCA algorithm was used to extract the main features from the binary classification results,and the geomorphological features of coffee in the four regions were obtained.Comparing this method with feature selection and linear evaluation analysis,it is concluded that the method in this paper has better extraction accuracy for geomorphic features in different regions,and provides a new method for geomorphic feature extraction.

  【Key words】:synthetic aperture radar;feature extraction;principal component analysis


  0引言

  SAR即合成孔径雷达,利用电磁波来对目标照射,实现二维成像过程,与光学、红外等传感器不同,SAR成像过程不受天气、光照等条件的限制,可全天时和全天候的观测,可以穿透地表,被广泛应用于环境监测、资源勘查、农作物估产和测绘等方面。为了更好地进行图像分析,需要在原始遥感图像数据中得出判读标志和统计量等参数,通过对图像的变换,突出其特征,即特征提取。SAR图像的特征分析提取功能,可以连接SAR图像获取和应用,是图像理解和解译的关键技术,对提高图像工程具有重要意义。

\
 

  王聪[1]主要围绕SAR图像目标特征提取展开研究,获取目标的几何和属性特征用于对目标的分类识别。张皓然[2]对地震触发的灾害及山脊线分布情况做出判断,有利于分析地震后的潜在危险。张银波等[3]提出了基于PCA特征提取与弹性BP神经网络结合的水下气泡识别算法。杨博雄等[4]以PCA主成分分析方法为例来实现高维图像特征数据的降维处理。孔德明等[5]用二维线性判别分析对油类样本进行特征提取使之容易被区分。

  本文的组织结构如下。引言介绍了研究背景、目的和研究现状;主要技术分析介绍了主成分分析和线性判别分析的算法流程;详细实验分为数据集选择、训练样本和特征提取三个步骤;分析与对比,本文方法与特征选取和线性评判分析进行对比;总结是对全文进一步概述。

  1主要技术分析

  1.1主成分分析

  主成分分析是一种多变量统计方法,广泛应用在高维数据降维、特征提取、特征融合等领域。目标是用较少特征数据表达较多特征数据,通过正交和变换方式,将可能存在的相关性和变量数据,快速转换成不相关变量,转换后的变量被称为主成分。

  PCA的推导有两种方式,基于最大投影方差和基于最小投影距离,都是尽可能使正交基中的数据坐标转化为原始数据坐标的信息损失较小,也是降维的原则所在。

  (1)基于最大投影方差。对于任意一个数据x(i),在新坐标系中的投影为\协方差矩阵为\由于是常数,不影响最后的计算结果,所以协方差矩阵写成\投影方差为\要使所有数据的投影方差和最大,也就是使迹\最大。

\

       (2)基于最小投影距离。降维的过程希望数据样本 到降维后的超平面的距离最小,表示为

       \
  利用拉格朗日乘子法J(W)=−tr(WT XXT W+λ(WT W−1))

  结果为XXT W=−λW

  XXT是一个变换矩阵,W是该矩阵的n'个特征向量组成的矩阵,-λ为XXT若干特征值组成的矩阵,对角线是特征值,其余为0。求解数据样本主成分的过程即为求解其协方差矩阵的特征值与特征向量的过程。其算法流程图如图1所示。
\

  1.2线性判别分析

  输入d维数据集\要降到的维度d'

  计算类内散度矩阵\

  计算类间散度矩阵\其中mi为第i类的样本数目,μ为所有样本均值向量

  计算矩阵\

  对\进行奇异值分解,得到奇异值λ1及其对应的特征向量ω1,i=1,2,…,N-1。

  取前d'大的奇异值对应的特征向量组成投影矩阵W计算样本集中每个样本xi在新的低维空间的投影zi=WTxi

  得到降维后的样本集\

  输出降维后的数据集X'

  2详细实验

  2.1数据集的选择

  本文使用的SAR图像数据集为巴西咖啡场景数据集,由SPOT传感器于2005年在巴西米纳斯吉拉斯州的四个县拍摄的场景组成:阿尔塞堡、瓜拉尼西亚、瓜苏佩和圣山,它有许多由不同的作物管理技术引起的类内差异,包括具有不同植物年龄或由阴影引起的光谱失真的场景,整个图像集被划分为多个64×64像素的图块。

  2.2训练样本

  将数据集利用Python split()函数通过指定分隔符对字符串进行切片,将2876个图像数据按咖啡地和非咖啡地拆分成两个文件,Coffee和Uncoffee,每个文件夹各有1438个图像数据。利用AlexNet网络模型训练划分好的两类地貌,取1328个图像数据作为训练集,得出验证精度为0.864,损失为0.325。将剩余数据中的110个图像作为测试集,最后预测精度为96.3%,预测图如图2所示。
\


  2.3 PCA特征提取

  将分为两类的图像数据,分别进行降维处理,因数据集由巴西米纳斯吉拉斯州的四个县拍摄的场景组成:阿尔塞堡、瓜拉尼西亚、瓜苏佩和圣山,地区间由于采用不同的作物管理技术引起类内差异,为提取出每个地区咖啡地和非咖啡地的主要特征,利用主成分分析算法进一步实验,目的是得到每个地区具有的独特特征。

  首先,在咖啡地和非咖啡地两大类中,分别按地区进一步划分成四小类,为方便辨认,以下由简称进行说明:CO1、CO2、CO3、CO4分别代表阿尔塞堡、瓜拉尼西亚、瓜苏佩和圣山四个地区的咖啡地数据集,NOCO1、NOCO2、NOCO3、NOCO4分别代表阿尔塞堡、瓜拉尼西亚、瓜苏佩和圣山四个地区的非咖啡地数据集。

  然后分别在CO1、CO2、CO3、CO4和NOCO1、NOCO2、NOCO3、NOCO4八个图像数据文件利用主成分分析,提取出主要特征。以CO1(阿尔塞堡咖啡地数据集)为例,在该数据集91张图像数据中,每10张为一组,通过PCA提取出占95%的主成分。最后压缩成原图像,即为CO1图像数据集中的主要特征,也是阿尔塞堡咖啡地的主要特征,其他地区同理,结果如下图3所示。

\
 

  3分析与对比

  3.1特征提取与特征选择

  特征提取和特征选择是降维的两种方法,特征提取是特征在抽取以后,新特征是原特征的映射;特征选择是特征在经过选择以后,是原特征的子集。因四个地区咖啡地貌的主要特征受作物种植方式和气候的不同影响,特征有较大差异,所以应采用特征提取的方法在原有特征基础上创造出一些新的特征,而不只是在原有特征上进行筛选。特征提取有多种方法,包括PCA、LDA、LSA等。

  3.2 PCA与LDA

  当样本分类信息依赖均值时采用LDA效果较好,依赖方差的时候采用PCA效果较好。PCA和LDA两种方法在目标上是不同的:

  信号表示:在特征抽取后,可以精确地表示,并且信息丢失也会很小,对应方法PCA。

  信号分类:特征是抽取后要使准确率更高,不能比原来的准确率低,对应方法LDA。

  4结语

  为了进一步提高地貌特征分类的准确性和速度,提出一种基于PCA的SAR图像特征提取算法。首先训练原始图像,生成样本矩阵,利用主成分分析将样本图像的维度从高维降到低维,实验数据表明,得出本文提出的特征提取方法相比于特征选取方法精确度更高,提取出的不同地区地貌特征更具代表性,在特征提取方面与线性评判分析法对比,由于样本分类信息依赖方差多于均值,所以采用主成分分析法对提取效果更好。PCA具有的压缩数据和提取主要特征的特点,使算法具有较高速度与准确性,可以去除阴影和噪声的影响,进而最大限度地保留图像特征信息,提供了一种地貌特征提取的新思路。

  参考文献

  [1]王聪.SAR图像目标特征提取及识别[D].西安:西安电子科技大学,2020.

  [2]张皓然.基于极化SAR图像的山脊提取方法研究[D].兰州:中国地震局兰州地震研究所,2021.

  [3]张银波,李思宁,姜鹏,等.PCA特征提取和弹性BP神经网络的水下气泡识别[J].红外与激光工程,2021,50(6):209-215.

  [4]杨博雄,杨雨绮.利用PCA进行深度学习图像特征提取后的降维研究[J].计算机系统应用,2019,28(1):279-283.

  [5]孔德明,董瑞,崔耀耀,等.基于三维荧光光谱结合二维线性判别分析的油类识别方法的研究[J].光谱学与光谱分析,2021,41(8):2505-2510.
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
 

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/41688.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml