SCI论文(www.lunwensci.com):
摘 要:最近社会所有领域都以人工智能、大数据、利用机器学习、深度学习、物联网、机器人工学、云计算等代表性的 第四次产业革命技术成为未来竞争力成为热点。同样在军事领域,为了确保和发展未来战争的模式和环境所要求的能力,机器 学习技术对于空中动态目标处理有着广泛的前景,本论文积极探索有效的机器学习利用方案。
关键词:机器学习 ;空中动态目标处理 ;研究
Research on Air Dynamic Target Processing Method Based on Machine Learning
WANG Zhenyu
(Information Engineering University Luoyang Campus, Luoyang Henan 471003)
【Abstract】: Recently, the representative fourth industrial revolution technologies in all fields of society, such as artificial intelligence, big data, machine learning, deep learning, Internet of Things, robotics, cloud computing and so on, have become the focus of competitiveness in the future. Similarly, in the military field, in order to ensure and develop the capabilities required by the mode and environment of future war, machine learning technology has broad prospects for air dynamic target processing. This paper actively explores effective machine learning utilization schemes.
【Key words】: machine learning;air dynamic target processing;research
0 概述
关于未来战争的模式存在诸多可能,但专家们给出 的意见中的共同特点是传感器和网络高度发展的网络中 心作战环境下,所有的战场信息都将被快速收集、流 通、整合、处理,以机器学习和人工智能技术为基础的 无人武器体系将在所有战场领域活跃使用。这些特点将 使未来战争比现在节奏更快、更复杂多变。特别是空中 作战目标的变化,比起固定目标,移动目标数量会增加, 移动目标中限时性目标(Time-sensitive Target)的比 例也会增加 [1]。
本研究从这一角度出发,作为发展空中作战遂行体系 的第四次产业革命技术适用方案的一环,提出了利用机器学习算法减少动态目标处理(Dynamic Targeting) 所 需时间的动态目标处理模型,并验证适用可能性。
1 联合目标处理及机器学习基础动态目标处理
1.1 ATO 任务遂行周期和联合目标处理周期
空中作战的核心是空中任务指令(ATO :Air TaskingOrder)的生成、布置、实施、评估。本研究中提出的 目标处理也是此过程中的一部分。ATO 是以空中作战 布置详细任务的方法,指挥控制机构根据特定目标及任 务分配出动批架次、战力、部队的作战命令。ATO 以 96 个小时为周期分 6 个阶段,ATO 任务遂行周期以每24 小时为单位重叠遂行。
遂行 ATO 任务遂行周期需考虑诸多可能因素,方 能制定各阶段所要求的过程。因此在得到自动化信息体 系的帮助下,依旧需要大量的时间。特别是因为每 24 小时就要生成 ATO,造成同时有 5 个 ATO 任务遂行周 期以 24 个小时的时差重复遂行。从中产生的人均工作 时长较长,在要求近乎于实时的超快作战节奏的未来空中作战中或成为较大阻碍。
与 ATO 任务遂行周期相联的联合目标处理是指根据 作战要求和能力,优先选择相对应的目标的流程。联合 目标处理以六个阶段为目标处理周期(Joint Targeting Cycle)遂行,特别是第二阶段“目标开发及优先级”与ATO 任务遂行周期的第二阶段相关联,根据作战要求 选定目标优先级(制定 JIPTL),如此在周期内以相对 充分的时间,通过系统的流程反映目标的过程称为计划 性目标处理。(Deliberate Targeting)
1.2 机器学习适用的框架和相关研究
为将机器学习适用于目标处理,算法的关键是“如 何学习符合现代作战要求的目标优先级判定模式及进行 有效预测(或分类)的可能性” [2]。也就是说机器算法去学习专业人员遂行的计划性目标处理的模式,并需 要将此适用在动态目标处理上。计划性目标处理程序执 行的核心产物 JIPTL 是包含所有目标的优先评价结果 (模式)和目标信息的目录,在制作过程中通过联合目 标协调委员会(JTCB:Joint Targeting Coordination Board)获得目标授权人的批准。另外,由于具有利于 机器学习的结构化形态,所以判断是适合学习目标优先 级判定模式的数据。因此,机器学习算法可以从每天制 定的 JIPTL 学习目标优先级决定模式,实施 ATO 期间 识别新目标时,算法会以现行作战方针为基准,快速预 测(或分类)目标优先级,并立即采取措施。
综上所述,这可以看作是在决定特定目录优先级 的问题上适用机器学习算法。从相关的研究来看,在 军事领域方面虽然已经有采用体系结构缩短履行 ATO 任务遂行周期投入的人均工作时长的研究和采用自动 化的启发式优化方法来解决处理动态目标时选定目标 和武器之间最佳分配问题的研究等。相反,信息搜索 (Information Retrival) 领域中根据电子邮件重要性 预测优先级、为提高文件查询性能的优先级选择方法等 与本研究的目标优先级决定问题有关。一般的基础机器 学习领域的研究中有适用进化算法的研究案例、为了提 高内容基础图像查询性能通过决策树模型学习图像关联 度的研究事例等。
1.3 以机器学习为基础的动态目标处理模型
模型综合了正在实施中的 ATO 的JIPTL 及其一天前 后的JIPTL,分成训练用数据库(Training Dataset) 和 性能测试用数据库(Test Dataset),并对学习模式和模 型性能进行评估。训练好的模型遵照性能评估结果获取 JTCB 授权人的许可后,可对进行的 ATO 中新识别的目标进行优先级预测(或分类),并将结果导出。再根 据导出的优先级结果,立即进行 ATO 反映并形成攻击, 或者纳入联合目标目录供后续作战使用。
2 机器学习基础动态目标处理实验
2.1 实验流程
机器学习基础动态目标处理模型是否能适用的实验需满足以下两种要求。
(1)实验用数据库。为了实验,需要作战实施期间 制作的特定日期的 JIPTL,该数据必须包含作为独立变 量使用的各目标信息和作为从属变量使用的该目标的 优先级。实验数据最好使用过去实际战争时使用过的 JIPTL,但是这种数据不会公开,因此需要以公开的资 料为基础,最大限度地重新构建实验用数据库。
(2)选定适用于判定目标优先级模式的机器学习算法。如上所述,目标优先级判定问题有想要获得的结果 (输出变量 :新目标的优先级),当学习数据包含输出变 量的值(计划性目标处理判定的目标优先级)时,对 “根据输入变量值的变化,输出变量值的如何变化”进 行算法的学习,以新数据的输入变量为基础进行预测和 分类时,具有调整性能更好的形态。这是机器学习的分 类中跟监督学习相符的形态,因此从监督学习算法中选 择一种使用也行得通。
2.2 实验数据生成和预加工
如上所述,为实验生产的数据库是日期别 JIPTL。 模式学习时,这些属性中“Priority”是从属变量,其 余部分应作为独立变量使用。从属变量“Priority”是 根据该日期目标的重要性而制作的范畴型变量,虽然是 适合实验的形态,但是独立变量并不能使用上述所有属 性。一般情况下,数据库中的所有变量,在预加工或学 习过程中进行变量选择比较好,但在本实验中,事先选 择合适的变量后再生成比较有效,因此根据美军联合 教理的内容和空中作战及目标业务领域专家的意见选 择了变量。上述属性中的“Objective”(相关的作战目 标)是与该目标相关的作战目标,这是因为管理目标的 目标体系(Target System) 内 的下位分类“Target” (具体的目标种类、名称)具有阶层关系,会形成过度 的相关关系,因此排除在外比较合适,“JDPI”(攻击 时弹着点)、“Desired Effect”(攻击预期效果)、对于 “Field Elevation”(目标标高)在进行武力分配和详细 任务计划时,虽然是重要的考虑因素,但是作为判定目 标优先级要素是不合适的,所以最好排除在外。另外,“Component”(推荐构成军)意味着推荐攻击目标的 构成军,这并不是目标优先级的决定素,“Reason of Nomination”(目标推荐理由)是各构成军推荐该 目标的主要内容,因为每个构成军都表明了立场,所以 推荐目标是帮助工作人员判断的参考资料,很难看作是 包含重要信息。相反,“Coordinate”(目标坐标)认 为是根据作战目标决定目标优先级的主要因素。例如假 设目标是位于敌人前线地区的 SA-2 地空导弹基地和位于敌人后方地区的同种目标。如果作战目标和方针设定 为在前方地区实现局部的空中优势,那么前者的目标优 先级高,后者则优先级的相对较低。这种目标位置影响 优先级的现象,对地面战力等其他目标范畴也同样可能 发生。因此在 JIPTL 中, 适合作为独立变量的属性是 “Target”(具体的目标种类、名称)和“Coordinate” (目标坐标), 这两种属性在对敌战争执行体系中包括各 目标所承担的功能和该目标如何与我军的作战目标达成联系的核心信息。综上所述,实验用数据是以海湾战争分析 资料为基础, 由独立变量“Target”“Coordinate”、从属 变量“Priority”组成的数据库。
具体以在海湾战争中实际上使用的 5502 个目标为对 象, 将航空目标体系(Target System) 的范畴(Target by Category Automated Intelligence Installation File)和范畴别比例适用后进行了整理。其中除了无 法分析的“Miscellaneous/Other”974 个目标外, 反 映出海湾战争实际目标数 4528 个的 1/2,生成了包括 2469 个目标在内的实验用数据库。
从属变量“Target Priority”是以根据海湾战争分 析资料沙漠风暴作战第一天(D+1) 的作战目标和方针 的目标优先级为基础制作的。开战第一天 ATO 的目标 处理非常重要,可以左右整体战力的胜负。由于包含最 复杂、最主要的目标处理模式,因此通过实验,使机器 学习算法可以学习第一日的目标处理模式,预测(或分 类)目标优先级是符合本实验的设置。
2.3 决策树模型学习
决策树模型学习是用 R 的 Party 软件包中包含的 ctree 函数进行的。ctree 函数是基于置换检验的无偏递 归划分(Unbiased Recursive Partitioning Based on Permutation Test) 方法, 只执行经过 p- 验证的有效 分割,因此即使不进行另外的剪枝(Punning),也没 有过度拟合(Overfitting)危险的特点。实验数据分为 训练数据库 70%(1727 个)、验证数据库 30%(741 个),用训练数据库学习模型上的模式,用验证数据库评估学 习模型的预测(或分类)性能。导出的决策树模型结 果,由 29 个决策节点和 30 个终端节点组成。
从对模型分类过程的解释来看已完成学习的决策树 模型为判定目标优先级制定了规则。例如当有新的目标 数据时, 在第一节点上,“TG Category”相当于 Table 10 的 Attribute 上的 Class 时,移动到 2 号节点,否则移动到 7 号节点 ;2 号节点上,“TG Category”相当于 Attributes上的 Class 时,移动到 3 号节点 ;3 号节点根据“GARS Cell”移动到 4 号节点,被分类为“Priority”A,或者 到 5 号节点被分类为“Priority”B。这些规则可能有些 复杂,但指挥官或决策者可以理解和认可。
3 结语
本研究运用机器学习算法,提出了对空中作战目标 处理的实际可应用的发展方案,以实际战争统计分析资 料为基础重新组织了因保密问题难以接近的作战运营元 数据,并进行实验。实验结果显示,如果在动态目标处 理上运用机器学习算法,就可以巨大地缩短整个流程所 需时间,以接近实时的速度判定目标优先级。相反,本 研究中没有利用实际数据,而是利用人工生成的虚拟数 据库进行机器学习 ;为了发展未来的机器学习基础目标 处理,我们认为应该以多种多样的算法为对象,继续研 究具有更优秀的准确度的模型适用方案。
参考文献
[1] K.Gayathri Devi,Kishore Balasubramanian,Le Anh Ngoc.Machine Learning and Deep Learning Techniques for Medical Science[M].Boca Raton USA:CRC Press:2021.
[2] Hemachandran K,Shubham Tayal,Preetha Mary George,et al.Bayesian Reasoning and Gaussian Processes for Machine Learning Applications[M].Boca Raton USA: CRC Press,2021.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/35653.html