SCI论文(www.lunwensci.com):
摘要 :时间序列分析在充分利用历史数据的基础上,简单、快速地预测在未来较短时间内数据 的变化趋势,预测精度高,便于掌握,具有非常广泛的应用领域。本文在 2010 —2019 年公安机关 受理故意伤害案件数等历史数据的基础上,构建 ARMA 模型,并对 2020 —2025 年的公安机关受 理故意伤害案件数进行预测。
关键词 :时间序列; ARMA 模型; 故意伤害案件; Matlab
一、研究背景
伴随着大数据时代的到来,全国各级公安机 关系统都已基本建立较为完备的犯罪事件数据 库,各类犯罪事件的发生情况和相关信息都记录 在内。但目前关于这些数据更多集中在简单的应 用,如查询、统计和简单的分析等。随着社会形势 和科技的快速发展,公安机关对犯罪行为的治理 早已不仅仅只局限于“治理 ”,对犯罪现象进行 系统研究,“ 预防 ”犯罪行为的产生更是公安机关 的迫切需要。如何利用这些已有的数据,通过对过 去犯罪数据的分析,预测未来一段时期内犯罪事 件类型、数量的变化情况,从而为警力配置和犯罪 事件的预防提供科学的参考依据,以便更加充分 地利用有限的警力资源提高出警效率、精准打击 犯罪行为,更好地保护人民群众的生命和财产安 全,都是非常有必要和意义来进行研究的。
时间序列分析是概率统计学科中应用性较广 的一个分支,它广泛应用于金融经济、气象水文、 信号处理、机械振动等实际问题中,是一个具有相 当高的实用价值的应用研究领域。时间序列分析 能够充分利用原时间序列的各项数据,运算速度 快,对模型参数有动态确定的能力,是一种非常好 的短期预测方法。[1]所谓的时间序列,指的是同一 种现象在不同时间上的相继观察值排列而成的一 组数字序列。观察这组时间序列在过去的变化规 律,推断其以后可能的变化趋势,从而对该现象的未来进行预测,就是时间序列分析法。
近年来有关时间序列分析在公安数据处理中 的主要研究主要分为如下三个方面:
(一 )从社会犯罪的特征出发,探讨社会犯 罪统计的意义,讨论犯罪时间序列分析的意义与 方法,提出这一领域的研究方向。代表性论文为 国务院特殊津贴享有者、辽宁警察学院何平教授 的《关于社会犯罪统计理论与时间序列分析的研 究》。该论文为何平教授在意大利佛罗伦萨大学讲 学的内容节选,详细系统地讲述了犯罪统计学理 论的理论来源和特点,并对犯罪时间序列分析的 研究进行了展望。[2]
(二)利用时间序列分析对具体案件类型的增 长趋势进行预测。如同济大学法学院单勇、阮重 骏发表的《基于 X11 方法的盗窃犯罪时间序列分 析》,发现了温州市龙湾区的盗窃类犯罪的时间分 布规律与季节变化;由国家“十二五 ”科技支撑计 划项目资助的,中国人民公安大学的陈鹏、赵鹏、 瞿珂的《基于时间序列模型的 110 警情数据预测 研究》;沈齐、范馨月在中国刑警学院学报上发表 的《季节性 ARIMA 接警量预测模型在警情分析中 的应用》;浙江警察学院教师韩一士、范英盛、李 国军、郑滋椀的《基于 ARIMA 模型的通讯网络诈 骗犯罪增长趋势分析 ——以浙江省衢州市为例》; 湖南大学法学院屈茂辉、郝士铭《基于 ARMA 模 型的我国财产类犯罪人数预测研究 》等等。
(三)通过改进时间序列模型或者利用更加先 进的统计分析软件来更加精确地预测犯罪态势。 例如北京工业大学的黄娜、何泾沙、孙靖超、朱 娜斐的《基于改进 LSTM 网络的犯罪态势预测方 法》;南京审计大学钟飚、袁梦佳发表在中国人 民公安大学学报( 自然科学版 )上的《犯罪时间 序列预测分析方法研究 —— 以 CrimeStat 软件为 例》;武汉大学涂小萌、陈强国发表在北大核心期 刊电子技术应用上的《基于 ARIMA-LSSVM 混合 模型的犯罪时间序列预测》;上海交通大学曾伟华 的硕士论文《基于 ARMA 模型的犯罪事件预测分 析系统的设计与实现 》等等。[3]
目前,利用时间序列分析的方法在公安数据 处理方面的应用的研究趋势是充分利用已有的数 据,通过改进算法,采用更加先进的数据处理手 段,更准确、更有效、误差性更小地预测犯罪发 展趋势。下面以故意伤害案件为例,在《 中国第 三产业统计年鉴 》上我们可以查到 2006—2019 年 公安机关受理故意伤害案件数,2020 年的数据尚 未查到,我们将在这些历史数据的基础上,构建 ARMA 模型,并对 2020—2025 年的公安机关受理 故意伤害案件数进行预测。
二 、ARMA 模型
ARMA 模型即自回归滑动平均模型,它是模 型参量法高分辨率谱分析方法之一。这种方法是 研究平稳随机过程有理谱的典型方法,是研究时 间序列的重要方法。[4] 由自回归模型(简称 AR 模型 )与移动平均模型(简称 MA 模型)为基础 “混合 ”构成。但它比 AR 模型法与 MA 模型法有 较精确的谱估计及较优良的谱分辨率性能,但其 参数估算比较繁琐。在市场研究中常用于长期追 踪资料的研究,如:Panel 研究中,用于消费行为 模式变迁研究;在零售研究中,用于具有季节变动 特征的销售量、市场规模的预测等。
ARMA 模型参数估计的方法很多。如果模 型的输入序列 {u (n )} 与输出序列 {a (n )} 均 能被测量时,则可以用最小二乘法估计其模型参 数,这种估计是线性估计,模型参数能以足够的精 度估计出来。许多谱估计中,仅能得到模型的输出序列 {x (n )},这时,参数估计是非线性的,难以求得 ARMA 模型参数的准确估值。[5]从理论上推出了 一些 ARMA 模型参数的最佳估计方法,但它们存 在计算量大和不能保证收敛的缺点。因此工程上提出次最佳方法,即分别估计 AR 和 MA 参数,而 不像最佳参数估计中那样同时估计 AR 和 MA 参 数,从而使计算量大大减少。
所谓的 ARMA (p ,q)序列指的是:设 {X
t, t=0,±1,±2,…} 是零均值平稳序列,若满足X
t -φ
1X
t-1 -… φ
PX
t-p=

,其中

为零 均值、方差为

的平稳白噪声,则称为阶数 p ,q 的自回归移动平均序列,简称 ARMA (p ,q)序 列。接下来我们将逐步完成 ARMA 模型的构建及 预报,先开始检测序列的平稳性。[7]
三 、平稳性 Daniel 检验
一个平稳的时间序列可以极大地减少需要分 析的随机变量的个数,并相对增加了待估参数的 样本容量,达到降低分析难度和提高估计精度的目的。检验序列平稳性的方法很多,在这里我们采 用 Daniel 检验。
假设时间序列样本为 χ
1,χ
2,…χ
n,其顺序统计 量为χ(
1),χ (
2),…χ(
n),若χ
i= χ(
k),则称 R
i=k 为 χ
i 在样 本中的秩。对于二维变量 (t,R
t),t=1,2,…,n 计算 其 Spearman 相关系数

,并构造统计量

。作假设检验如下:
H
0:序列X
t 平稳; H
1:序列X
t 非平稳。
则对于显著水平

,计算时间序列 χ
t 的 Spea- rman 相关系数 q
s 和 T。若

,则拒绝 H
0 , 也就是说 χ
t 是非平稳的,且 q
s >0 时序列上升, q
s<0 时序列下降。若

,则接受 H
0,此时认 为 χ
t 是平稳的时间序列。
对于 2006—2019 年公安机关受理故意伤害案 件数构造时间序列 a= [81325 ,123609 ,150516 , 208051 ,237471 ,278482 ,306328 ,294449 , 229277 ,216716 ,220193 ,204054 , 176387,
156090],计算可得
Qs=0.2,T=0.7071,

=2.1788,所以

, 该时间序列是平稳的。
四、模型识别与定阶
在该部分,我们将利用 AIC 准则,判断该序 列是属于 AR(p)、MA(q),或者 ARMA(p ,q) 模型,并确定阶数 p ,q。[6]
AIC 准则是指:选取 p ,q ,使得 min AIC=

,这里 n 为样本容量,

为

的估 计。由于 ARMA 序列要求是零均值的平稳序列, 因此对序列

,分别对 p=0,1,2,3,q=0,1, 2 ,3 做 ARMA 拟合,计算其对应的 AIC 值,如表1 所示。
比较可得当 p=2,q=2,时,AIC 值最小,因此 我们选用 ARMA (2 ,2)模型进行拟合。利用 MATLAB 软件建立模型并进行预测,得到的模型

。
五、模型检验与预测
利用 MATLAB 中的 lbqtest 程序对拟合残差进 行 Ljung-Box 检验,检验结果 h=0,说明残差序列 为白噪声序列,不存在还未提取的信息,模型通过检验。对已知数据上述预测模型的相对误差,见表 2。
可以看出该模型的预测精度是较高的。
利用 forecast 程序预测未来五年公安机关受理故意伤害案件数亿次,见表 3。
六 、总结
时间序列分析是定量预测方法之一。它包括 一般统计分析(如自相关分析,谱分析等),统计 模型的建立与推断,以及关于时间序列的最优预 测、控制与滤波等内容。经典的统计分析都假定数 据序列具有独立性,而时间序列分析则侧重研究 数据序列的互相依赖关系。后者实际上是对离散 指标的随机过程的统计分析,所以又可看作是随 机过程统计的一个组成部分。它可以在充分利用 历史数据的基础上,简单、快速地预测在未来较短 时间内数据的变化趋势,预测精度高,便于掌握, 具有非常广泛的应用领域。
根据过去几年公安机关受理的故意伤害案件数,利用时间序列分析来预测未来几年公安机关 受理故意伤害案件数,可以协助公安机关制定更 加有效的犯罪防范对策,有效防范相关犯罪行为 的发生,这是一件非常有意义的工作。
参考文献
[1] 顾海硕,陈鹏,李慧波.犯罪时空预测方法研究综述与展望[J].地球信息科学学报,2021,23(1):43-57.
[2] 屈茂辉,郝士铭.基于 ARMA 模型的我国财产类犯罪人数预测研究[J].中国刑事法杂志,2013(4):100- 106.
[3] 陈鹏,赵鹏凯,瞿珂.基于时间序列模型的 110 警情数据预测研究[J].信息系统工程,2015(9):128- 131.
[4] 陈鹏,黄鸿志,胡啸峰,等.基于统计回归的犯罪活动时序影响因素实证分析[J].中国人民公安大学学 报(社会科学版),2016,32(6):16-23.
[5] 韩一士,范英盛,李国军,等.基于 ARIMA 模型的通讯网络诈骗犯罪增长趋势分析——以浙江省衢州 市为例[J].理论观察,2017(5):101-103.
[6] 侯苗苗,胡啸峰.基于时间序列模型 SARIMA 的犯罪预测研究[J].中国人民公安大学学报(自然科学 版),2021,27(2):67-73.
[7] 司守奎,孙兆亮.数学建模算法与应用[M].北京:国防工业出版社,2015.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/falvlunwen/35899.html