Paper Reading 9|Sea surface target detection based on complex ARMA-GARCH processes
摘要
在金融应用中,常用带有广义自回归条件异方差(GARCH)误差的自回归移动平均(ARMA)模型拟合收益序列。在本文中,我们开发了一个复值ARMA-GARCH模型用于海杂波建模应用。与AR-GARCH模型相比,新引入的MA项使模型能够将相邻回波测量值的条件方差依赖性作为模型系数,利用相邻测量值之间的强相关性提高了建模精度。基于海杂波建模的复值ARMA-GARCH过程,进一步发展了一种海面目标检测算法。通过对大量实际海杂波数据的分析,我们对其性能进行了评估,结果表明,与最先进的AR-GARCH探测器相比,所提出的海面目标探测器的探测概率有明显提高。
引言
海杂波的精确建模在遥感和雷达应用中具有重要意义,有利于优化探测算法设计和性能预测[1-9]。为了全面研究不同环境条件下实际杂波的统计特性,开展了各种实验,并向国际研究界提供了数据库,如麦克马斯特智能像元处理雷达(IPIX)数据库[10]和科学与工业研究理事会(CSIR)数据库[11]。然而,有时统计描述杂波振幅和功率所需的数据要么无法获得,要么缺乏各种海况、掠射角、极化和风向的数据。另外,计算机仿真程序提供了一个廉价可靠的环境来获取各种频段的合成杂波数据[12,13]。
对于低掠射角,海杂波一般具有威布尔[14]、K[15]、对数正态[16]、帕累托[17]、复合高斯(CG)[18]概率密度函数(pdf)等特征。对于大掠射角海杂波[19],Pareto分布也是一个很好的模型。然而,当海杂波与目标的模型不符合实际复杂环境[20]时,传统的基于统计的检测方法无法获得预期的检测结果。此外,这些传统分布不能精确地模拟返回序列中可能存在的时间依赖性。
该产品模型描述了雷达系统相干处理区间(CPI)量级的观测时间间隔的散射机理。因此,在雷达应用中,CG模型被广泛用于表征重尾杂波分布,特别是海杂波建模[22]。CG过程的织构控制着复合过程的方差,通常被假设遵循一定的分布,例如Gamma[23],逆Gamma[23,24],逆高斯[25]。然而,在实际应用中,很难确定哪种纹理分布是最优的。
引入广义自回归条件异方差(GARCH)过程对海杂波进行建模,为将杂波回波振幅作为时间序列建模提供了一种新的方法。在这里,“异方差”这个术语意味着方差不是恒定的,而是时变的。在[28]中,作者提出了一个复杂的非线性ARCH模型和相应的检测器,与线性GARCH检测器相比,该检测器实现了更高的检测概率。然而,线性和非线性garch过程都不能考虑相邻杂波回波之间的强相关性。因此,为了有定量的概念,有必要首先估计数据自相关函数的时间自相关函数[27]的平均值。然后,根据估计的自相关函数,可以预测分离一定区间的两个脉冲的样本是不相关的。例如,如果经过六个脉冲后,自相关函数近似为零,那么我们从六个连续的样本中提取一个样本。这种数据提取方法明显效率低下,浪费了大部分雷达资源。因此,研究了一系列GARCH型过程用于海杂波建模,并在[29]中提出了一个与自回归(AR)过程相结合的广义非线性-非对称GARCH模型。由于AR工艺的引入,可以有效地缩短提取间隔时间。
值得注意的是,GARCH过程也是一个产品模型,正如在下一节中观察到的那样。因此,它自然继承了CG模型的优点。GARCH过程与CG过程的主要区别在于GARCH过程的条件方差是时变的,依赖于历史信息。GARCH过程的两个主要特征是lep- tokurity和波动性聚类(即,大变化往往在低大变化之后,小变化往往在小变化之后),这在海杂波测量中得到了准确的显示。历史信息被用来改进模型当前的描述和未来的预测。虽然相邻杂波测量之间的相关性很强,但被时间间隔隔开的两个脉冲的样本变得不相关。这意味着在使用GARCH过程(或非线性GARCH过程)进行杂波建模时,需要首先分析杂波的自相关函数来确定适当的时间区间。显然,当雷达停留时间较短时,该方法效率较低,甚至无法使用,导致数据长度不足,无法进行精确的参数估计。
随后,Pascual等人[30]提出了一种用于海杂波建模的复杂二维自回归GARCH (AR-GARCH-2D)过程。通过引入AR项,将相邻测量值的相关性建模为条件均值的系数。然而,由于条件方差是由包括杂波测量在内的过去信息组成的,因此不仅杂波测量结果是依赖的,而且它们的条件方差也是依赖的。因此,在模型的条件均值表达式中加入移动平均(MA)项,以获得对实际海杂波更精确的建模是自然合理的。新的杂波模型具有两个优点:1)不再需要数据提取,大大减少了所需的雷达停留时间;2)实际杂波的条件均值建模更精确,条件方差更小,这与检测器的决策阈值密切相关,如4.3.1节所示。
本文通过实际海杂波数据,证明了本文提出的ARMA-GARCH探测器与AR-GARCH探测器相比,在探测概率上有明显提高。值得一提的是,我们主要讨论了一维情况,以阐述在条件均值表达式中添加MA项的优点。换句话说,脉冲维(慢时间维)杂波被建模为一个复杂的ARMA-GARCH过程。事实上,ARMA-GARCH过程和相应的检测算法可以通过在当前的条件方差表达式中加入距离维(快速时间维)测量值和距离维的条件方差,方便地扩展到二维情况。同时,参数估计所需的数据量也增加了。此外,本文使用的雷达数据的距离分辨率为30 m,导致距离维数系数可以忽略不计。因此,二维和一维过程,以及相应的探测器,本质上是相同的。这一观点在第4节的数值模拟中得到了证明。由此推断,随着雷达分辨率的提高,二维探测器可能获得更好的性能。
本文的其余部分组织如下。第二节简要介绍了复杂的一维和二维ARMA-GARCH过程,以及参数估计算法和模型顺序选择准则。基于海杂波的一维模型,在第三节中提出了一种二元假设检验检测算法。在第4节中,进行了数值模拟来验证所提出的检测器的优点。
基于复杂ARMA-GARCH过程的新型杂波模型
一种新的杂波模型
参数估计
由于只有α0和α1两个系数的GARCH过程通常足以捕获海杂波[27]的大部分统计行为,我们将条件方差部分的模型阶数限制为(1,1)。此外,我们将AR和MA项的最大阶数限制为2,这能够建模相邻杂波样本之间的相关性,如下文所示。本文认为,传统的信息准则,如赤池信息准则(AIC)[33]和贝叶斯信息准则(BIC)[34],不能用于条件异方差模型[35]的阶数确定。本文利用基于Kullback-Leibler信息准则[36]估计的AIC和BIC准则的修正版本。
基于新杂波模型的检测算法
基于上述新的杂波模型,我们开发了一种判断雷达回波是无目标还是有目标的检测算法。对于一个给定的范围单元,N个复样本从慢时间维{yt}tN 1可以组装成一个n维向量y =[y1 y2··=yN]T。
在虚假设条件下(H0),假设杂乱的数据只能由c。在备择假设下(H1),相反,它是假定的数据由c x和杂波信号的总和。目标信号向量x是建模为x =β,β是未知的目标复振幅,s是已知的复杂转向向量的元素是由圣= exp (j2πfd Tst), fd是目标多普勒频率和Ts雷达脉冲重复间隔(PRI)。
数值结果
实际的雷达数据
为了在实际环境中评估所提议的探测器的性能,我们获得了麦克马斯特IPIX雷达[10]在1993年冬天收集的杂波测量。IPIX雷达是一种双偏振高分辨率x波段雷达,工作频率为9.39 GHz。IPIX数据库的详细分析可在[22]和[37]中找到。特别地,从“starea”和“stareC0000”数据集中选取14组数据来评估所提出的检测器的拟合优度和性能。图1显示了以17号数据文件为例的VV线偏振通道的大小。缩写VV表示垂直发射偏振和垂直接收偏振。从图1(b)可以清楚地观察到波动率的聚类。
表1给出了不同型号阶次的HAIC和HBIC结果。可以看出,当p = 2和q = 2时,对应的ARMA(2,2)-GARCH(1,1)模型达到最低的HAIC和HBIC。乍一看,增加模型阶数似乎可以提高建模精度和检测性能。然而,在实际应用中,这有时是不现实的,因为高阶模型需要更大的训练数据量,这受雷达停留时间和PRF的影响。此外,参数估计较费时。这是在实际应用中需要考虑的权衡,特别是在实时雷达任务中。
估计精度与数据长度的关系
首先,我们进行了仿真,证明二维ARMA-GARCH模型在应用于IPIX雷达数据时,与一维模型相比没有优势。我们最初将二维ARMA-GARCH模型的条件方差限制为仅依赖于相邻脉冲维数和距离维数
其原因有两方面:1)条件方差系数随m1、m2、n1、n2阶的增加而急剧增加,严重阻碍了过程系数的准确估计;此外,在实际场景中,即使杂波数据集足够大,可以对高阶模型进行精确估计,估计过程也更加耗时,可能会影响所提检测器的实时性。2)表2给出了三组实际杂波数据的二维ARMA-GARCH过程的QMLE结果。当m1 = m2 = n1 = n2 = 1时,除α01外,α10、β01和β10的估计系数几乎都小于0.1,说明电流条件方差主要受相邻脉冲维数回归的影响。因此,本文主要研究一维ARMA-GARCH模型。然后,我们通过一个仿真表明,增加n1并不能提高建模精度。我们随机选择几组数据(#19,#25,#26和#280,IPIX文件,第一个范围单元,VV极化,数据长度为5000),并使用ARMA(2,2)-GARCH(2,1)模型估计系数。估计结果如表3所示。可以看出,α口令口令的口令要么为0,要么非常小(小于0.01),这意味着杂波回波分离了多个脉冲,几乎不会影响电流条件方差的性质。因此,我们将GARCH部分的阶数限制为(1,1)。
与GARCH和AR-GARCH模型相比,ARMA-GARCH模型相对复杂。因此,有必要分析估计误差与数据长度的关系,以指导实际杂波数据的估计质量。
预先设定的参数近似等于17号杂波数据集的QMLE。对于每个数据长度,我们重复估计过程200次。参数的初始值随机选取,满足第2.1节介绍的约束条件。表4显示了作为数据长度函数的估计的平均值和标准差值。可以看出,估计的平均值具有较小的偏差,该偏差随着估计过程中使用的样本数量的增加而减小。此外,估计的标准差随着样本数量的增加而减小,这表明QMLE类似于渐近无偏一致估计的行为。
性能比较
拟合优度
检测性能指标
结论
本文将海杂波建模为具有GARCH误差的复杂ARMA过程。该模型精确捕获了实际杂波数据在不同极化下的重尾pdf,拟合优度可与AR-GARCH和CG过程相媲美。同时考虑雷达回波测量的相关性及其条件方差的相关性作为模型系数,从而对实际杂波进行更精确的相关建模。结合SQP算法和Hessian矩阵的BFGS更新方法,推导了ARMA-GARCH过程系数的QMLE过程,并通过数值模拟研究了估计量的渐近性质。为了保证qmle收敛于真值,推导了模型系数的约束条件。此外,在考虑异方差特性的情况下,采用改进的AIC和BIC来确定合适的模型阶数,这是复杂性和拟合效果之间的权衡。
此外,我们通过几个例子说明ARMA-GARCH过程的二维扩展在应用于IPIX雷达数据时没有优势。距离维系数α10和β10的估计结果表明,当前条件方差与邻近距离维测量之间的相关性,以及当前条件方差与邻近距离维条件方差之间的相关性均无统计学意义。
我们还提出了一种基于杂波模型的检测算法。由于引入了MA项,ARMA-GARCH模型的条件方差比AR-GARCH模型的条件方差小得多,这在检测中是必不可少的。利用合成的和实际的杂波数据,对该检测器的性能进行了评价,并与AR-GARCH检测器和高斯检测器进行了比较。如预期的那样,模拟ROC曲线显示,在虚警概率相同的情况下,所提检测器的检测概率远远优于其他两种检测器,AR-GARCH检测器在大多数情况下是第二好的检测器。原因可以解释如下。与AR-GARCH检测器相比,ARMA-GARCH过程更准确地模拟了时间相关性,从而减少了条件方差,从而降低了决策阈值,提高了检测概率。与高斯检测器相比,AR-GARCH和ARMA-GARCH检测器的阈值是时变的,依赖于先验信息,可以自适应调整。值得注意的是,在HH偏振下,AR-GARCH检测器比高斯检测器表现出更明显的改进。因为HH偏振数据通常比VV偏振数据要高得多。杂波的PDF具有较重的尾部,此时杂波的高斯假设不再有效,garch型模型的优势更加明显。
在实际的雷达应用中,需要考虑探测器的实时性。可以看出,与GARCH、AR-GARCH和一些传统的杂波模型相比,所提出的复合ARMA-GARCH模型具有更多的系数。因此,系数的估计计算量较大,但需要在海况不剧烈变化时经常更新系数值。
garch型探测器的性能可以通过以下两种方式进一步提高。首先,GARCH模型解释了波动率的平滑变化,但不能解释杂波中罕见的大离散峰值。因此,引入泊松分布(经济学文献中又称“跳跃过程”[41-43])来控制时间区间内事件的数量是一种很有前途的方法。跳跃概率要么是常数,要么随时间变化。其次,利用多元GARCH模型[44],将模型扩展到极化信息。