第一章绪论
第一节论文的研究选题及理论意义
随着经济全球化和金融市场体制的不断发展,国际金融市场对我国金融市场的影响逐步加深,金融产品和金融衍生品的增加,金融理论的创新与我国政府对金融管制上的减轻,在很大程度上促进了金融市场的流动性,但是,金融市场的风险也不断地累积,加大了金融机构控制与防范风险的难度。金融风险是指金融资产在未来某一时期内遭受损失的可能性。由于现阶段我国金融市场体制尚不健全,对金融风险的识别、控制与监管就显得特别重要。金融风险度量的方法主要有灵敏性分析、波动性分析、压力测试与风险价值等。J.P. Morgan 在 1994 年提出的风险价值(Value at Risk, VaR)理论,通过建立统计计量模型来进行风险的识别、度量,为风险管理提供了一个科学可度量的理论基础。由于 VaR 理论可以较为准确地识别与度量金融市场在正常波动下的风险,许多的金融机构如银行、券商、信托等都采用了 VaR 方法来测度市场风险。随着科技进步和计算机技术的发展,人们对金融高频数据的记录、收集和存储的成本都大大降低。自 20 实际 90 年代开始,对金融高频时间序列的波动性研究得到极快的发展。在低频金融数据波动率研究领域,传统的风险度量大多是基于低频数据的自回归条件异方差(ARCH)类模型及扩展的广义自回归条件异方差(GARCH)类模型和随机波动(SV)类模型,虽然采用 GARCH 类模型和 SV 模型对金融数据波动率的建模与预测已然获得了巨大的成果,但是,低频金融数据只包含了金融市场交易的日、月、季和年度数据,选取低频数据会丢失许多重要的金融市场日内信息,因此它也无法捕捉到金融资产价格的实时动态特征,相比之下,高频数据可以精确记录交易的日内分时数据,这在很大程度上保存了重要的市场信息,使得它包含了更多的日内收益波动信息,因此,选取高频数据对金融市场波动的研究已经成为金融工程、金融计量等学科研究领域的热点问题。金融市场的竞争日趋激烈,伴随着国内金融市场的发展,随之而来的是产生的海量的金融数据,如何就不同角度对数据进行分析处理进而度量金融风险已经是风险管理的一个重大课题。虽然金融高频数据包含着更多的市场信息,有利于学者、投资者等进行市场风险的量化分析,但是伴随着它的还有金融市场微观噪声和测量误差等影响风险度量准确性的因素。如何利用金融高频数据有效地度量金融风险成为了一个有待解决的问题。
……….
第二节高频数据简述
唐勇(2006)等指出,所谓高频数据,是指在交易日开盘和收盘之间产生的交易数据,包括不同时点上的收盘价、成交量等,其抽样频率一般有秒、分钟或小时。而相应的低频数据,则是指在金融时间序列中采用的日、周、月或者季度、年的数据。研究结果表明,选取传统的低频金融数据会造成市场信息的丢失,无法较为准确地把握市场特征,而高频金融数据却有助于较为详细和精确地研究市场的微观结构特征,揭示金融市场价格形成机制和交易机制,对金融风险的识别和风险管理具有重要意义。对高频数据的研究得到了一些典型的数据特征,主要有日历效应、长记忆性、尖峰厚尾性、波动聚集性等。日历效应(calendar effects)是研究高频金融时间序列过程中的一个重要发现。所谓日历效应,是金融资产价格波动率,交易量,买卖价差和交易频率等变量在日内,周内,月内表现出稳定的、周期性的变化趋势。其中,日内模式则是指波动率等变量在日内呈现“U”型的变化趋势,就是变量在日内呈现两头高中间低的走势。日历效应对金融资产收益和市场风险具有重大影响,许多学者采用随机游走(random walk)模型、ARCH 模型、GARCH 模型等对日历效应进行了深入研究。长记忆性是指两个观测时间区间相隔较远的变量观测值之间仍然存在一定的相关性。
………..
第二章国内外文献综述
第一节 高频数据研究
20 实际 90 年代以来,高频数据的分析与建模得到了迅速的发展,并广泛运用于金融市场微观结构理论的实证研究中。国外对于高频数据的研究起步早,成果较多。Andersen 和 Bollerslev(1997)指出在外汇和股票市场的收益波动中普遍存在的日内周期性对高频收益的动态特征具有巨大的影响,只有将日内周期性这一因素考虑在内才能把握住存在于不同金融市场中的复杂的日内波动动态。Engle(2000)为超高频数据的建模应用提供了新的思路。通过选取的 52144条 IBM 股票的交易数据去为交易的时机建模并测量分析它对价格波动的影响,将ACD 模型引入去估计到达比率的相关点过程,同时采用了半参数法去估计调和均数。实证结果说明对于更长的持续期和更长的预期持续期,其波动会相应的更小。Andersen(2000)等采用德国马克/美元和德国马克/日元的汇率高频数据,建立了无需模型估计的日汇率波动率和相关系数,即实现汇率波动率。实现汇率波动率不仅是无需模型估计的,而且在一般条件下还是近似无测度误差的量,并通过将汇率波动率和相关系数作为观测样本,在实证中获取无条件下和条件下的联合分布,进而获取了相关系数和波动率之间的高度相关,明显而且持久的波动率和相关系数见的动态特征等结果,并且说明了通过已实现波动率进行标准化的收益是非常近似于高斯分布的。此外,Andersen(2001)等采用道琼斯工业指数中获取的日内高频交易数据对已实现日股票收益波动率和相关系数进行研究,他们发现实现方差和协方差的非条件分布是高度右偏,然而实现对数标准差和相关系数却近似于高斯分布,已实现波动率与相关系数表现出了较强的长记忆性。
………
第二节 低频数据研究
对于低频数据波动率建模的研究,最具里程碑意义的是 Engle(1982)提出的自回归条件异方差(ARCH)模型,采用拉格朗日乘子法去检验干扰项是否符合ARCH 过程,这一检验是基于最小二乘残差项的自相关这个基础上,并以估计英国通货膨胀的均值与方差作了实证分析,这是 ARCH 模型的首次提出与实践。此后,ARCH 模型及其各种衍生族在各个领域的应用层出不穷,应用成果不断涌现,成为现代计量经济学发展的一个重要领域。ARCH 模型经历了两次飞跃式的发展,Bollerslev(1986)在 Engle(1982)的基础上,将 ARCH 模型扩展为 GARCH 模型,即广义自回归条件异方差模型,并对通货膨胀率的不确定性进行了实证分析,这是 GARCH 模型首次提出与在实际上的应用。后来的大量研究成果和文献证实,GARCH 模型在一定条件下对金融资产波动率的预测是较为成功的。此后,ARCH 类模型的研究成果层出不穷。Andersen 和 Bollerslev(1998)针对 ARCH 模型和 SV 模型在波动率预测能力上存在不足的研究结论,通过理论和实证两个方面的分析说明了波动率预测与未来潜在的波动率因素尤其是事后波动中的可变性具有紧密联系,借助实证说明了 ARCH 模型与 SV 模型事实上提供了良好的波动率预测。虽然 GARCH 模型在刻画波动率的聚集性和消除尖峰厚尾的特性上具有较好的能力,但是它无法解释收益的杠杆效应。对此,不同学者提出了不同的非对称的 GARCH 模型来描述杠杆效应,如 Nelson(1991)提出的指数 GARCH(EGARCH)模型,Engle(1993)和 Sentana(1995)提出的二次 GARCH(QGARCH)模型,Zakoian(1994)提出的门限 GARCH(TGARCH)模型等。
………….
第三章主要研究方法论述....15
第一节高频数据的研究方法.......15
第二节日历效应的处理........18
第三节最优抽样频率的选择.......21
第四节 VaR 计算与回测........22
第四章模型构建与实证分析.......28
第一节数据统计分析与检验.......28
第二节参数估计与模型预测.......33
第三节 计算 VaR 及回测检验......37
第五章结论与展望.........41
第一节 论文主要结论.....41
第二节 本文的局限和研究展望..........42
第四章 模型构建与实证分析
本文选择沪深 300 指数作为研究样本,样本选取的区间为 2011 年 4 月 1 日至2014 年 3 月 5 日,总计 690 个交易日的数据,这里面包括了两只数据,其中一只数据样本包括了这一时间区间的日间低频数据,主要用于 GARCH 模型的建模分析,另外一只为时间频率为 1 分钟、5 分钟、15 分钟、30 分钟和 60 分钟的高频交易数据,用于已实现类序列分析使用。数据来源于 Wind 资讯金融终端,我们将数据分为两部分,将前 590 个数据定为模型参数估计样本,后 100 个数据作为预测评价样本,实证部分主要用 matlab 软件进行。对于 RRV 来说,测量所得的误差在 5 分钟这个频率最小,因此最优的抽样频率为 5 分钟,我们选取 5 分钟的沪深 300 指数的高频数据作为本文的高频研究样本,因此高频数据总共有48 690 33120组数据。在此基础上计算的已实现极差 RRV 和加权已实现极差就是本文重点研究的样本对象。此外,由于本文选取了已实现波动率 RV 作为已实现极差 RRV 的比较研究样本,对已实现波动率将采用和已实现极差同样的抽样频率,以便更好地分析两者的特征。
…………
结论
本文利用高频交易数据构造了已实现波动率 RV、已实现极差 RRV 和加权已实现极差 WRRV 三个高频金融时间序列,并对它们的统计特征和波动特征进行了实证研究,主要得到如下结论:
一、由于金融市场存在微观噪声等因素,使得直接采用高频数据计算已实现类波动序列可能会产生较大误差,因此本文首先采用唐勇(2006)等人提出的方法,确定最优的抽样频率,结果显示在构造已实现极差时,选取 5 分钟的高频金融数据可以最大限度地减弱微观噪声等影响测量准确性的因素带来的影响。
二、在针对高频数据存在的日历效应的处理上,对已实现极差 RRV 序列进行加权处理生成的加权已实现极差序列能有效地克服日历效应对高频数据带来的影响,可以消除已实现极差的“U”型变动趋势和周期性变化,可以认为加权已实现极差是比已实现极差更优秀的波动率估计量。
三、本文采用重标极差法对已实现波动率、已实现极差和加权已实现极差的长记忆性进行检验,结果显示这三个序列都呈现长记忆性,因此构建长记忆性模型---ARFIMA 模型,并构建了基于低频日间收益率序列的 GARCH(1,1)模型,并进行了波动率预测。通过 RMSE 和 MAE 指标判断预测效果,结果显示基于高频已实现类序列的 ARFIMA 模型在波动率预测能力上优于 GARCH 模型,已实现极差在波动率预测能力上优于已实现波动率,而加权已实现极差略优于已实现极差序列。
…………
参考文献(略)