⑴ 怎么用matlab的循环语句来批量计算股票每年的峰度和偏度
怎么用matlab的循环语句来批量计算股票每年的峰度和偏度
shuju=[ ]; % 读入数据
jun_ = mean(shuju) % 求均值
biao_zhun_cha=std(shuju) % 标准差版
pian_=skewness(shuju) % 偏度:>0 称为右偏态,权<0,称为左偏态
feng_=kurtosis(shuju) % 峰度:用作衡量偏离正态分布的尺度之一
⑵ 证明密度函数关于期望对称时,偏度为0
⑶ 如何用GARCH(1,1)求股票的具体波动率数据
以哈飞股份(600038)为例,运用GARCH(1,1)模型计算股票市场价值的波动率。
GARCH(1,1)模型为:
(1)
(2)
其中, 为回报系数, 为滞后系数, 和 均大于或等于0。
(1)式给出的均值方程是一个带有误差项的外生变量的函数。由于是以前面信息为基础的一期向前预测方差,所以称为条件均值方程。
(2)式给出的方程中: 为常数项, (ARCH项)为用均值方程的残差平方的滞后项, (GARCH项)为上一期的预测方差。此方程又称条件方差方程,说明时间序列条件方差的变化特征。
通过以下六步进行求解:
本文选取哈飞股份2009年全年的股票日收盘价,采用Eviews 6.0的GARCH工具预测股票收益率波动率。具体计算过程如下:
第一步:计算日对数收益率并对样本的日收益率进行基本统计分析,结果如图1和图2。
日收益率采用JP摩根集团的对数收益率概念,计算如下:
其中Si,Si-1分别为第i日和第i-1日股票收盘价。
图1 日收益率的JB统计图
对图1日收益率的JB统计图进行分析可知:
(1)标准正态分布的K值为3,而该股票的收益率曲线表现出微量峰度(Kurtosis=3.748926>3),分布的凸起程度大于正态分布,说明存在着较为明显的“尖峰厚尾”形态;
(2)偏度值与0有一定的差别,序列分布有长的左拖尾,拒绝均值为零的原假设,不属于正态分布的特征;
(3)该股票的收益率的JB统计量大于5%的显著性水平上的临界值5.99,所以可以拒绝其收益分布正态的假设,并初步认定其收益分布呈现“厚尾”特征。
以上分析证明,该股票收益率呈现出非正态的“尖峰厚尾”分布特征,因此利用GARCH模型来对波动率进行拟合具有合理性。
第二步:检验收益序列平稳性
在进行时间序列分析之前,必须先确定其平稳性。从图2日收益序列的路径图来看,有比较明显的大的波动,可以大致判断该序列是一个非平稳时间序列。这还需要严格的统计检验方法来验证,目前流行也是最为普遍应用的检验方法是单位根检验,鉴于ADF有更好的性能,故本文采用ADF方法检验序列的平稳性。
从表1可以看出,检验t统计量的绝对值均大于1%、5%和10%标准下的临界值的绝对值,因此,序列在1%的显著水平下拒绝原假设,不存在单位根,是平稳序列,所以利用GARCH(1,1)模型进行检验是有效的。
图2 日收益序列图
表1ADF单位根检验结果
第三步:检验收益序列相关性
收益序列的自相关函数ACF和偏自相关函数PACF以及Ljung-Box-Pierce Q检验的结果如表3(滞后阶数 =15)。从表4.3可以看出,在大部分时滞上,日收益率序列的自相关函数和偏自相关函数值都很小,均小于0.1,表明收益率序列并不具有自相关性,因此,不需要引入自相关性的描述部分。Ljung-Box-Pierce Q检验的结果也说明日收益率序列不存在明显的序列相关性。
表2自相关检验结果
第四步:建立波动性模型
由于哈飞股份收益率序列为平稳序列,且不存在自相关,根据以上结论,建立如下日收益率方程:
(3)
(4)
第五步:对收益率残差进行ARCH检验
平稳序列的条件方差可能是常数值,此时就不必建立GARCH模型。故在建模前应对收益率的残差序列εt进行ARCH检验,考察其是否存在条件异方差,收益序列残差ARCH检验结果如表3。可以发现,在滞后10阶时,ARCH检验的伴随概率小于显著性水平0.05,拒绝原假设,残差序列存在条件异方差。在条件异方差的理论中,滞后项太多的情况下,适宜采用GARCH(1,1)模型替代ARCH模型,这也说明了使用GARCH(1,1)模型的合理性。
表3日收益率残差ARCH检验结果
第六步:估计GARCH模型参数,并检验
建立GARCH(1,1)模型,并得到参数估计和检验结果如表4。其中,RESID(-1)^2表示GARCH模型中的参数α,GARCH(-1)表示GARCH模型中的参数β,根据约束条件α+β<1,有RESID(-1)^2+GARCH(-1)=0.95083<1,满足约束条件。同时模型中的AIC和SC值比较小,可以认为该模型较好地拟合了数据。
表4日收益率波动率的GARCH(1,1)模型的参数估计
⑷ 金融数据的尖峰厚尾特征是什么意思
金融数据的尖峰厚尾特征是相比较标准正态分布来说的,标准正态分布的偏度为0,峰度为3,通常做实证分析时,会假设金融数据为正态分布,这样方便建模分析。
但是实证表明,很多数据并不符合正态分布,而更像尖峰厚尾,就是峰度比3大,两边的尾巴比正态分布厚,没有下降得这么快。
厚尾分布主要是出现在金融数据中,例如证券的收益率。 从图形上说,较正态分布图的尾部要厚,峰处要尖。
直观些说,就是这些数据出现极端值的概率要比正态分布数据出现极端值的概率大。因此,不能简单的用正态分布去拟合这些数据的分布,从而做一些统计推断。一般来说,通过实证分析发现,自由度为5或6的t分布拟合的较好。
(4)股票偏度低扩展阅读:
基金收益率不服从正态分布,存在显著的尖峰厚尾特性,我国基金市场还不是有效市场。人民币汇率收益率波动有集群性效应,不符合正态分布,有尖峰厚尾的特点。结果表明稳定分布能更好的拟和中国股票收益率的实际分布,稳定分布较好的处理中国股票市场中的“尖峰尾”现象。
但很多资本市场上的现象无法用EMH解释,如证券收益的尖峰厚尾,证券市场的突然崩溃,股价序列的长期记忆性等。对期货价格数据进行统计分析,发现期货价格具有“尖峰厚尾”特性。实证结果表明:我国股价波动具有尖峰厚尾特征、异方差性特征和波动的持续性和非对称特征。
而股票市场的收益率从分布的角度看,并不服从标准的正态分布,而是呈现出一种“尖峰、厚尾”的特征。
⑸ 正偏态与负偏态在正偏态分布中,为什么平均数大于中位数大于众数
无论是在正偏态还是负偏态中,众数都是在最边上的,因为它表示极值。
正偏态中,因为低分多,总体来说大部分人是低于平均数的,所以平均数>中位数。而由于这里的众数纯粹由低分构成,不像平均数和中位数还有高分低分融合着算,所以是最小的,所以是平>中>众。
负偏态相反。
分布曲线左右不对称的数据次数分布,是连续随机变量概率分布的一种。可以通过峰度和偏度的计算,衡量偏态的程度。可分为正偏态和负偏态,前者曲线右侧偏长,左侧偏短;后者曲线左侧偏长,右侧偏短。
(5)股票偏度低扩展阅读:
当均值大于众数时称为正偏态;当均值小于众数时称为负偏态。在组距分组情况下,众数的计算要考虑最大频数所在组相邻组的分布。
偏度系数反映数据分布偏移中心位置的程度,记为SK,则有
SK= (均值一中位数)/标准差。
在正态分布条件下,由于均值等于中位数,所以偏度系数等于0。当偏度系数大于0时,则为正偏态;当偏度系数小于0时,则为负偏态。
负偏态分布的特征是曲线的最高点偏向X轴的右边,位于右半部分的曲线比正态分布的曲线更陡,而左半部分的曲线比较平缓,并且其尾线比起右半部分的曲线更长,无限延伸直到接近X轴。
⑹ 双色球AC值,散度。偏度是什么意思
AC值就是两组号码的差值。其实这三个解释起来较多,你可以在网上查一下,你也更加方便
⑺ 如何计算excel数据中的偏度和峰度系数
使用峰函数:KURT 和偏度SKEW直接计算。
⑻ 双色球AC值,散度。偏度是什么意思谢谢了,大神帮忙啊
双色球号码散度和号码偏度以及ac值如何计算方法 一.号码散度:单注所有号码与当前号码之差(以结果的绝对值为准)的最小值中的最大的一个。 例如: 双色球2004100期的红球开奖结果为:06 08 09 14 24 33,其号码散度计算如下: 06与08 09 14 24 33的号码差值分别为2、3、8、18、27,其最小值为2; 08与06 09 14 24 33的号码差值分别为2、1、6、16、25,其最小值为1; 09与06 08 14 24 33的号码差值分别为3、1、5、15、24,其最小值为1; 14与06 08 09 24 33的号码差值分别为8、6、5、10、19,其最小值为5; 24与06 08 09 14 33的号码差值分别为18、16、15、10、9,其最小值为9; 33与06 08 09 14 24的号码差值分别为27、25、24、19、9,其最小值为9。 则有06 08 09 14 24 33的号码散度为2、1、1、5、9、9中的最大值9。 二.号码偏度:单注所有号码与上期开奖号码之差(以结果的绝对值为准)的最小值中的最大的一个。 例如: 2004099期的红球开奖结果为:05 10 21 22 26 33,则06 08 09 14 24 33的号码偏度为4,计算如下: 06与05 10 21 22 26 33的号码差值分别为1、4、15、16、20、27,其最小值为1; 08与05 10 21 22 26 33的号码差值分别为3、2、13、14、18、25,其最小值为2; 09与05 10 21 22 26 33的号码差值分别为4、1、12、13、17、24,其最小值为1; 14与05 10 21 22 26 33的号码差值分别为9、4、7、8、12、19,其最小值为4; 24与05 10 21 22 26 33的号码差值分别为19、14、3、2、2、9,其最小值为2; 33与05 10 21 22 26 33的号码差值分别为28、23、12、11、7、0,其最小值为0; 则有06 08 09 14 24 33的号码偏度为1、2、1、4、2、0中的最大值4。 三.AC值:AC值实际上也称作"算术复杂值",它是引自国外乐透型彩票分析研究的一个概念,是评估乐透型彩票号码价值的一个重要的参数。在 R/S(乐透型)彩票中,是指任何一组号码中所有两个号码数字的正数差值的总数减去(R-1)的值,其中R 为投注号码数。AC值最小值为0,最大值:当7个基本号数时为15,6个基本号数时为10,5个基本号数时为6。复杂值越大,表明号码算术级数越复杂,规律性越差,随机性越强。含算术级数过多的号码,其复杂值较低,则随机性越差,中奖机会也更低。全部由算术级数构成的号码,复杂值可以为0。例如:对双色球来说,某期号码为:04 09 10 21 22 24,则这6个号码数字之间的正差值分别是: 5 6 17 18 20 ; 1 12 13 15 ; 11 12 14 ; 1 3 ; 2 , 以上共有13个不同的差值,即1、2、3、5、6、11、12、13、14、15、17、18、20,由于R=6,则AC值=13-(6-1)=8 四.附:CNB的“这是历史的巧合吗?谈谈AC值,号码散度,号码偏度,最小邻号间距;8码中6红“ 谈AC值,号码散度,号码偏度之间进行相加出胆和找同尾码以及最小邻号间距;8码中6红: 2007049:04 14 18 19 31 33 + 02AC值=8;号码散度=10;号码偏度=5;最小邻号间距=1 2007050:01 05 08 13 18 25 + 02 (1.偏度05 AC08 散度10=05 08; 2.号码偏度=5容易出同尾码05 15 25=05 25; 3.AC值+号码散度=08+10=18; 4.AC值+号码偏度=08+05=13; 5.最小邻号间距=1;整理12345条件:05 8 10 15 25 18 13 01 8码中6红)
⑼ 什么是峰度和偏度
表征概率密度分布曲线在平均值处峰值高低的特征数。峰度反映了峰部的尖度。样本的峰度是和正态分布相比较而言统计量,如果峰度大于三,峰的形状比较尖,比正态分布峰要陡峭,反之亦然。
在统计学中,峰度(Kurtosis)衡量实数随机变量概率分布的峰态。峰度高就意味着方差增大是由低频度的大于或小于平均值的极端差值引起的。
偏度是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
公式中,Sₖ——偏度;μ₃——3阶中心矩;σ——标准差。
在实际应用中,通常将峰度值做减3处理,使得正态分布的峰度0。因此,在使用统计软件进行计算时,应注意该软件默认的峰度值计算公式。如Eviews默认的正态分布峰度为3。
⑽ 正态分布,泊松分布,伽玛分布,对数正态分布偏度由高到低分别是
依照偏度由高到低分别是对数正态分布、伽玛分布、泊松分布、正态分布。
偏度是利用3阶矩定义的,偏度的计算公式为:
其中,Sk为偏度;μ3为3阶中心矩;σ为标准差。
在一般情形下,当统计数据为右偏分布时,Sk>0,且Sk值越大,右偏程度越高;当统计数据为左偏分布时,Sk<0,且Sk值越小,左偏程度越高。当统计数据为对称分布时,显然有Sk=0。
(10)股票偏度低扩展阅读
对数正态分布具有如下性质:
(1)正态分布经指数变换后即为对数正态分布;对数正态分布经对数变换后即为正态分布。
(2)γ,t是正实数,X是参数为(μ,σ)的对数正态分布,则Y=γXᵗ仍是对数正态分布,参数为(tμ+ln(γ),tσ)。
(3)对数正态总是右偏的。
(4)对数正态分布的均值和方差是其参数(μ,σ)的增函数。
(5)对给定的参数μ,当σ趋于零时,对数正态分布的均值趋于exp(μ),方差趋于零。