收益率与交易活动的格兰杰引导关系检验投机市场

股票收益交易量的动态关系研究:来自不同估计方法的证据
李捷瑜王美今*
中山大学岭南学院
内容摘要本文采用三种面板数据方法(加总时序、混同和组平均)考察中国股票收益和交易量的动态关系。结果表明,混同和组平均都能发现收益和交易量间双向的格兰杰因果关系,交易量对未来收益的长期影响显著为负;而普遍使用的加总时序方法则只能发现收益对交易量的单向引导。
关键词收益交易量面板数据因果关系
一引言
股票市场的交易数据往往能形成N(微观个体的数目)和T(时点的数目)都足够大的面板数据。在收益和交易量动态关系的研究中,学者们通常感兴趣的不是一两个股票呈现的特殊的变量关系,而是大部分股票普遍共有的变量关系,用计量经济学的语言说就是某外生变量对被解释变量的平均影响(Average Effect)。如何运用大N和大T的面板数据估计这种平均影响呢?不少文献采用加总(Aggregating)的方法,即直接用市场收益和市场交易量这些加总指标估计一个动态的时间序列模型,然后再进行假设检验,例如格兰杰因果关系检验1(Granger Causality Test)。在面板数据的应用文献中,混同估计(Poo
ling Estimates)和组平均估计(Averaging Group Estimates)2也是常用的方法。对于静态模型,只要个体斜率系数随机分布,那么上述三种方法都能给出“系数均值”的无偏估计(Zellner(1969))。但在动态情形,个体斜率系数的异质性(Slope Heterogeneity)会使混同及加总的估计量有偏,以至于可能造成严重的统计推断误差,只有组平均方法能给出“系数均值”的一致估计(Pesaran和Smith(1995))。本文将分别采用加总时序、混同和组平均三种方法重新估计交易量和收益的动态方程,基于不同的估计结果进行格兰杰因果关系检验并具体计算交易量和收益的长期乘数和短期冲击。
以面板数据(而不是以加总后的时序数据)作为分析的起点,容易让研究者意识到系数异质性问题并对此进行探讨。本文作两方面的尝试,一是用似然比方法和Hausman方法进行系数同质性检验。二是在系数异质性的前提下,通过分析个股交易量的长期乘数与个股流通量规模的相关性来寻交易量长期乘数的系统性差异。
二文献回顾
不少理论模型表明由于市场缺乏有效性,交易量能够提供关于收益的预测信息。Campell et
*李捷瑜、王美今:中山大学岭南学院广州  510275  :***************。本文为国家自然科学基金课
题(批准项目号:70273060)的研究成果之一。
1某些文献把格兰杰因果关系陈述为“引导关系”,例如芮萌等(2003)。“x引导y”等价于“x是y的granger原因”。2一些文献所指的“组平均估计”类似本文的“加总方法”,即先对数据进行加总平均(等权或加权)后再进行回归;而本文的“组平均”估计是指每个个体先分开估计,然后再对个体斜率系数进行平均,下文有详细说明。
al.(1993)、Wang(1994)探讨了在市场参与者信息不对称的情况下交易量与市场价格的关系,前者得出伴随着巨大交易量的价格变动将趋于反转;后者证明交易量能够预先反映出未来价格变化的趋势。最近,一类文献基于意见分歧(Divergence of Opinion) 1和卖空受限研究资产定价和交易活动,结果发现:意见分歧和卖空受限共存的市场中会产生追求价差的投机交易,即为了拥有在未来任何时刻把股票转手给乐观投资者的获利机会,人们愿意付出“投机溢价”,结果均衡价格将包含投机泡沫(Harrison 和Kreps (1978));意见分歧是交易产生的原因之一,意见分歧的扩大会引发投机泡沫的增强、换手率的提高,因此换手率与期望收益负相关,即较高的换手率将预示着未来较低的收益(Scheinkman 、Xiong(2003)、Hong et al.(2004))。
在美国股票市场价量关系的实证研究中,学者们通常发现交易量不引导收益(例如Smirlock 和Starks(1988)、 Bhagat 和Bhatia (1996)和Hiemstra 和Jones(1994))。Tse (1991)、Ciner(2001)分别研究了同样发展成熟的东京股票市场和多伦多股票市场,前者得出价量之间的相关性非常弱,后者得到滞后交易量不能预测收益的变化方向,并认为这是对“有效市场”的支持。在新兴的45钢淬火工艺
中国股票市场,学者们也没有到交易量引导收益的有力证据。王承炜、吴冲锋(2002)以及芮萌等(2003) 都发现沪深两市的交易量均不是市场收益的格兰杰原因。上述的实证文献普遍采用加总的方法来估计价量的动态关系,而多年以来,不少研究已经表明加总数据的动态性质可能与微观个体数据的动态性质非常不同(例如Granger (1990) ,Pesaran 和Smith(1995), Forni 和Lippi(1997)),基于加总数据的统计推断和政策评估可能会引起严重误导(例如Hsiao et al (2004))。
由于特有的制度和环境因素,例如卖空禁止、机构投资者缺乏、投机气氛浓厚等,新兴股票市场的有效程度往往比成熟市场低,不难想象,新兴市场的股票交易量应该更有可能包含对收益的预测信息。因此我们选择新兴的中国A 股市场作为研究对象,期望能更明显地呈现出加总方法与非加总方法估计结果的不同及其对推断检验的影响。在实证设计中,除了本文尝试用不同的估计方法外,其他学者也进行了各自独特的尝试,不同的市场、不同的样本时段、不同的时间频率,不同的度量指标,这些都大大加深了人们对价量关系的认识。
三  数据处理中国领土争端
1、样本选取
本文的数据来源于CSMAR ,研究时段从1997年7月至2004年6月,共356周;周数据的优点在于它既能排除由于频率过高而导致的非经济关系的干扰,又能保持适当时间序列数据的长度,同时还避免了
日数据可能出现的周效应。样本公司有316个,选取依据为:公司在研究期间,股票交易资料及财务资料健全;公司在1997年7月之前已经上市半年,这避免上市初期股价和换手率的特有变动影响研究结果;公司在研究期间没有经过ST 、PT 特别处理。
2、变量定义
1)周个股收益率1/1-=-it it it P P r ;其中,it P 表示股票i 在t 周周末2的考虑现金红利再投资的可比价格;因此收益率已经对分红、配股、增发等做了调整。2)周个股交易量it vl 定义为股票i 在周t
1 Miller(1977)针对相同期望假设提出意见分歧假设,他认为在不确定条件下,即使基于相同信息,投资者对证券收益也有不同的预期或信念。
2 本文的第t 周定义为第t 周的星期四到第t+1周的星期三;“t 周周末”是指在第t 周存在有效交易数据的最后一天,通常是星期三。
思春期少女的日均换手率;采用换手率衡量交易量能消除成交股数和成交金额与公司规模高度相关的问题;而且在研究交易量和市场均衡模型的关系时,换手率是最准确和自然的度量指标(Lo 和Wang (2001)),许多文献都采用这种衡量方法(参见Jain 和Joh(1988), Lo 和Wang(2001))。3)周总收益率
∑∑=it i it it i t w r w R /;其中,权重it w 为股票i 在周t 的流通市值。4)周总交易量∑=-=it M i t t vl M VL t
11;其中,t M 是周t 的股票数量。
图1  横截面均值和标准差的时序图
图1是周个股交易量it vl 和收益率it r 横截面均值(即等权加总)的时序图。在前半段样本期换
手率呈现较高的平均水平、较大的波动,并伴有较多极值点,在后半期换手率水平相应下降,波动减少。本文认为这并不说明换手率在样本期间具有随机趋势,而仅仅是由于1997年到2004年间中国股市刚好先后经历了牛市和熊市。Lo 和Wang(2001)的研究表明不同的去趋势方法对换手率的时间序列性质会产生很大且不一致的影响,因此在没有观察到明显的趋势后,我们选择不对换手率去趋势。  3、单位根检验 收益和交易量两个加总序列的平稳性用ADF 方法
检验,表1的统计量拒绝了收益R 和交易量VL 存在单
位根的原假设。
面板数据的单位根检验按其假设的不同大致分为两类。一类假设所有个体具有相同的单位根过程,如
Levin ,Lin 和 Chu (LLC),Breitung 检验;另一类则允许个体间存在不同过程,如Im ,Pesaran 和Shin  (IPS)、Fisher-ADF 以及Fisher-PP 检验。表2显示,无论基于哪种检验方法,收益和交易量的面板数据都是平稳的。
表2                      面板数据的单位根检验
表1      时间序列的单位根检验 检验方法  收益t R  交易量t VL  ADF(t 统计量)  -17.44397**  -5.453563**  注:*、**分别代表5%和1%的显著性水平,下文同。                交易量vl                                收益r
+/- 1
四  实证方法
1、模型估计及因果关系检验
本文分别估计以收益和交易量作为被解释变量的两个动态方程,方程设定是自回归分布滞后模型(ARDL )。
欧柏宁
1)加总时间序列方法(Aggregate Time Series )
以时序为例,自回归分布滞后模型的一般形式ARDL(p ,q )为:
t p j q
j j t j j t j t x y y εδλα∑∑+++===--11                              (1)  经过简单转换容易得到式(1)的误差修正形式(ARDL-ecm):
∑∑+∆+∆+++=∆-=-=----1111*
*
11p j q j t j t j j t j t t t x y x y y εδλβφα                  (2)
其中,)1(1∑--==p j j λφ,∑==q j j 1δβ,1,...,1,1*
-=∑-=+=p j p j m m j λλ,1,...,1
,1*-=∑-=+=q j q
j m m j δδ,),0(2σεiid t 服从。这种形式的优点在于能够直接得到误差修正项以及容易计算外生变量x 对因变量y 的长期乘数(Long-run Multiplier))/(φβθ-=及其标准差。综合考虑模型(2)、(3)、(4)的艾开克(AIC)信息标准和施瓦茨(SC)标准,本文对ARDL 采用4阶滞后(4==q p ),即在回归时允许信息大约有一个月的滞后。1
将面板数据在横截面方向上加总平均后2,本文采用已有文献的通常做法,对时间序列模型(2)进行最小二乘(OLS )估计。基于时序估计量(简称TS ),格兰杰因果关系检验的零假设为)(0y x H →/:
3,2,1,00*===j TS j
TS δβ并且;即x 不能引导y 。  为了使宏观模型与微观个体的动态性质保持一致,基于加总数据的分析一般都假设“代表性代理人”(Representative Agent)存在。如果放弃这一假设,引入微观个体的异质性,加总方法会出现局限性:从信息损失的角度看,加总不能保持原有数据的完整信息集,某部分的预测能力可能丢失(Granger (1990));更重要的是,当个体斜率系数不相等时,经OLS 回归得到
的加总时序系数估计值会产生偏差(Bias),即使面板数据的N 和T 都趋于无穷,这种偏差都不会消失(Pesaran 和Smith(1995))。因此,给定估计好的加总时序模型,我们不能用它的动态形状或其他特征来揭示相关微观个体的平均行为;同样地,加总模型的参数估计量不能满足微观理论所导出的某些约束,也不是拒绝该微观理论的好理由。十七届二中全会
2)混同方法(Pooling )
相应的自回归分布滞后模型的误差修正形式(ARDL-ecm)设定为:
∑∑+∆+∆++++=∆-=-=----111
1*
*
11p j q j it j it j j it j it it t i it x y x y y εδλβφγα              (3)
1 为了充分捕捉滞后变量包含的信息,本文选取各模型最优滞后阶数中较长的滞后阶数。概括而言,加总时序的最优滞后阶数是2,混同模型的最优滞后阶数为4,组平均中各个个体的最优滞后阶数主要是2、3或4。
2 详见上文数据处理中谈及的“总收益率和总换手率的计算”。
其中,),...,1(N i =代表股票,),...,1(T t =代表时间,i α是个体效应,t γ是时间效应,),0(2i it iid σε服从,容易看出,这里的“混同”是指设定所有个体的斜率系数相等。与时序模型(2)相比,混同模型
(3)不必先把数据加总,更多可用的观察值使得该模型具有许多优点,譬如获得更大的自由度和更高的估计效率,得以建立、检验更复杂的动态模型;横截面方向的数据能减轻时序模型容易出现的多重共线问题;个体效应允许不可观察的个体差异而时间效应则捕捉了横截面上受到的共同冲击。至今这种允许截距差异的混同模型应用最广泛。
对模型(3)本文采用固定效应估计量(Fixed Effect Estimator ,简称FE ),过程如下:首先利用均值差分消除个体效应和时间效应,再用OLS 估计斜率系数,标准差经white-异方差调整。1
于固定效应估计量,格兰杰因果关系检验为)(0y x H →/:3,2,1,00*===j FE j FE δβ并且。  如果个体斜率系数相等,那么只要T 足够大,由于解释变量与扰动项相关而产生的偏差将消失,固定效应估计量能给出系数的一致估计,不必采用Arellano 和Bond (1991)等GMM 估计量。但是个体斜率系数不相等时,无论样本的N 、T 多大,模型(3)的混同设定都会导致解释变量与扰动项相关以及扰动项自相
关,而且工具变量方法不能解决这一问题(Pesaran 和Smith(1995))。可见,模型(3)虽然对个体的异质性进行了部分建模,即允许截距的差异,但它忽略了个体斜率系数的异质性,FE 仍可能有偏。复兴大学
3)组平均方法(Averaging Group )
现实中许多因素的差异,例如某公司特征的不同,都可能使股票的动态方程拥有不同的斜率系数,时序模型和混同模型的设定似乎过于严格;在模型(3)的基础上本文进一步设定每个个体都拥有各自的斜率系数2
,得到的ARDL-ecm 如下:  ∑∑-=-=----+∆+∆++++=∆1111**11p j q j it j it ij j it ij it i it i t i it x y x y y εδλβφγα                (4)
为了估计模型(4),本文先用均值差分消除时间效应t γ,然后再用组平均方法估计其余的系数;
令),...,,,...,,,,(**1**
1'=iq i ip i i i i i δδλλβφαψ表示采用个体i 的时序观察值(
T t ,...,1=)和OLS 方法估计出的系数,那么组均值估计量就是∑==N i i N 11
ˆˆψψ,其非参数协方差矩阵为)1()ˆˆ)(ˆˆ()ˆ(1-∑'--==N N V N i i i ψψψψ
ψ。
这样看来,组平均方法就是在分别估计个体变量间的动态关系后再计算这些个体系数的均值;由此而得的估计量我们称为组均值估计量(Group Mean ,简称GM )。此时,基于组均值估计量,因果关
系检验的零假设为)(0y x H →/:3,2,1,00*===j GM j
GM δβ并且。  与加总、混同估计量相比,组均值估计量充分考虑了个体系数的异质性,减少了信息的丢失;而且在大N 和大T 的面板数据中,无论系数是否异质,它都是系数均值的一致估计,并服从渐进正态分布(Pesaran 和Smith(1995)),这意味着基于GM 可以建立正确的统计推断。
2、系数同质性检验
在动态模型的设定上,或者估计方法(加总、混同或组平均)的取舍上,斜率系数同质性检验(Homogeneous Coefficient Test )都至关重要。本文采用两种检验方法:
1 当然本文也可以设定截距是随机的,通过GLS 得到随机效应估计量。其实当N 和T 都足够大时,固定效应估计量和随机效应估计量是等价的,因此不妨采用固定效应估计量。
2 这里的斜率系数可以是固定,也可以是随机。PS 文中的主要结论,特别是混同估计量的不一致,将在斜率系数是异质而且是固定的情况下仍然成立。

本文发布于:2024-09-23 08:27:09,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/155980.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:交易量   个体   收益   系数   模型   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议