徐奇渊对CPI指数讨论的回顾与评述
徐奇渊:对CPI指数讨论的回顾与评述
徐奇渊:对CPI指数讨论的回顾与评述 更新时间:2010-12-3 7:45:29 2010年11月9日,笔者发布的《统计数据和主观感受:CPI是风动还是幡动?》一文,引起了各方的广泛关注和争论。其焦点集中在该文第三部分对CPI数据编制情况还原性估计的准确性上面。本文对主要争论意见进行了回顾和评述,对原文的估计方法进行了反思。这场讨论有助于研究者理解CPI编制的原理和具体细节,也将有助于推动CPI指数编制与研究的科学化。
2010年11月9日,笔者撰写了《统计数据和主观感受:CPI是风动还是幡动?》一文,引起了各方的广泛关注,并对其内容进行了激烈的争论。焦点集中在该文第三部分对CPI数据编制情况还原性估计的准确性方面,钱军辉博士[①]、桑得博士[②]等其他多位朋友均对原文估计方法可能产生的问题进行了分析。为了把问题搞清楚,笔者与大部份争论者进行了充分的讨论,在试图理解对方批评思路的前提下,对原文的估计方法进行了反思。与此同时,笔者也对CPI编制的制度设计做了更为详实的了解,深化了在这方面的认识。现通过此文,对近期的争论做述评如下。
一、《幡动》一文分析的简要回顾
在每五年调整一次商品篮子,每年则根据城乡居民12万户消费调查资料及相关资料调整一次权数的情况下,CPI指数的编制与未公布权重的钉住一篮子货币做法非常相似:理论上,两者均按照分类对象进行加权计算,而且权数均为1。因此《幡动》一文,借鉴Frankeland Wei对货币钉住篮子的权重分析方法,对CPI的价格指数进行估算。当然,经过讨论,笔者发现因为汇率数据与CPI数据在频率、精确性等方面均在一些细节的差异,而这些差异将对分析结果产生不可忽视的影响,这在后文中将进行详细介绍。由于CPI指数权重存在5年一次“商品篮子”的调整问题,所以原文使用了2006年1月至2010年5月的数据进行分析,估计式为:
其中为第i项分类价格指数,各参数的估计值对应于CPI各分项权重。在此基础上原文提出:若编制完全按照8项分类进行加权计算,则常数项应该不能被拒绝为0;而如果常数项估计值显著,且为负值,则表明CPI存在低估的可能.
估计结果可以描述如下:所有待估计参数t值均非常显著,拟合优度、DW值等都非常理想;各项分类权重值均与2001年基期的参照系差异不大;还存在两个问题:第一是:截距项为-7.53,第二:各项权重系数之和并不1,而是108。原文仅对截距项的含义进行了解释,并认为其来源系由于“系统性低估”。当然,原文也承认:“由于CPI编制细节尚未公开,因此相关研究充其量也只是水中望月、镜里看花。要对CPI指数有更准确的理解,还有待于相关细节的公开和透明”。
原文迅速引发了各方的关注和讨论,钱军辉博士、桑得博士,以及其他多位朋友均对原文估计方法可能产生的问题提供了善意的批评。下文中,我们仍将从学术探讨的角度,对原文的估计方法进行探讨和反思。
二、估计结果的准确性依赖于固定权重的假设
有批评观点认为:“国家统计局的物价数据系经过严格蹲点调查得到的第一手数据,然后进行加权计算得到。而报告中采取回归的推导方法,试图还原历史数据,这很明显违反了统计学的基本常识”。但是,桑得博士对原文采用估计模型的可靠性进行了测试:“假设权数不变,我们利用实际公布的8大分类指数,根据2001年基期的CPI分类权重,可以计算出一个固定权数的CPI,将固定权数CPI作为被解释变量进行回归,估计出的系数和实际赋予的权重会完全一致,常数项为0。”这一点是比较容易理解的,在权重完全不变的情况下,只要样本存在变异,则所有的样本点都严格落在同一条直线上,因此估计结果可以完全准确的还原权重情况。
事实上,后文将表明,在对CPI编制方法有了完全正确理解的基础上,我们甚至使用了原文的估计式验证了CPI编制方法不存在问题。当然隐含的一个问题是,实际上8个分类权重并不是一直不变的,按国家统计局对CPI编制方法的介绍是“每年进行一次调整”的。那么,如果每年进行一次的调整是微小的,是否会对原文的估计式产生致命的影响?回答是肯定的,在下文中,我们将看到桑得博士提供了一个模拟的例子,说明了这种可能性。
三、对钱军辉博士批评的说明[③]:
钱博士的批评主要来自两个方面:“常数项c的经济学意义是当X=0时,Y的均值,这个意义经济学家常常不感兴趣。……常数项不是误差,残差才是”。“使用相同的数据,但是取基准为零,再次估计该模型。基准为零的意思是,原始数据为100,现为0,原始数据为103,现为3”。但估计结果发现:“常数项发生了显著的变化。代表可能低估程度的常数项由-7.53变为-0.11”,并由此认为原来的估计是错误的。
这两个批评都关系到检验的零假设问题。在一个理想的情况下,CPI指数编制完全按照8类权重进行加权计算,则对应的估计式应表现为:截距项为0,各项权重之和为1。桑得博士对原文估计模型的可靠性测试,已经证明了这点是可以检验的。因此,截距项为0,各项权重之和为1,这两点均应作为零假设,而不是事先给定的条件。则此时,假如常数项不为0,虽然不是统计意义上的误差,但却是CPI编制过程所无法解释的,因此常数项数值的含义还是我们感兴趣的。这是对第一个批评的回答。
对于第二个批评的说明:取基准为零,这时的估计式和原有的估计式要等价是有个前提条件的,即“分类权重之和为1”。具体分析如下面所示:
当时上述两式是等价的,即表示8个同比指数加权平均等于CPI总指数;而式表示8个同比通胀率加权平均等于总体通胀率。但是当时,上述两式就不可能同时成立。此时,用式来进行估计,其结果和式是不等价的。
因此,如果“分类权重之和为1”这个前提条件并不成立,则取基准为零的回归,与原文的回归得到不同的截距项是必然的。但是另一方面,“分类权重之和为1”仍然是有待检验的零假设,我们不能事先接受这个假设。所以,取基准进行回归的做法就不具有可行性。而原文采用CPI计算的定义式进行估计,则是有CPI编制制度作为依据的。
四、与桑得博士讨论的回顾:
如前所述,桑得博士[④]对模型的可靠性进行了测试之后发现:在权数固定不变的情况下,计量模型的检验是科学的。并由此认为:原文估计的分类权重总和偏离100%有两种可能数据本身有问题;CPI权数是变动的。然后,桑得博士使用了一个模拟测算对对估计结果可能产生的影响进行了分析。她假设2006年权重和2001年权重相同,其后每年进行微调,再利用这些不固定的权重和分类指数计算各月的CPI.
表1:假设的分类权重调整表
表1:假设的分类权重调整表
在此基础上,按照完全相同方式对53个月度数据进行估计,结果回归与原文的回归结果具有极强的相似性,即回归系数之和超过100%,并出现了显著的负值。在此我们可以发现:负值的产生,是由于用不变系数的模型去估计变系数的事实所导致;而且权数的微小调整确实将导致截距的估计出现严重的问题。而基于此得出的结论是错误的。同时,桑德博士也认为:在目前分类权数每年调整且不公布分类权数的情况下,CPI权重是不可能依据计量模型进行估测的,而我们也无法验证其完全客观真实性。
笔者对桑得博士的模拟测算结果表示认同,并认为:《幡动》一文直接根据结果做出了“人为低估”的判断不一定正确,因为无法排除模拟测算情况导致对截距项产生的影响。并且,基于桑博士对模型可靠性的测试,以及CPI编制方法的细节,我们可以根据以下三条信息进一步提出矛盾:
命题1:在权数固定不变的情况下,计量模型的检验是科学的
命题2:根据CPI编制制度:“每五年调整一次商品篮子,每年则根据城乡居民12万户消费调查资料及相关资料调整一次权数”。
命题3:CPI及其分类数据完全真实、准确。
假设命题3成立,现结合命题1对命题2进行理解,即:每年调整一次权重,因此在12个月的长度内,权数是固定不变的;因此,在12个月的长度内,计量模型的检验是科学的。不过,这里所指的12个月并不一定是从年初的1月到当年末的12月,也不排除不是按照自然年份进行调整的情况。因此,我们使用12个月长度的滚动回归,采用原估计式对53个样本数据进行测算。但结果显示:绝大部分滚动回归的结果并不理想。另外,在权重固定的情况下,根据CPI的加权计算公式,我们可以根据8个月的数据建立起一个8元1次方程组,从而解出8个分类权重系数,但结果同样非常不理想。这样,在命题1可靠的情况下,又对命题2、命题3产生了质疑。
命题3是可能的一个突破口,桑德博士认为:即使CPI编制是客观真实的,但是其公布环节却存在误差。一般同比或环比指数都只精确到小数点第1位。不过这么小的公布误差,对估计结果会产生什么样的影响?这种影响是否严重?以矩阵形式给出参数的估计式为:-1X’Y。计算表明,在12个月的小样本中,对应的行列式值非常小;因此,解释变量值的微小变化,都可能对结果产生巨大影响。例如,以2006年1月到2006年12月的数据为例,︱X’X︱=-4.96*10-41。根据参数的估计式,此时的估计结果对微小误差也将是非常敏感的。因此,由于公布误差的存在,12个月的滚动回归将面临微缺数据所导致的严重多重共线性问题:表现为R2值接近于1,但t值不显著以及权重系数不符合基本常识。同样,解8元1次方程组也面临相似的问题,而使计算结果对误差异常敏感。不过,在样本较大的情况下,这一问题并不严重;但是却存在年度权重调整所导致的变系数问题.
五、基于CPI编制流程的理解再做重新估计
按照《流通和消费价格统计调查方案》和相关说明,CPI编制流程基于下面的程序进行:对基本规格品进行采价,然后按照几何平均获取分类价格指数;对各级分类价格指数进行加权获得更大类别的分类指数;在上述基础上获得各地居民消费价格指数;全国城市指数根据各省指数按各地居民消费支出金额加权平均计算;全国指数根据全国城市和农村指数按城乡居民消费支出金额加权平均计算。
而原文使用的估计方法则是直接基于8个分类权重进行估计的,这一估计式与全国CPI指数的计算过程不符。虽然在理论上来说两者可能存在等价关系,但是采用“城乡居民消费支出金额加权平均计算”的公式进行估算更为合理,这是因为:这是统计调查方案中给出的定义式,避免了其他方式估计带来的不必要信息损失;使用8个分类权重估计的缺点,如前所述:样本期太短,有数据微缺及其所导致的多重共线性症状;使用样本期较长,则有权重调整带来的变系数问题,可能对截距项的估计产生严重影响。而另一方面,由于统计调查方案中并没有给出城乡居民消费支出权重的调整说明,因此这一权重有可能在较长时间固定不变,或者变动较小。假如实际情况如此,则将产生较为理想的估计结果,能够对真实的编制方法起到还原和验证的效果。因此,使用与原文完全相同的估计式,对2006年1月至2010年5月的数据进行无约束的回归,即全国CPI指数对城市和农村的CPI指数进行回归,其结果如表2所示。此时我们对两个零假设进行检验:常数项C不能拒绝为0,对X1+X2=1进行WALD检验,对应的F值为0.99,表明权重之和不能拒绝为1。表2中的估计结果非常理想,而且系数均符合基本常识。因此,从该表中的结果,我们无法对CPI的编制过程提出质疑,或者说,统计调查方案中的编制方法得到了验证。
为了进一步对前面钱博士的批评进行解释,这里同样对所有变量取了基准期为0的处理,然后进行回归得到表3的结果。由于此时两个权重系数之和几乎为1,因此表2和表3估计得到的截距项结果也基本相同。这进一步验证了前文的说明。
表2:全国CPI指数对城市和农村的CPI指数进行回归
变量系数标准误t统计量P值X10.7070.03122.6910.000X20.2930.0338.8840.000C-0.0100.790-0.0130.990R2值0.997DW值2.488330调整的R2值0.997F值8717.567
注:样本期为2006年1月至2010年5月的53个月度同比数据。表中数据均为四舍五入值。
表3:对和进行回归
变量系数标准误t统计量P值X1-1000.7074120.03117622.691050.0000X2-1000.2926800.0329458.8838950.0000C-0.0011720.005724-0.2047910.8386R2值0.997140DW值2.488330调整的R2值0.997026F值8717.567
注:样本期为2006年1月至2010年5月的53个月度同比数据。表中数据均为四舍五入值。其中,被解释变量为.
六、对上述讨论的总结
第一,《幡动》一文所使用的估计方法,在以下方面存在问题:在样本期较长的情况下,权重的年度调整可能导致变系数的问题,桑得博士的模拟测试表明,微小的权重调整将导致对截距项估计产生重要影响;在12个月的样本期内,虽然避免了权重的制度性调整问题,但由于在短期中解释变量变异性相当小,数据的微缺性将使估计结果表现出严重的多重共线性性,从而使估计结果对公布数据的误差异常敏感。这些原因,均对截距项的估计结果产生了不可忽视的影响,而基于此做出的推断则缺乏依据的。
第二,采用按照“城市和农村消费支出金额”加权计算的方法,对全国CPI,城市CPI和农村CPI进行回归估计,得到了非常理想的结果。该估计结果表明:常数项为0和分类权重之和为1的假设均不能被拒绝;而且,分类权重应该是相当稳定的。这一估计结果验证了全国CPI数据确系基于城市和农村CPI的准确计算得到。
第三,原文的分析起到了抛砖引玉的作用,引起了这方面的一些争论,不过有关讨论还有待进一步深化。而本次讨论的最重要意义,还在于推动统计制度的规范化、透明化,从而增强统计数据的“真实可信”性。
相关文章:
统计局发文称CPI被系统低估7%缺乏依据中证等权重90指数2日发布上证380指数特征分析参保人不满劳动能力鉴定结果打伤怀孕工作者统计局回应CPI生成继续“避重就轻”统计局网站发文详解我国CPI是如何调查和生成的巨额热钱虎视市场下跌不易如何为CPI之争划上句号水皮杂谈:莫把牛角当熊耳CPI数据与现实感受“落差”考验中国政府调控智慧