百度云人脸识别怎么刷脸考勤机借书 百度云刷脸考勤机借书操作步骤

当前位置: >>
EVIEWS用面板数据模型预测
第 8 讲 用面板数据模型预测1.面板数据定义 . 时间序列数据或截面数据都是一维数据。 时间序列数据是变量按时间得到的数据; 截面 数据是变量在固定时点的一组数据。 面板数据是同时在时间和截面上取得的二维数据。 面板 数据也可以定义为相同截面上的个体在不同时点的重复观测数据或者称为纵向变量序列 (个 体)的多次测量。所以,面板数据(panel data)也称时间序列
截面数据(time series and cross section data)或混合数据(pool data) 。 面板数据示意图见图 1。 面板数据从横截面 (cross section) 是由若干个体 看, (entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是 一个时间序列。图1N=15,T=50 的面板数据示意图图 2 是
年中国各省级地区消费性支出占可支配收入比率序列图。图2 年中国各省级地区消费性支出占可支配收入比率序列图(价格平减过)136 面板数据用双下标变量表示。例如 yi t, i = 1, 2, …, N; t = 1, 2, …, T i 对应面板数据中不同个体。N 表示面板数据中含有 N 个个体。t 对应面板数据中不同时点。 T 表示时间序列的最大长度。 若固定 t 不变, i ., ( i = 1, 2, …, N)是横截面上的 N 个随机变量; y 若固定 i 不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体) 。 这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。 利用面板数据建立模型的好处是: (1)由于观测值的增多,可以增加估计量的抽样精 度。 (2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。 (3)面板数据 建模比单截面数据建模可以获得更多的动态信息。 例如
年 30 个省份的农业总产值数据。固定在某一年份上,它是由 30 个农业 总产值数字组成的截面数据;固定在某一省份上,它是由 11 年农业总产值数据组成的一个 时间序列。面板数据由 30 个个体组成。共有 330 个观测值。 对于面板数据 yi t, i = 1, 2, …, N; t = 1, 2, …, T,如果每个个体在相同的时期内都有观测 值记录,则称此面板数据为平衡面板数据(balanced panel data) 。若面板数据中的个体在相 同时期内缺失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data) 。 案例 1: 年中国东北、华北、华东 15 个省级地区的居民家庭固定价格的人均 消费(CP)和人均收入(IP)关系研究(file:5panel02)
年中国东北、 华北、 华东 15 个省级地区的居民家庭固定价格的人均消费 (CP) 和人均收入(IP)数据见 file:panel02。数据是 7 年的,每一年都有 15 个数据,共 105 组观 测值。 人均消费和收入两个面板数据都是平衡面板数据,各有 15 个个体。人均消费面板数据 按个体连线见图 3,按截面连线见图 4。人均收入面板数据按个体连线见图 5,按截面连线 见图 6。 00 2000 山西 内蒙古 河北
江苏 0安徽 北京 福建 河北 黑龙江 吉林 江苏 江西 辽宁 内蒙古 山东 上海 山西 天津 浙江图315 个省级地区的人均消费序列(个体) (file:5panel02)安徽 1996137 98 01 2002 安徽 河北 00 2000 江苏 内蒙古 山西图47 个人均消费横截面数据(含 15 个地区) (每条连线表示同一年度 15 个地区的消费值)19961998
浙江 山西 山东 辽宁 江苏 2000 0 安徽 00 2002 黑龙江 福建安徽 北京 福建 河北 黑龙江 吉林 江苏 江西 辽宁 内蒙古 山东 上海 山西 天津 浙江图515 个省级地区的人均收入序列(个体) (file:5panel02)
00 0 安徽 河北 江苏 97 00
内蒙古山西图67 个人均收入横截面数据(含 15 个地区)(每条连线表示同一年度 15 个地区的收入值)用 CP 表示消费, 表示收入。 BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, IP AH,13819961999 ZJ 分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽 宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。 00 00
000 16000 CPAH CPBJ CP FJ CPHB CPHLJ C P JL C P JS C P JX CPLN CPNMG CPSD CPSH CPSX C P TJ CP ZJIP (1 9 9 6 -2 0 0 2 )图7人均消费对收入的面板数据散点图(15 个时间序列叠加)12000 CP1996 CP1997 CP1998 CP1999 CP2000 CP2001 CP200210000800060004000 IP() 00 000 图8人均消费对收入的面板数据散点图(7 个截面叠加)15 个地区 7 年人均消费对收入的面板数据散点图见图 7 和图 8。 7 中每一种符号代表 图 一个省级地区的 7 个观测点组成的时间序列。相当于观察 15 个时间序列。图 8 中每一种符 号代表一个年度的截面散点图(共 7 个截面) 。相当于观察 7 个截面散点图的叠加。 为了观察得更清楚,图 9 给出北京和内蒙古
年消费对收入散点图。从图中可 以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古 2002 年的收入与 消费规模还不如北京市 1996 年的大。图 10 给出该 15 个省级地区 1996 和 2002 年的消费对 收入散点图。6 年之后 15 个地区的消费和收入都有了相应的提高。139 图9北京和内蒙古
年消费对收入散点图图 10 1996 和 2002 年 15 个地区的消费对收入散点图2.面板数据模型分类 . 用面板数据建立的模型通常有 3 种, 即混合回归模型、 固定效应回归模型和随机效应回 归模型。 2.1 混合回归模型(Pooled model) 。 如果一个面板数据模型定义为, yit = α + Xit 'β +εit, i = 1, 2, …, N; t = 1, 2, …, T (1) 其中 yit 为被回归变量(标量) α表示截距项,Xit 为 k ×1 阶回归变量列向量(包括 k 个回归 , 量) β为 k ×1 阶回归系数列向量,εit 为误差项(标量) , 。则称此模型为混合回归模型。混合 回归模型的特点是无论对任何个体和截面,回归系数α和β都相同。 如果模型是正确设定的,解释变量与误差项不相关,即 Cov(Xit,εit) = 0。那么无论是 N→∞,还是 T→∞,模型参数的混合最小二乘估计量(Pooled OLS)都是一致估计量。 2.2 固定效应回归模型(fixed effects regression model) 。 固定效应模型分为 3 种类型, 即个体固定效应回归模型、 时点固定效应回归模型和个体 时点双固定效应回归模型。下面分别介绍。 2.2.1 个体固定效应回归模型(entity fixed effects regression model) 如果一个面板数据模型定义为, yit = αi + Xit 'β +εit, i = 1, 2, …, N; t = 1, 2, …, T (3) 其中αi 是随机变量,表示对于 i 个个体有 i 个不同的截距项,且其变化与 Xit 有关系;Xit 为 k ×1 阶回归变量列向量(包括 k 个回归量) β为 k ×1 阶回归系数列向量,对于不同个体回归 , , ,则称此模型为个体固定效应回归 系数相同,yit 为被回归变量(标量) εit 为误差项(标量) 模型。 个体固定效应模型(3)的强假定条件是, E(εit?αi, Xit) = 0, i = 1, 2, …, Nαi 作为随机变量描述不同个体建立的模型间的差异。因为αi 是不可观测的, 且与可观测的解释变量 Xit 的变化相联系,所以称(3)式为个体固定效应回归模型。 个体固定效应回归模型也可以表示为 yit = α1 D1 + α2 D2 + … +αN DN + Xit 'β +εit, 其中 Di = ? t = 1, 2, …, T (4)?1, 如果属于第i个个体,i = 1, 2, ..., N , 其他, ?0,注意: (1)在 EViews5.0 输出结果中αi 是以一个不变的常数部分和随个体变化的部分相加而 成。 在 EViews 5.0 以上版本个体固定效应对话框中的回归因子选项中填不填 c 输出结果 (2) 都会有固定常数项。 个体固定效应回归模型的估计方法有多种,首先设法除去αi 的影响,从而保证β估计量 的一致性。 (详见第 3 节,面板数据模型估计方法。 ) 下面解释设定个体固定效应回归模型的原因。假定有面板数据模型 yit = β0 + β1 xit +β2 zi +εit, i = 1, 2, …, N; t = 1, 2, …, T (5) 其中β0 为常数,不随时间、截面变化;zi 表示随个体变化,但不随时间变化的难以观测的变140 量。 以案例 1 为例,省家庭平均人口数就是这样的一个变量。对于短期面板来说,这是一个 基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。 上述模型可以被解释为含有 N 个截距,即每个个体都对应一个不同截距的模型。令αi = β0 +β2 zi,于是(5)式变为 (6) yit = αi + β1 xit +εit, i = 1, 2, …, N; t = 1, 2, …, T 这正是个体固定效应回归模型形式。对于每个个体回归函数的斜率相同(都是β1) ,截距αi 却因个体不同而变化。可见个体固定效应回归模型中的截距项αi 中包括了那些随个体变化, 但不随时间变化的难以观测的变量的影响。 i 是一个随机变量。 α 因为 zi 是不随时间变化的量, 所以当对个体固定效应回归模型中的变量进行差分时, 可以剔除那些随个体变化, 但不随时 间变化的难以观测变量的影响,即剔出αi 的影响。 以案例 1(file:5panel02)为例得到的个体固定效应模型估计结果如下: 输出结果的方程形式是? ? y1t = γ? 安徽+ β1 x1t = (515.6 - 36.3) + 0.70 x1t (55.0) ? ? y 2t = γ? 北京+ β1 x2t = (515.6 + 537.6) + 0.70 x2t 。。 。 (55.0) ? ? y15t = γ? 浙江+ β1 x15t = (515.6 + 198.6) + 0.70 x15t (55.0) 2 R = 0.99, SSEr = 2270386, t0.05 (88) = 1.98从结果看,北京、上海、浙江是自发消费(消费函数截距)最大的 3 个地区。图 11EViwes5.1 个体固定效应回归模型的估计结果141 2.2.2 时点固定效应回归模型(time fixed effects regression model) 如果一个面板数据模型定义为, yit = γt + Xit 'β +εit, i = 1, 2, …, N (7)其中γt 是模型截距项,随机变量,表示对于 T 个截面有 T 个不同的截距项,且其变化与 Xit 有关系;yit 为被回归变量(标量) εit 为误差项(标量) , ,满足通常假定条件。Xit 为 k ×1 阶 回归变量列向量(包括 k 个回归变量) β为 k ×1 阶回归系数列向量,则称此模型为时点固 , 定效应回归模型。 时点固定效应回归模型也可以加入虚拟变量表示为 yit =γ0 + γ1 W1 + γ2 W2 + … +γ T WT + Xit 'β +εit, 其中 Wt = ? i = 1, 2, …, N; t = 1, 2, …, T (8)?1, 如果属于第t个截面,t = 1, 2, ..., T ; ? 0, 其他(不属于第t个截面)。(9)设定时点固定效应回归模型的原因。假定有面板数据模型 yit = γ0 + β1 xit +γ2 zt +εit, i = 1, 2, …, N; t = 1, 2, …, T其中β0 为常数,不随时间、截面变化;zt 表示随不同截面(时点)变化,但不随个体变化的 难以观测的变量。 以案例 1 为例, “全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个 变化的量,但是对于不同省份(个体) ,这是一个不变化的量。 上述模型可以被解释为含有 T 个截距, 即每个截面都对应一个不同截距的模型。 γt = γ0 令 +γ2 zt,于是(9)式变为 yit = γt + β1 xit +εit, i = 1, 2, …, N; t = 1, 2, …, T (10) , 这正是时点固定效应回归模型形式。对于每个截面,回归函数的斜率相同(都是β1) γt 却因截面(时点)不同而异。可见时点固定效应回归模型中的截距项γt 包括了那些随不同 截面(时点)变化,但不随个体变化的难以观测的变量的影响。γt 是一个随机变量。142 以例 1 为例得到的时点固定效应模型估计结果见图 11,代数式如下:? ? ? ? y i1 = γ 0 + γ 1996 + β1 xi1 = (2.6 + 105.9) + 0.7789 xi1 , t = ) (74.6) ? ? ? ? y i 2 = γ 0 + γ 1997 + β1 xi2 = (2.6 + 134.1) + 0.7789 xi2 , t = ) (74.6) … ? ? ? ? y i 7 = γ 0 + γ 2002 + β1 xi7 = (2.6 - 93.9) + 0.7789 xi7 , (0.04) (74.6) 2 R = 0.9867, SSEr = 4028843, t0.05 (97) = 1.98t = 20022.2.3 个体时点固定效应回归模型(time and entity fixed effects regression model) 如果一个面板数据模型定义为, yit = α0 +αi +γt + Xit 'β +εit, i = 1, 2, …, N; t = 1, 2, …, T (11)其中 yit 为被回归变量(标量) αi 是随机变量,表示对于 N 个个体有 N 个不同的截距项,且 ; 其变化与 Xit 有关系;γt 是随机变量,表示对于 T 个截面(时点)有 T 个不同的截距项,且 ; 其变化与 Xit 有关系;Xit 为 k ×1 阶回归变量列向量(包括 k 个回归量) β为 k ×1 阶回归系数 列向量;εit 为误差项(标量)满足通常假定(εit ?Xit, αi, γt) = 0;则称此模型为个体时点固定效 应回归模型。 个体时点固定效应回归模型还可以表示为, yit = α0 +α1 D1+α2 D2 +…+αN DN + γ1W1+ γ2W2 +…+γ TWT + Xit 'β +εit, (12) 其中 Di = ??1, 如果属于第i个个体,i = 1,2, ..., N , ?0, 其他, ?1, 如果属于第t个截面,t = 1,2,..., T ; ?0, 其他(不属于第t个截面)。(13)Wt = ?(14)如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(12)进行混合 OLS 估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、 甚至有效的估计量一样, 一些计算方法也可以使个体时点双固定效应回归模型得到更有效的 参数估计量。 以例 1 为例得到的截面、时点固定效应模型估计结果如下:143 图 12EViwes 5.1 截面、时点双固定效应模型估计结果注意: 对于第 1 个截面(t=1)EViwes 输出结果中把(α +αi +γ1), (i = 1, 2, …, N)合在一起。 第 2, …, T 个截面以此类推。 输出结果如下:? ? ? ? ? y1,1996 = γ 0 + α 1+ γ 1996 + β1 x1,1996 = 681.9 - 68.6 - 75.3 + 0.67 x1,1996 (安徽省) ? ? ? ? ? y 2,1996 = γ 0 + α 2+ γ 1996 + β1 x2,1996 = 681.9 + 617.2 - 75.3 + 0.67x2,1996(北京市)…? ? ? ? ? y1,1997 = γ 0 + α 1+ γ 1997 + β1 x1,1997 = 681.9 - 68.6 +23.6 + 0.67 x1,1997 (安徽省) ? ? ? ? ? y 2,1997 = γ 0 + α 2+ γ 1997 + β1 x2,1997 = 681.9 + 617.2 + 0.67x2,1997, (北京市)…? ? y15,2002= γ? 0 + α 15 + γ? 2002+ β1 x15, +870.42+23.6 + 0.67x15,2002(浙江省) ?R2 = 0.9932, SSEr = 2045670, t0.05 (83) = 1.98144 回归系数为 0.67,这与个体固定效应回归模型给出的估计结果 0.70 基本一致。 在上述三种固定效应回归模型中,个体固定效应回归模型最为常用。 2.3 随机效应模型 对于面板数据模型 (15) yit = αi + Xit'β +εit, i = 1, 2, …, N; t = 1, 2, …, T 如果αi 为随机变量,其分布与 Xit 无关; Xit 为 k ×1 阶回归变量列向量(包括 k 个回归量) , β为 k ×1 阶回归系数列向量,对于不同个体回归系数相同,yit 为被回归变量(标量) εit 为 , 误差项(标量) ,这种模型称为个体随机效应回归模型(随机截距模型、随机分量模型) 。其 假定条件是 αi? iid(α, σα2) εit ? iid(0, σε2) 都被假定为独立同分布,但并未限定何种分布。 同理也可定义时点随机效应回归模型和个体时点随机效应回归模型, 但个体随机效应回 归模型最为常用。 这里所说的个体随机效应回归模型其实是有别于真正的随机效应回归模型。 对于个体随机效应模型,E(αi ?Xit) = α,则有,E(yit ?xit) = α + Xit'β,对 yit 可以识别。所 以随机效应模型参数的混合 OLS 估计量具有一致性,但不具有有效性。 注意:术语“随机效应模型”和“固定效应模型”用得并不十分恰当,容易产生误解。 其实固定效应模型应该称之为“相关效应模型” ,而随机效应模型应该称之为“非相关效应 模型” 。因为固定效应模型和随机效应模型中的αi 都是随机变量。 例 1 的个体随机效应模型估计结果如下:图 13个体随机效应模型估计结果145 3.面板数据模型估计方法 . 面板数据模型中β的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性 质随设定固定效应模型是否正确而变化。回归变量 xit 可以是时变的,也可以是非时变的。 3.1 混合最小二乘(Pooled OLS)估计 混合 OLS 估计方法是在时间上和截面上把 NT 个观测值混合在一起,然后用 OLS 法估 计模型参数。给定混合模型 yit = α + Xit 'β +εit, i = 1, 2, …, N; t = 1, 2, …, T (19) 如果模型是正确设定的,且解释变量与误差项不相关,即 Cov(Xit,εit) = 0。那么无论是 N→∞,还是 T→∞,模型参数的混合最小二乘估计量都具有一致性。 对混合模型通常采用的是混合最小二乘(Pooled OLS)估计法。 然而,在误差项服从独立同分布条件下由 OLS 法得到的方差协方差矩阵,在这里通常 不会成立。因为对于每个个体 i 及其误差项来说通常是序列相关的。NT 个相关观测值要比 NT 个相互独立的观测值包含的信息少。从而导致误差项的标准差常常被低估,估计量的精 度被虚假夸大。 如果模型存在个体固定效应,即αi 与 Xit 相关,那么对模型应用混合 OLS 估计方法,估 计量不再具有一致性。解释如下: 假定模型实为个体固定效应模型 yit = αi + Xit 'β +εit,但却当作混合模型来估计参数,则 模型可写为 yit = α + Xit 'β + (αi -α +εit) = α + Xit 'β + uit (20) 其中 uit = (αi -α +εit)。因为αi 与 Xit 相关,也即 uit 与 Xit 相关,所以个体固定效应模型的参数 若采用混合 OLS 估计,估计量不具有一致性。 3.2 平均数(between)OLS 估计 平均数 OLS 估计法的步骤是首先对面板数据中的每个个体求平均数,共得到 N 个平均 数(估计值) 。然后利用 yit 和 Xit 的 N 组观测值估计参数。以个体固定效应回归模型 yit = αi + Xit 'β +εit (21) 为例,首先对面板中的每个个体求平均数,从而建立模型y i = αi + X i 'β + ε i , i = 1, 2, …, N其中 y i = T ?1T(22)T∑ yit , X i = T ?1 ∑ X it , ε i = T ?1 ∑ ε it ,i = 1, 2, …, N。变换上式得t =1Tt =1t =1y i = α + X i 'β +(α i - α + ε i ), i = 1, 2, …, N(23)上式称作平均数模型。对上式应用 OLS 估计,则参数估计量称作平均数 OLS 估计量。此条 件下的样本容量为 N, (T=1) 。 如果 X i 与(α i - α + ε i )相互独立, 和β的平均数 OLS 估计量是一致估计量。 α 平均数 OLS 估计法适用于短期面板的混合模型和个体随机效应模型。 对于个体固定效应模型来说, 由于αi 和 Xit 相关,也即αi 和 X i 相关,所以,回归参数的平均数 OLS 估计量是非一致估计量。3.3 离差变换(within)OLS 估计 对于短期面板数据,离差变换 OLS 估计法的原理是先把面板数据中每个个体的观测值146 变换为对其平均数的离差观测值,然后利用离差变换数据估计模型参数。具体步骤是,对于 个体固定效应回归模型 (24) yit = αi + Xit'β +εit 中的每个个体计算平均数,可得到如下模型,y i = αi + X i 'β + ε i其中 y i 、 X i 、 ε i 的定义见(22)式。上两式相减,消去了αi,得 yit - y i = (Xit - X i )'β + (εit - ε i ) 此模型称作离差变换数据模型。对上式应用 OLS 估计,所得β的估计量称作离差变换 OLS 估计量。对于个体固定效应回归模型,β的离差变换 OLS 估计量是一致估计量。如果εit 还满 足独立同分布条件, 的离差变换 OLS 估计量不但具有一致性而且还具有有效性。如果对固 β 定效应αi 感兴趣,也可按下式估计。? ? α i = yi - X i ' β(27)? 利用中心化(或离差变换)数据,计算回归参数估计量 β 的方差协方差矩阵如下,-1 ? ? Var ( β ) = σ 2 [( Xit - X i )' (Xit - X i )]∧(28)? 其中 σ 2 =? ? ? ? (ε it ? ε i )′(ε it ? ε i ) 。 NT ? N ? k个体固定效应回归模型的估计通常采用的就是离差变换(within)OLS 估计法。 在短期面板条件下,即便αi 的分布、以及αi 和 Xit 的关系都已知到,αi 的估计量仍不具 有一致性。当个体数 N 不大时,可采用 OLS 虚拟变量估计法估计αi 和β。 离差变换 OLS 估计法的主要缺点是不能估计非时变回归变量构成的面板数据模型。比 如 Xit = Xi(非时变变量) ,那么有 X i = Xi,计算离差时有 Xi - X i = 0。 3.4 一阶差分(first difference)OLS 估计 在短期面板条件下,一阶差分 OLS 估计就是对个体固定效应模型中的回归量与被回归 量的差分变量构成的模型的参数进行 OLS 估计。具体步骤是,对个体固定效应回归模型 yit = αi + Xit 'β +εit 取其滞后一期关系式 yit-1 = αi + Xit-1'β +εit-1 上两式相减,得一阶差分模型(αi 被消去) yit -yit-1 = (Xit - Xit -1) 'β + (εit -εit-1) , i = 1, 2, …, N; t = 1, 2, …, T 对上式应用 OLS 估计得到的β的估计量称作一阶差分 OLS 估计量。尽管αi 不能被估计,β 的估计量是一致估计量。 在 T&2,εit 独立同分布条件下得到的β的一阶差分 OLS 估计量不如离差变换 OLS 估计 量有效。 3.5 随机效应(random effects)估计法(可行 GLS(feasible GLS)估计法) 有个体固定效应模型147 yit = αi + Xit 'β +εi αi,εit 服从独立同分布。对其作如下变换? ? ? yit - λy i = (1- λ )? + (Xit - λ X i )'β + vit(29)? ? 其中 vit = (1- λ )αi + (εit - λε i )渐近服从独立同分布,λ = 1-σε σ ε 2 + Tσ α 2,应用 OLS 估计,(29) 式等同于混合 OLS 则所得估计量称为随机效应估计量或可行 GLS 估计量。 λ = 0 时, 当 ?? 估计;当 λ =1 时, (29)式等同于离差变换 OLS 估计。对于随机效应模型,可行 GLS 估计量不但是一致估计量,而且是有效估计量,但对于 个体固定效应模型,可行 GLS 估计量不是一致估计量。 面板数据模型估计量的稳健统计推断。在实际的经济面板数据中,N 个个体之间相互独 立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得 到正确的统计推断,需要克服这两个因素。 对于第 i 个个体,当 N→∞,Xi?的方差协方差矩阵仍然是 T×T 有限阶的,所以可以用以 前的方法克服异方差。采用 GMM 方法还可以得到更有效的估计量。 EViwes 中对随机效应回归模型的估计采用的就是可行(feasible )GLS 估计法。 4.面板数据模型设定的检验方法 .面板数据模型设定的 面板数据建模的一项重要任务就是判别模型中是否存在个体固定效应。以个体随机效 无论是固定效应还是随机效应模型, i 都被看作是随机变量, α 应模型 yit = αi + Xit 'β +εit,为例, 并都有假定条件 E(yit ?αi, Xit) = αi + Xit 'β 下面介绍两种检验方法,F 检验和 Hausman 检验。 4.1 F 检验 先介绍原理。F 统计量定义为 F=( SSE r ? SSE u ) / m SSE u /(T ? k )(30)其中 SSEr 表示施加约束条件后估计模型的残差平方和,SSEu 表示未施加约束条件的估计 模型的残差平方和,m 表示约束条件个数,T 表示样本容量,k 表示未加约束的模型中被估 参数的个数。在原假设“约束条件真实”条件下,F 统计量渐近服从自由度为( m , T C k )的 F 分布。 F ? F( m , T C k ) 以检验建立混合回归模型还是个体固定效应回归模型为例,介绍 F 检验的应用。建立 假设 H0:αi =α。模型中不同个体的截距相同(真实模型为混合回归模型) 。 H1:模型中不同个体的截距项αi 不同(真实模型为个体固定效应回归模型) 。 F 统计量定义为: F=( SSEr ? SSEu ) /[( NT ? k ) ? ( NT ? N ? k )] ( SSE r ? SSEu ) / N = SSEu /( NT ? N ? k ) SSEu /( NT ? N ? k )148(31) 其中 SSEr 表示约束模型,即混合估计模型的残差平方和,SSEu 表示非约束模型,即个体固 定效应回归模型的残差平方和。约束条件为 N 个。k 表示公共参数个数。 以案例 1 为例,已知 SSEr= 4824588,SSEu=2270386,个体数 15。 F= ( SSE r ? SSEu ) / N (4824588 ? 2270386) / 15 = SSEu /( NT ? N ? k ) 2270386 /(105 ? 15 ? 2)170280 = 6.6 25799=(32)F0.05(15, 88) = 1.8 因为 F= 6.6 & F0.05(15, 88) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归 模型比混合回归模型更合理。 以检验建立混合回归模型还是时点固定效应回归模型为例,介绍 F 检验的应用。建立 假设 H0:γt =γ。模型中不同截面的截距相同(真实模型为混合回归模型) 。 H1:模型中不同截面的截距项γt 不同(真实模型为时点固定效应回归模型) 。 F 统计量定义为: F=( SSE r ? SSEu ) /[( NT ? k ) ? ( NT ? T ? k )] ( SSE r ? SSEu ) / T = SSEu /( NT ? T ? k ) SSEu /( NT ? N ? k )(31)其中 SSEr 表示约束模型,即混合估计模型的残差平方和,SSEu 表示非约束模型,即时点固 定效应回归模型的残差平方和。约束条件为 T 个。k 表示公共参数个数。 以案例 1 为例,已知 SSEr= 4824588,SSEu= 4028843,截面个数 7。 F= ( SSE r ? SSEu ) / T ( 4824588 ? 4028843) / 7 = 4028843 /(105 ? 7 ? 2) SSEu /( NT ? N ? k )113678 = 2.7 41967=(32)F0.05(7, 96) = 2.1 因为 F= 2.7 & F0.05(15, 88) = 2.1,推翻原假设,比较上述两种模型,建立时点固定效应回归 模型比混合回归模型更合理。 4.2 Hausman 检验 原假设与备择假设是 H0: 个体效应与回归变量无关(个体随机效应回归模型) H1: 个体效应与回归变量相关(个体固定效应回归模型) 例:? ? βW =0.6976,s( βW ) = 0.0127(个体固定效应回归模型估计结果,对应图 10) ;β RE =0.7246,s( β RE ) = 0.0106(个体随机效应回归模型估计结果,对应图 13)H=~ ? (0.6976 ? 0.7246) 2 ( β W ? β RE ) 2 = = 14.89 ~ ? 0.01272 ? 0.01062 s ( β W ) 2 ? s ( β RE ) 2~~因为 H =14.89 & χ20.05 (1) = 3.8,所以模型存在个体固定效应。应该建立个体固定效应回149 归模型。 注意:EViews 5.0 可以直接进行 Hausman 检验(见案例 9) 。 5.面板数据建模案例分析 . :图 14 是混合估计对应数据的散点图。回归结果如下(EViwes 案例 1(file:5panel02) 输出见案例) , CP = 129.63 + 0.76 IP(2.0)
CP 00 40004000 CPMEAN(79.7)9000 between regression 00 5000pooled regression00 00 IP
1400000 00
11000IPMEAN图 14混合估计散点图图 15平均数估计散点图图 15 是平均值数据散点图。先对数据按个体求平均数 CP 和 IP 。然后用 15 组平均值 数据回归,CP = -40.88 + 0.79 IP(-0.3)12000 within regression 8000(41.1)2400 first diffrence3 regression 4000 IPMDIP 0-4000400 0--4000-20000 CPM2000400060000400800 DCP120016002000图 16 离差变换估计散点图图 17差分估计散点图图 16 是离差变换数据散点图。先计算 CP、IP 分别对 CP 、 IP 的离差变换数据,然后 用离差变换数据计算 OLS 回归。 CPM = 0.77 IPM(90)图 17 是一阶差分数据散点图。先对 CP、IP 各个体作一阶差分,然后用一阶差分数据 回归。 DCP = 0.71 DIP150 (24)由上一节知此问题应该建立个体固定效应回归模型,所以离差变换 OLS 估计方法是最 有效的,参数估计值 0.77 最可信。 案例 2 美国公路交通事故死亡人数与啤酒税的关系研究(file:5panel01a) 见 Stock J H and M W Watson, Introduction to Econometrics, Addison Wesley, 2003 第 8 章。 美国每年有 4 万高速公路交通事故,约 1/3 涉及酒后驾车。这个比率在饮酒高峰期会上升。 早晨 1?3 点 25%的司机饮酒。 饮酒司机出交通事故数是不饮酒司机的 13 倍。 现有
年 48 个州共 336 组美国公路交通事故死亡人数(number)与啤酒税(beertax)的数据。VFR82 vs. BEER82 4.5 4.0 3.5VFR88 vs. BEER88 3.6 3.2 2.8VFR82VFR880.4 0.8 1.2 1.6 2.0 2.4 2.83.0 2.5 2.0 1.5 1.0 0.02.4 2.0 1.6 1.2 0.00.40.81.2 BEER881.62.02.4BEER82图 18 1982 年数据散点图(File: 5panel01a-graph01)图 191988 年数据散点图(File:5panel01a- graph07)1982 年数据的估计结果(散点图见图 18)∧number 1982 = 2.01 + 0.15 beertax1982(0.15) (0.13) 1988 年数据的估计结果(散点图见图 19)∧number 1988 = 1.86 + 0.44 beertax1988(0.11) (0.13)4.5 4.0 3.5 3.0 VFR 2.5 2.0 1.5 1.0 0.5 0.00.40.81.21.62.02.42.8BEERTAX图 20混合估计共 336 个观测值。估计结果仍不可靠。 (file: 5panel01b) 年混合数据估计结果(散点图见图 20)∧number
= 1.85 + 0.36 beertax(42.5) (5.9) SSE=98.75 显然以上三种估计结果都不可靠(回归参数符号不对) 。原因是啤酒税之外还有许多因151 素(如各州的路况、车型、交通立法等因素)影响交通事故死亡人数。从面板理论上说,不 知混合回归模型是不是最优的模型形式。 按个体固定效应回归模型估计∧number it = 2.375 +… - 0.66 beertax it(24.5) (-3.5) SSE=10.35 用 F 检验判断应该建立混合回归模型还是个体固定效应回归模型。 H0:αi =α ,混合回归模型(约束截距项为同一参数) 。 H1:αi 各不相同。个体固定效应回归模型(截距项任意取值) F= ( SSE r ? SSEu ) / N SSEu /( NT ? N ? 2)(以 EViwes5.0 计算自由度)=(98.75 ? 10.35) / 48 1.84 = = 50.8 10.35 /(336 ? 50) 0.0362F0.05(48, 286) = 1.2 因为 F= 50.8 & F0.05(14, 89) = 1.2,推翻原假设,比较上述两种模型,建立个体固定效应回归模 型更合理。 按双固定效应回归模型估计∧number it = 2.37 +… - 0.646 beertax it(23.3) (-3.25) SSE=9.92 用 F 检验判断应该建立混合回归模型还是个体时点双固定效应回归模型。 H0:αi =α。γt =γ。混合回归模型(约束截距项为同一参数) 。 H1:αi,γt 各不相同。个体时点双固定效应回归模型(截距项任意取值) F= ( SSE r ? SSEu ) /( N + T ) SSEu /( NT ? N ? T ? k )(98.75 ? 9.92) /(48 + 7) 1.62 = = 45 9.92 /(336 ? 48 ? 7 ? 2) 0.036(以 EViwes5.0 计算自由度)=F0.05(55, 279) = 1.6 因为 F= 45 & F0.05(55, 279) = 1.6,推翻原假设,比较上述两种模型,建立个体时点双固定效 应回归模型更合理。 以上两种模型回归系数的估计结果非常近似。F 检验也说明,建立个体固定效应回归模 型和双固定效应回归模型都要比混合回归模型合理。所以回归参数- 0.66 和- 0.646 要比混合 回归模型参数 0.36 合理。 因为差分 OLS 估计也是估计固定效应回归模型的一种方法,下面讨论面板差分数据得 到的估计结果。利用 1988 年和 1982 年数据的差分数据得估计结果(散点图见图 21) 。这个 估计结果在符号上也是合理的。∧ ∧number 1988 - number 1982 = -0.072 - 1.04 (beertax1988 - beertax1982)(0.065) (0.36)152 .6 .4 BEER88-BEER82 .2 .0 -.2 -.4 -.6 -1.6-1.2-0.8-0.40.00.40.8VFR88-VFR82图 21差分数据散点图(File:5panel01a- graph08)因此问题应该建立个体固定效应回归模型,所以个体固定效应估计结果-0.66 应当更可 信。 6.面板数据模型的 EViwes 操作 . 6.1 用 EViwes 5.0 建立面板数据估计模型步骤。 (file:5panel02) 利用 (例 1)
年 15 个省级地区城镇居民家庭年人均消费性支出和年人均收入 数据(不变价格数据)介绍面板数据模型估计步骤。 (1)建立混合数据库(Pool)对象。 首先建立年度工作文件() 。在打开工作文件窗口的基础上,点击EViwes主 功能菜单上的Objects键,选New Object功能(如图1) ,从而打开New Object(新对象)选择 窗(如图2) 。在Type of Object选择区选择Pool(合并数据库) ,并在Name of Object选择区为 混合数据库起名Pool01 (初始显示为Untitled) 点击图2中OK键, 。 从而打开混合数据库 (Pool) 窗口。在窗口中输入15个地区的标识AH(安徽)、BJ(北京)、…、ZJ(浙江) ,如图3。图1图2153 图3(2)定义序列名并输入数据。 在新建的混合数据库(Pool)窗口的工具栏中点击 Sheet 键(第 2 种路径是,点击 View 键,选 Spreadsheet (stacked data)功能) ,从而打开 Series List(列写序列名)窗口,定义时间 序列变量 CP?和 IP?(符号?表示与 CP 和 IP 相连的 15 个地区标识名)如图 4。图4点击 OK 键,从而打开混合数据库(Pool)窗口(图 5)(点击 Edit+-键,使 EViwes 处于可 。 编辑状态)可以用键盘输入数据,也可以用复制和粘贴的方法输入数据。154 图5图 5 所示为以个体为序的阵列式排列(stacked data) 。点击 Order+-键,还可以变换为以 截面为序的阵列式排列。输入完成后的情形见图 6。图6点击 PanelGener 可以通过公式用已有的变量生成新变量(注意:输入变量时,不要忘 记带变量后缀“?”。 ) 这是
年中国东北、华北、华东 15 个省级地区的居民家庭人均消费(不变价 格)和人均收入数据见表 1 和表 2。数据是 7 年的,每一年都有 15 个数据,共 105 组观测 值。 用 cp 表示消费, 表示收入。 ip AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ 分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽 宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。 人均消费和收入两个面板数据都是平衡面板数据,各有 15 个个体。人均消费和收入观 测值顺序是按地区名的汉语拼音字母顺序排序的。 在工作文件中打开面板数据窗口,点击 View 键,选 Descriptive Stats 功能可以得到面板 数据按个体计算的特征数。见图 7。155 图 7 个体特征数分析选定 15 个 cp 变量数据用 Show 命令打开数据窗口,点击 View/Graph/Line 命令可得到 15 个 cp 个体的时序图。类似操作可得到 15 个 ip 个体的时序图。
00 199619971998199920002001 CPSD CPSH CPSX CPTJ CPZJ200219971998 IPAH IPBJ IPFJ IPHB IPHLJ199920002001 IPSD IPSH IPSX IPTJ IPZJ2002CPAH CPBJ CPFJ CPHB CPHLJCPJL CPJS CPJX CPLN CPNMGIPJL IPJS IPJX IPLN IPNMG图815 个省级地区的人均消费序列(纵剖面)12000 CP1996 CP1997 CP1998 CP1999 CP2000 CP2001 CP2002图 9 15 个省级地区的人均收入序列(file:5panel02)10000800060004000 IP() 00 000 图 10人均消费对收入的面板数据散点图(7 个截面叠加)6.2 面板数据模型的 EViwes 5.0 估计方法:156 在打开工作文件窗口的基础上,点击主功能菜单中的 Objects 键,选 New Object 功能, 从而打开 New Object(新对象)选择窗。在 Type of Object 选择区选择 Pool(混合数据库) , 点击 OK 键,从而打开 Pool(混合数据)窗口(图 11) 。在窗口中输入 15 个地区标识(变 量的后缀)AH(安徽)、BJ(北京)、…、ZJ(浙江) 。图 11 点击 Estimation 键,随后弹出 Pooled Estimation(混合估计)对话窗(见图 12) 。先对 Pooled Estimation(混合估计)对话窗中各选项功能给以解释。 EViwes 5.0 面板数据模型估计对话窗口如下,图 12EViwes 5.0 面板模型估计窗口157 图 13EViwes 5.1 面板模型估计窗口EViews 5.1 版本的面板数据模型估计(Pool Estimation)窗口(图 13)分成了两个模块, Specification(设定)和 Option(选择) ,但基本功能与早期版本无本质区别。主要选择都集 中在 Specification(设定)模块中。见图 14。熟悉了图 14 中选择方法对图 15 对话窗不难理 解。 在 Estimation Method(估计方法)选项区内有三个选项框。 (1)Cross-section(横跨个体)中包括 None(不选) ,Fixed(固定) ,Random(随机) 分别用来做非个体效应,个体固定效应和个体随机效应的设定(见图 14) 。 (2)Period(时点)中也包括 None(不选) ,Fixed(固定) ,Random(随机)三项选 择分别用来进行非时点效应,时点固定效应或时点随机效应设定(见图 15) 。图 14图 15(3)Weight(权数)可以在 5 种加权方法中做选择(见图 16) 。158 图 16在 Estimation Settings(估计方法设定)区包括二种估计方法:一种为 LS(最小二乘) 方法,一种为 TSLS(两阶段最小二乘)方法。 在 Regression and AR() Terms(回归变量与 AR 项)选择区,若把变量填入 Common(共 同)框内意味着变量的效率相同,如果把变量填入 Cross-section specification(截面设定) 框内意味着回归变量的斜率随个体不同而不同。 在 EViews 5.0、5.1 版本的随机效应模型估计结果窗口点击 View 键,选 Fixed/Random Effects Testing/Correlated Random Effect-Hausman Test 功能, 可以直接获得应该建立随机效应 模型还是个体固定效应模型的 Hausman 检验结果。 用 EViwes 可以估计固定效应模型(包括个体固定效应模型、时点固定效应模型和时点 个体固定效应模型 3 种) 、随机效应模型、带有 AR(1)参数的模型、截面不同回归系数也不 同的面板数据模型。 用 EViwes 可以选择普通最小二乘法、加权最小二乘法(以截面模型的方差为权) 、似 不相关回归法估计模型参数。 可以在 Common coefficients 选择窗和 Cross section specific coefficients 选择窗中填入 AR(1)项。如果把 AR(1)项填在 Common coefficients 选择窗中相当于假设模型有相同的自回 归误差项, 如果把 AR(1)项填在 Cross section specific coefficients 选择窗中相当于假设模型有 不同的自回归误差项。 注意:如果把解释变量填入 Cross section specific coefficients 选择窗中,对应不同的解 释变量将会得到不同的回归参数。 估计过程中的缺省方法是等权(No weighting)估计。还可以选择 Cross section weights (按截面取权数)和 SUR(似不相关回归) 。 3 种估计方法如下: 混合模型(Pool Model) 工具栏中点击 Estimate 键,打开 Pooled Estimation(混合估计)窗口如图 17。159 图 17在 Dependent Variable (相依变量) 选择窗填入 CP?; Common coefficients 在 (系数相同) 选择窗填入 IP?;Cross section specific coefficients(截面系数不同)选择窗保持空白;在 Intercept(截距项)选择窗点击 Common;在 Weighting(权数)选择窗点击 No weighting。 点击 Pooled Estimation(混合估计)窗口中的 OK 键。得输出结果如图 18。图 18相应表达式是∧CP it = 129.7 IPit(2.0) (79.7) R2 = 0.98, SSEr = 4824588, t0.05 (103) = 1.99 15 个省级地区的人均支出平均占收入的 76%。 注意:如果从时间和截面上看模型截距都为零,就可以建立不含截距项的(α = 0)的160 混合估计模型。以二变量模型为例,建立混合估计模型如下, yit = β1 xit +εit, i = 1, 2, …, N; t = 1, 2, …, T (2)无截距项的混合模型 EViwes 估计方法:在 Pooled Estimation(混合估计)对话框中 Intercept(截距项)选择窗中选 None,其余选项同上。 Eviwes 对面板数据混合模型采用的是混合最小二乘(Pooled OLS)估计法。 个体固定效应回归模型的 EViwes 估计方法:在 EViwes 的 Pooled Estimation 对话框中 Intercept 选项中选 Fixed effects。其余选项同上。图 19161 图 20注意: (1)EViwes 输出结果中没有给出描述个体效应的截距项相应的标准差和 t 值。不认为 截距项是模型中的重要参数。 (2)当对个体固定效应模型选择加权估计时,输出结果将给出加权估计和非加权估计 两种统计量评价结果。 (3)输出结果的联立方程组形式可以通过点击 View 选 Representations 功能获得。 (4) 点击 View 选 Wald Coefficient Tests…功能可以对模型的斜率进行 Wald 检验。 例如 c(1)=0.7。 (5)点击 View 选 Residuals/Table, Graphs, Covariance Matrix, Correlation Matrix 功能可 以分别得到按个体计算的残差序列表,残差序列图,残差序列的方差协方差矩阵,残差序列 的相关系数矩阵。162 (6)点击 Procs 选 Make Model 功能,将会出现估计结果的联立方程形式,进一步点击 Solve 键,在随后出现的对话框中可以进行动态和静态预测。 (7)Eviwes 对个体固定效应回归模型的估计采用的就是离差(within)OLS 估计法。 以个体固定效应回归模型为例介绍 EViews 预测方法。 在个体固定效应回归估计窗口点击 Proc 键选 make model 功能。在打开的对话框中点击 Solve 键,可得到样本内每个个体的动态和静态预测序列。以其中的安徽,北京为例,预测 效果很好。4800 CPAH 4400 CPAH (Baseline)11000 CPBJ
CPBJ (Baseline)400036006000199719981999200020012002199719981999200020012002用年数据建立的个体固定效应回归模型进行样本外1期预测的EViews操作: 在个体固定效应回归估计窗口,点击Procs选Make Model功能。点击Solve。在出现的对 话框的Dynamics中选择Dynamiic solution (动态解) 在Solution sample 对话框中输入 。 “”。点击“确定”键,得每个个体样本外1期(2002年)预测结果。其中安徽、北京、 福建2002年人均消费预测值如下4683.8 ? 4784.4 = 0.02。 9.7 ? 10473.1 北京2002年消费(cp)的预测误差是 = 0.07。 1.1 ? 6665.0 福建2002年消费(cp)的预测误差是 = 0.03。 6665.0 预测效果很好。 时点固定效应回归模型的 EViwes 估计方法:在 Pooled Estimation(混合估计)窗口中 的 Dependent Variable(相依变量)选择窗填入 CP?;在 Common coefficients(系数相同)选 择窗填入 IP?; Cross section specific coefficients 截面系数不同) 在 ( 选择窗选 None; Period 在 选择窗选 Fixed。点击确定键。安徽2002年消费(cp)的预测误差是163 图 21图 22164 个体时点双固定效应回归模型的 EViwes 估计方法:在 Pooled Estimation(混合估计) 窗口中的 Dependent Variable(相依变量)选择窗填入 CP?;在 Common coefficients(系数相 同)选择窗填入 IP?;在 Cross section specific coefficients(截面系数不同)选择窗选 Fixed; 在 Period 选择窗选 Fixed。点击确定键。图 23165 图 24注意:结果中 cross 对应的是个体,period 对应的是时点。 随机效应模型的 EViwes 估计方法: EViwes 的 Pooled Estimation 对话框中 Cross-section 在 选项中选 Random effects。其余选项同混合估计操作。166 图 25Eviwes 对个体随机效应回归模型的估计采用的就是 feasible GLS 估计法。167 图 26相应表达式是∧CP it = (345.2 - 2.5)+ (345.2+367.0)D2 +…+ (345.2+106.1)D15 + 0.72 IPit(4.3) R2 = 0.99, SSE = 2501653 其中虚拟变量 D2, D3, …, D15 的定义是 Di = ? (64.4)(16-13-3)?1, 如果属于第i个个体,i = 2, ..., 15, ?0, 其他,下面利用 Hausman 统计量检验应该建立个体随机效应回归模型还是个体固定效应回归 模型。原假设与备择假设是 H0: 个体效应与回归变量(IPit)无关(个体随机效应回归模型) H1: 个体效应与回归变量(IPit)相关(个体固定效应回归模型)? 设个体固定效应回归模型参数和个体随机效应回归模型参数估计量分别用 βW 和 β RE ? 表示( βW 表示离差 OLS 估计量; β RE 表示可行 GLS 估计量) 。如果真实模型是个体随机 ? 效应回归模型,那么 βW 和 β RE 都是一致估计量,两者差异应该小。如果真实模型是个体固 ? 定效应回归模型,那么 βW 是一致估计量而 β RE 是非一致估计量,两者差异应该大。所以,如果两种估计结果差异小, 说明可以建立个体随机效应回归模型; 如果两种估计结果差异大, 应该建立个体固定效应回归模型。 由个体固定效应回归结果(16-13-2)式知~~~~? ? βW =0.6976,s( βW ) = 0.0127由个体随机效应回归结果(16-13-3)式知β RE =0.7246,s( β RE ) = 0.0106H=2 % ? ( βW ? β RE ) 2 = (0.6976 ? 0.7246) = 14.89 2 2 ? % s( βW ) 2 ? s ( β RE ) 2 0.0127 ? 0.0106~~168 H 表示 Hausman 统计量,因为 H = 14.89 & χ20.05 (1) = 3.8,所以模型存在个体固定效应。 应该建立个体固定效应回归模型。 EViews 5.0 可以直接进行 Hausman 检验。 在个体随机效应回归输出结果窗口中点击 View 键,选 Fixed/Random Effects Testing/Correlated Random Effect-Hausman Test 功能,如图 23。 可以直接获得如图 24 的 Hausman 检验结果(主要结果) 。图 27图 28Correlated Random Effect-Hausman Test 即是否存在个体固定效应的 Hausman 检验。图 中第 1 部分给出的是 Hausman 检验结果。Hausman 统计量的值是 14.79,相对应的概率是 0.0001。说明检验结果拒绝了随机效应模型原假设。应该建立个体固定效应模型。14.79 与 上面计算的 14.89 略有差别,是由于两种计算的误差不同所致。 图中第 2 部分给出的是 Hausman 检验中间结果比较。0.697561 是个体固定效应模型对 参数的估计, 0.724569 是随机效应模型对参数的估计。 0.000049 是相应两个参数估计量的分 布方差的差(Var(Diff)) 。 综上分析, 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费和 人均收入问题应该建立个体固定效应回归模型。人均消费平均占人均收入的 70%。随地区 不同,自发消费(截距项)存在显著性差异。(5)回归系数不同的面板数据模型 当认为对于不同个体, 解释变量的回归系数存在显著性差异时, 还可以建立回归系数不169 同的面板数据模型。 回归系数不同的个体固定效应模型 EViwes 估计方法:在 Pooled Estimation(混合估计) 窗口中的 Dependent Variable(相依变量)选择窗填入 CP?;在 Common coefficients(系数相 同)选择窗保持空白(如果需要估计时点固定效应也可输入虚拟变量 D1997, D1998, D1999, D2000, D2001, D2002) 在 Cross section specific coefficients 截面系数不同) ; ( 选择窗填入 IP?; 在 Intercept(截距项)选择窗中选 Fixed effects(也可以做其他选择) ;在 Weighting(权数) 选择窗点击 No weighting(也可以做其他选择) 。点击 Pooled Estimation(混合估计)窗口中 的 OK 键。图 29170 图 30171 4 种估计方法的输出结果。
CP 00 00 00 8000 IP
14000 pooled regression图 31混合估计散点图图 32混合 OLS 估计(Pooled regression)9000 between regression
CPMEAN 00 5000600070008000 11000IPMEAN图 33平均值 OLS 估计散点图172 图 34 平均值 OLS 估计(between regression)12000 within regression 80004000 IPM0-4000--4000-20000 CPM200040006000图 35离差变换(within)估计散点图图 36离差变换(within)OLS 估计结果173 2400 first diffrence3 regression
0 0 400 800 DCP 00图 37差分估计散点图图 38差分 OLS 估计结果注意:表示箱的 3 条横线自下而上分别代表第 25、50、75 百分位数。黑点表示样本均 值。阴影长度表示中位数的置信区间。 案例 3:怎样建立非线性面板数据模型并预测(file:5expend-zhang) 全国省级地区城镇居民人均食品支出与收入的关系研究() 。 为均衡面板数据,包括 28 个省市自治区,不包括西藏、新疆和重庆市,21 年共 588 个 观测值。 图 1 给出 28 个省级地区
年城镇居民人均食品支出的面板数据 3 维图。174 00 00 00 500 0 F1SIC F1SAX F1LIN F1HUN F1HEB F1SAXF1GUD图 1a 28 个省级地区城镇居民人均食品支出 3 维图(file:5expend-zhang)00
F1GAS F1HUB F1GUX F1HEB F1NIX F1GUD F1ANH F1HAN F1HEN F1SHD F1SHH F1SHX F1JIS F1JIX F1QIH F1LIN F1HUN F1YUN F1SIC F1FUJ F1NMG F1GUZ F1ZEJ F1HLJ F1BEJ F1TIJ F1JIL图 1b 28 个省级地区城镇居民人均食品支出箱图(file:5expend-zhang)图 2 给出 28 个省级地区
年城镇居民人均收入的面板数据 3 维图。
00 2000 I1ZEJ I1SIC I1SHD I1NMG I1JIX I1HUN 0 F1ANH 19851990I1HENI1GUZI1GAS图 2a28 个省级地区城镇居民人均收入 3 维图(file:5expend-zhang)175I1ANH 19851989199319972005
0 I1HEB I1GUX I1GAS I1HUB I1SHX I1JIS I1JIX I1SAX I1FUJ I1NIX I1ANH I1HAN I1HEN I1SHD I1SHH I1TIJ I1GUD I1HUN I1YUN I1QIH I1SIC I1LIN I1NMG I1GUZ I1ZEJ I1BEJ I1HLJ I1JIL图 2b 28 个省级地区城镇居民人均收入箱图(file:5expend-zhang)首先用混合数据把 28 个地区的数据混合在一起(非面板数据)分析分省城镇居民人均 食品支出(food)与城镇居民人均收入(income)的关系,从而确定建立何种类型的模型最 合理。28 个省市自治区,21 年共 588 组观测值。5000 food 4000300020001000 income 0 0 000 图3Food 和 income 的混合数据散点图首先通过散点图研究。food 和 income 的混合数据散点图如图 3(file:income-food) 。 显然变量 food 和 income 之间存在非线性关系和异方差,建立线性模型是不合理的。但,如 果不看散点图,还误以为线性模型是一个很好的回归结果。把 income 取成对数形式,尝试建立半对数模型。图 4 显示,建立半对数模型也不合理。176 5000 food 4000300020001000 log(income) 0 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0图4Food 和 log(income)的混合数据散点图尝试建立全对数模型(见图 5) 。图 5 与图 3、图 4 相比,异方差得到克服。但是可以看 出,log(Food)和 log(income)的关系仍然是非线性的。 进一步观察 log(food)和 log(log(income) )的散点图, 如图 6。 log(Food)和 log(log(income) ) 存在满意的线性关系,同时,不存在异方差。所以讨论建立面板数据模型时,应该建立关于 log(Food)和 log(log(income) ) 的面板数据模型。9.0 8.5 8.0 7.5 7.0 6.5 6.0 log(income) 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0 log(food)8.5 8.0 7.5 7.0 6.5 6.0 log(log(income)) 5.5 1.80 1.85 1.90 1.95 2.00 2.05 2.10 2.15 2.20 2.25 2.30 9.0 log(food)图5log(Food)和 log(income)的混合数据散点图图6log(Food)和 log(log(income) )的散点图首先用混合数据(非面板数据)估计模型。得回归结果如下, logfood = - 5.8636 + 6.2072 log(logincome) (1) (-61.7) (137.3) R2 = 0.97,DW=2.0, N×T= 588 本来总样本容量应该是 N×T= 21×31 = 651,但西藏、新疆、重庆的数据有缺失。图7混合数据估计结果(file:income-food, eq01)177 上式的导函数是d log food t 1 = 6.2072 d log incomet log income导函数不是常量,说明(1)式中人均食品支出对人均收入的弹性系数是随着城镇人均 收入的增加而减小。当城镇人均收入为 666 元时,也即 log(666) = log(income) = 6.5 时,依 据上式计算,log(food)的弹性系数是 0.955.。当城镇人均收入增长到 13400 元时,也即 log(13400) = log(income) = 9.5 时,log(food)对收入的弹性系数下降到 0.653。城镇人均食品 支出对人均收入的弹性系数随着人均收入的提高而递减。 用面板数据得混合估计结果如下。图 8 混合 OLS 估计结果(file:5expend-zhang)logfood = - 5.8117 + 6.2072log(logincome) (2) (-61.7) (137.3) R2 = 0.97,DW= 0.16,N×T= 28×21 = 588 (1)和(2)式的估计系数是完全相同的,只有 DW 值不同, (1)式的数据是全部按数值 大小排列的, (2)式按每个个体时间序列排列的。 用个体固定效应回归模型的估计结果如下: logfood = - 5.5151 + 6.0645 log(logincome) (3) (-90.1) (206.3) R2 = 0.989,DW= 0.43,N×T= 28×21 = 588178 图 9 个体固定效应估计结果(删去了输出结果的中间部分,file:5expend-lishisen)总样本容量是 N×T= 28×21 = 588。 用 F 检验判断是建立混合回归模型合理,还是建立个体固定效应回归模型合理。 F= ( SSE r ? SSEu ) / N (8.2698 ? 3.1509) / 28 = SSEu /( NT ? N ? k ) 3.1509 /(588 ? 28 ? 2)=0.1828 = 32.6 0.0056F0.05 (28, 558) = 1.6 因为 F= 32.6 & F0.05 (31, 598) = 1.6,推翻原假设,比较上述两种模型,建立个体固定效 应回归模型比混合回归模型更合理。 模型误差项存在自相关,通过尝试,加三个 AR 自回归项,得结果如下: logfood = - 5.0160 + 5.8320 log(logincome) (4) (-35.1) (86.6) R2 = 0.994,DW= 2.1,N×T-3N= 28×21-3×28 = 504 3 个自回归项使自由度减小 84 个。179 180 图 10克服自相关的个体固定效应回归模型用 F 检验判断是建立混合回归模型合理,还是建立个体固定效应回归模型合理。 F= ( SSE r ? SSEu ) / N (8.2696 ? 0.8803) /(588 ? 2 ? (504 ? 28 ? 2)) = SSEu /( NT ? N ? k ) 0.8803 /(504 ? 28 ? 2)(8.2696 ? 0.8803) / 112 0.0660 = = 34.7 0.8803 / 474 0. (112, 474) = 1.1=因为 F= 34.7 & F0.05 (112, 474) = 1.1,推翻原假设,比较混合回归模型和克服自相关的个 体固定效应回归模型,结论仍然是建立个体固定效应回归模型比混合回归模型合理。 以图 10 个体固定效应回归模型为例介绍 EViews 预测方法。 在个体固定效应回归估计窗口点击 Proc 键选 make model 功能。在打开的对话框中点击 Solve 键,可得到样本内每个个体的动态和静态预测序列。以其中的安徽,北京为例,静态 预测效果很好。3000 F1ANH
F1ANH (Baseline)5000 F1BEJ 4000 F1BEJ (Baseline)300015002000 86 88 90 92 94 96 98 00 02 0410000 86 88 90 92 94 96 98 00 02 04用年数据建立的个体固定效应回归模型进行样本外1期预测的EViews操作: 在个体固定效应回归估计窗口(图10) ,点击Procs选Make Model功能。点击Solve。在 出现的对话框的Dynamics中选择Dynamiic solution(动态解)。在Solution sample 对话框中 输入“”。点击“确定”键,得每个个体样本外1期(2005年)预测结果。其中 安徽、北京、福建2005年人均消费预测值如下181 2757.6 ? 2781.5 = 0.009。 0.1 ? 4215.6 = 0.018。 北京2005年食品支出的预测误差是 1.7 ? 3595.2 福建2005年食品支出的预测误差是 = 0.032。 3595.2 预测效果非常好。 双固定效应回归模型估计结果如下: logfood = - 2.6469 + 4.6850 log(logincome) (-5.3) (19.4) R2 = 0.996,DW= 0.44,N×T = 588安徽2005年食品支出的预测误差是(5)图 11双固定效应(删去了输出结果的中间部分,file:5expend-lishisen)用 F 检验判断是建立混合回归模型合理,还是建立个体时点双固定效应回归模型合理。 F=( SSE r ? SSEu ) /( N + T ) (8.2698 ? 1.1410) /( 28 + 21) 0.1455 = = = 69.3 SSEu /( NT ? N ? T ? k ) 1.1410 /(588 ? 28 ? 21 ? 2) 0.0021F0.05(49, 537) = 1.1 因为 F= 69.3 & F0.05(49, 537) = 1.1,推翻原假设,比较上述两种模型,建立个体时点双 固定效应回归模型同样比混合回归模型合理。 个体随机效应回归模型估计结果如下: logfood = - 5.5321 + 6.0727 log(logincome) (6) (-88.6) 206.9) ( 2 R = 0.986,DW= 0.39,N×T= 588182 其中西藏、新疆、重庆的数据有缺失。图 12 个体随机效应(删去了输出结果的中间部分,file:5expend-lishisen)用 Hausman 检验检验应该建立个体固定效应回归模型还是个体随机效应回归模型。 原假设与备择假设是? 其中 θ 表示离差变换 OLS 估计量, θ 表示可行 GLS 估计量。~ ? ~ H1: plim( θ - θ ) ≠ 0,只有离差变换估计量是一致估计量(个体固定效应回归模型) ~ ? H0: plim( θ - θ ) = 0,两种估计量都是一致估计量(个体随机效应回归模型)例: 用存在自相关的个体固定效应回归模型估计结果与个体随机效应回归模型估计结果 比较。由(3)式,? ? βW =6.0645,s( βW ) = 0.0294(个体固定效应回归模型估计结果,存在自相关) ;由(6)式,β RE =6.0727,s( β RE ) = 0.0293(个体随机效应回归模型估计结果,对应图 12)H=~ ? (6.0645 ? 6.0727) 2 ( β W ? β RE ) 2 = = 11.5 ~ ? 0.0294 2 ? 0.0293 2 s ( β W ) 2 ? s ( β RE ) 2~~183 因为 H = 11.5 & χ20.05 (1) = 3.8,所以模型存在个体固定效应。应该建立个体固定效应回 归模型。 下面用不存在自相关的个体固定效应回归模型估计结果与个体随机效应回归模型估计 结果比较。由(4)式,? ? βW =5.8508,s( βW ) = 0.0666(个体固定效应回归模型估计结果,不存在自相关) ;由(6)式,β RE =6.0727,s( β RE ) = 0.0293(个体随机效应回归模型估计结果,对应图 12)H=~ ? (5.8320 ? 6.0727) 2 ( β W ? β RE ) 2 = = 15.8 ~ ? 0.0673 2 ? 0.0293 2 s ( β W ) 2 ? s ( β RE ) 2~~因为 H = 15.8 & χ20.05 (1) = 3.8,结论仍然是,模型存在个体固定效应,应该建立个体固 定效应回归模型。 以不存在自相关的个体固定效应回归模型估计结果分析,回归结果是 logfood = - 5.0160 + 5.8320 log(logincome) (7) (-35.1) (86.6) R2 = 0.994,DW= 2.1,N×T-3N= 28×21-3×28 = 504 上式的导函数是d log food t 5.8320 = d log incomet log income导函数不是常量,说明(2)式中的弹性系数是随着城镇人均收入的变化而变化的。当 城镇人均收入为 666 元时,也即 log(666) = logcincome = 6.5 时,依据上式计算,logfood 的 弹性系数是 0.897。当城镇人均收入增长到 13400 元时,也即 log(13400) = logcincome = 9.5 时,logfood 对收入的弹性系数下降到 0.614。食品支出对城镇人均收入的弹性系数随着人均 收入的提高而递减。见图 13,改革开放以后,中国城镇居民的生活水平有了很大提高。 建立个体固定效应回归模型的优点是可以克服随个体变化但不随时点变化的一些因素 的影响。 用全部数据拟合的结果见图 13。9.0 log(food) 8.5 8.0 7.5 7.0 6.5 6.0 log(income) 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0图 13 变弹性系数的城镇人均食品支出与收入的关系下面讨论用个体固定效应回归模型预测。在 EViews 个体固定效应回归结果窗口点击 Proc 键,选 make model 功能,将打开一个对话窗。点击 solve 键。在打开的对话窗中可以184 选择动态预测和静态预测。图 14 是对安徽省人均食品支出的样本内静态预测结果。3000 FOODANH
FOODANHF5000 FOODBEJ 4000 FOODBEJF300015002000 86 88 90 92 94 96 98 00 02 0410000 86 88 90 92 94 96 98 00 02 04图 14 安徽省城镇人均食品支出样本内静态预测结果图 15 北京市人均食品支出样本内静态预测结果表1 年 87 90 93 96 99 02 05安徽省、北京市城镇人均食品支出的观测值与样本内静态预测值 FOOD-ANH 323.12 392.18 444.48 552.00 655.00 683.00 768.00 873.81 5.13 8.62 0.79 4.83 5.28 9.02 2781.50 FOOD-ANHF 348.7 491.7 638.3 738.4 5.635 4.392 5.387 4.899 2.673 1.613
FOOD-BEJ 466.92 543.36 605.04 743.37 841.30 892.17 6.37 9.00 1.52 5.73 3.37 2.08 5.54 4215.56 FOOD-BEJF 491.839 567.276 619.373 730.672 797.475 874.082 972.242 6.746 8.524 1.141 8.684 4.884 2.037 9.549185
EVIEWS用面板数据模型预测_经管营销_专业资料。第 8 讲 用面板数据模型预测 1.面板数据定义 . 时间序列数据或截面数据都是一维数据。 时间序列数据是变量按时间得到...EViews6.0在面板数据模型估计中的操作_计算机软件及应用_IT/计算机_专业资料。面板数据模型傻瓜教程EViews 6.0 在面板数据模型估计中的实验操作 1、进入工作目录 cd ...EViews 6.0 beta在面板数据模型估计中的应用_经济学_高等教育_教育专区。EVIEW6.0 面板数据在模型中如何操作EViews 6.0 beta 在面板数据模型估计中的应用 来自免费的...EViews 6.0 beta 在面板数据模型估计中的应用 来自免费的 minixi 1、进入工作目录 cd d:\nklx3,在指定的路径下工作是一个良好的习惯 2、建立面板数据工作文件 ...Eviews 面板数据之固定效应模型在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是 模型的截距项是不同的, 而模型的斜率系数是相同的,则称此模型...eviews面板数据模型详解_计算机软件及应用_IT/计算机_专业资料。1.已知 1996―...联立方程形式,进一步点击 Solve 键,在随后出现的对话框中可以进行动态和静态预测...Eviews面板数据之随机效应模型_数学_自然科学_专业资料。Eviews面板数据之随机效应模型 随机效应模型的估计原理说明与豪斯曼检验在面板数据的计量分析中, 如果解释变量对...eviews面板数据模型详解_经管营销_专业资料。eviews面板数据模型详解 1.已知
年中国东北、华北、华东 15 个省级地区的居民家庭人均消费 已知 年中国东北...EViews 6.0 beta 在面板数据模型估计中的应用 来自免费的 minixi 1、进入工作目录 cd d:\nklx3,在指定的路径下工作是一个良好的习惯 2、建立面板数据工作文件 ...假定模 型被设为动态模型,利用 Eviews 估计动态面板数据模型时,则打开 workfile 窗口后,在主 菜单选择 Object/new object/Equation, 或者 Quick/Estimatie ...
All rights reserved Powered by
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。}

我要回帖

更多关于 刷脸app 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信