Datahub
数据改变生活

挑战杯系列第四篇——选对模型,精准分析

发表时间:2022-07-14 13:53

挑战杯系列第四篇——选对模型,精准分析

原创 王一辰 求知联盟

选择一个合适的模型,会使文章的结论和分析更加精准和详细。图片图片

——写在开头

很多学生在刚开始写论文时,总先想着要用什么模型才能使得文章看起来更高级,仿佛所用的模型难度越大、软件越少人知,论文就越厉害,这其实是一个误区。不可否认,模型确实很重要,一个专业性很强、难度较大的模型,全套坐下来需要花费很多功夫,也可以侧面反映出文章工作量很大,这是一个加分项;然而,如果一味追求模型,把模型置于整体研究内容之上,则会产生事与愿违的情况。因为模型、数据等都只是一个工具,他们都是为了研究内容而服务的,所以即使大家想找一个看起来更高级的模型,也一定要在非常符合研究内容的前提下寻找一个最合适的模型,才能让自己的论文更进一步,实现更加精准和细致的分析。因此,本篇就跟大家分享一下我在写论文时在选择和运用模型时的感想和经验~图片图片


首先还是通过查找文献,看过几篇经典文献后基本可以发现:研究普遍表明,京津冀雾霾存在显著的空间自相关,受区域反馈叠加效应大。而且当模型中解释变量存在显著空间聚集特征和内源性互动效应传统的非空间面板数据模型估计精度会下降,要选用具有个体效应的空间计量模型。所以,我之所以放弃选择传统的OLS模型而是选择相对罕见的空间计量模型,完全是由于我的研究主题“雾霾”所具有的特性更适合这个模型。图片图片


由于本文数据2006-2015年京津冀13个城市的短面板数据(N>T),因此无需进行单位根检验和协整检验。但首先要说明使用空间模型的必要性,因此先检验普通面板模型是否合适。运用Matlab进行非空间面板数据分析,公式如下:

图片

然而,空间模型也有很多种具体类型,其中主要有以下三种形式:

1、空间滞后模型(SLM

图片

2、空间误差模型(SEM)

图片

3、空间杜宾模型SDM)

图片

将数据进行计量检验,结果发现啊依照Wald检验和LR检验结果,当两个原假设均被拒绝时,则应选择空间杜宾模型。此外,面板数据模型分为随机效应和固定效应模型,可运用Hausman 检验进行效应选择。同时,Hausman检验结果再次证明使用双向固定模型的正确性因此最终采用的是双向固定的空间杜宾模型

图片

图片

图片

从公式中可以看出,对角线元素值和的平均值衡量了某解释变量对该市PM2.5的平均影响程度,即直接效应;该矩阵所有行(或列)非对角线元素之和的均值表示某市解释变量对其他城市PM2.5平均影响,即间接效应(空间溢出效应);直接效应和间接效应的代数和总效应。直接效应和间接效应空间计量模型回归系数能更精确地反映变量对因变量的影响程度继续用Matlab操作,得到结果。图片图片


最后根据最适合研究主题的模型得出更加细致精准的结论:京津冀雾霾污染和经济增长呈现“倒N型”曲线趋势,地区整体目前还未迈过第二个拐点。民用车拥有量对本市PM2.5的直接效应和对周围城市PM2.5的空间溢出效应最明显,煤炭消费比重和工业增加值比重的影响次之,房屋建筑施工面积的直接和间接效应相对较弱。图片图片


同时可以继续在创新点上加入新的内容:计量方法上,从空间经济学、数量地理学的视角切入研究环境经济学,实现了交叉学科创新。借助Matlab 7.0在传统面板计量模型的基础上引入空间因素,经检验后选取拟合效果最佳的“时间地区双向固定空间杜宾模型,测度出京津冀相关因素的变化对本城市PM2.5的直接效应和对其它城市PM2.5的空间溢出效应图片图片


综上所述,一个好的模型不仅看起来高级、难度大、反映的工作量大,最重要的是与研究主题非常契合,可以更加详细精准地分析问题、得到结论。在我的文章中,采用空间杜宾模型不仅罕见、吸引评委,而且该模型最大的有点是它可以测度出京津冀相关因素的变化对本城市PM2.5的直接效应和对其它城市PM2.5的空间溢出效应,实现精准拆分,进而得出源解析中的相关因素对本城市和对其他周围地区的影响。图片图片

图片


文章分类: 竞赛经验
分享到:
QQ:258506508                                     联系电话:020-000000    000-000000                                   联系邮箱:xxx@.co.m                                     联系地址:XXX省XXX市XXX县XXX路