
面板数据如何进行熵值法、熵权TOPSIS综合评价等研究?这篇讲透了!
熵权TOPSIS法核心在于TOPSIS,但在计算数据时,首先会利用熵值法计算得到各评价指标的权重,并且将评价指标数据与权重相乘,得到新的数据,利用新数据进行TOPSIS法研究。数据年份差异显著,需考虑时间波动对权重的影响分别筛选出某年数据后,基于100家公司即100个数字看成1个序列,对每一年数据重复一次熵值法操作,将各年份权重结果汇总并计算平均值。熵值法的原理是利用‘熵’来计算权重,‘熵’用来标
在SPSSAU后台提问中,有很多同学会问到关于面板数据分析的问题。比如 “面板数据如何进行熵值法分析?熵权TOPSIS法?因子分析、主成分分析、耦合协调度、障碍度等模型怎么处理面板数据?”在科研和数据分析中,面板数据(Panel Data)是一种常见的数据类型,它同时包含时间维度和个体维度的信息。那么今天就和大家介绍下关于面板数据分析的这些问题。
一、面板数据熵值法
熵值法作为一种客观赋权方法,在面板数据分析中应用广泛。然而,面板数据(同时包含时间维度和个体维度)的特殊性常让研究者困惑:如何正确应用熵值法?本文将结合SPSSAU操作,详解两种方法——“一次法”与“多次法”,并附实操案例。
1、数据格式整理
面板数据从数据格式上,应该类似下图,即有2列数据分别标识公司和年份,比如当前为100家公司分别5年的指标数据,那么就有100*5行的数据,如下图:
将数据整理成如上格式后,上传至分析软件SPSSAU,进行面板数据熵值法分析。
2、面板数据熵值法的两种方法
熵值法的原理是利用‘熵’来计算权重,‘熵’用来标识信息的不确定性情况,熵越大意味着不确定性越大->信息量越小->权重越小,这是熵值法的原理。
- 从原理角度上看:
面板数据要想计算出5个指标的权重,也是利用‘熵’来计算,也即说明只要能计算出数据的‘熵’值,即可得到权重。而‘熵值’的计算上,并不会考虑是否为面板数据,因而从原理角度,面板数据与普通数据完全一致,直接放入分析即可。
- 从分析角度上看:
针对面板数据,通常有两种做法,分别是做1次,分别重复多次再汇总,如下表格所示:
- 方法1:一次法
√ 核心思想:忽略面板数据的时间维度,将所有年份和个体的数据视为一个整体进行分析。√ 使用场景:数据波动较小、时间差异对权重影响可忽略时。此种做法非常常见,即完全不考虑是否为面板数据,在原理上并没有任何问题。因为熵值法计算权重的原理是利用‘熵’值信息,相当于把100家公司5年即500个数字当成一个序列,计算该序列的‘熵’用于判断该500个数字的不确定性情况,最终得到权重。
- 方法2:多次法
√ 核心思想:按年份分别进行熵值法分析,最终取各指标权重的平均值。√ 适用场景:数据年份差异显著,需考虑时间波动对权重的影响分别筛选出某年数据后,基于100家公司即100个数字看成1个序列,对每一年数据重复一次熵值法操作,将各年份权重结果汇总并计算平均值。
接下来将通过一个面板数据熵值法的案例进行介绍如何具体操作与分析。
3、案例分析
案例数据为9家公司连续5年的5个财务指标的数据进行熵值法,数据格式整理如下图,并且分别以整体做1次,和分别5年做5次进行分析。
- 方法1:一次法
如果仅做1次分析,直接将处理后的(正向化逆向化等)5个指标直接放入分析框中进行分析,操作如下图:
SPSSAU输出权重计算结果如下:
- 方法2:多次法
分别筛选出2008年的数据做1次分析,并且重复另外4次,关于SPSSAU进行样本筛选,如下截图:
分别筛选5年的数据进行分析,每次均得到5个指标的权重,然后求平均值得到平均权重,汇总整理如下表所示:
特别提示:上述处理从原理上可行,并且此种做法是出于分析考虑,这种做法考虑了不同年份时数字的波动差异性。
- 两种方法权重结果对比
一次法和多次法权重值对比如下表:
通过对两种方法的对比发现,尽管两种方法所求出的指标权重不完全相同,但是两种指标所呈现的差异较小。
【提示】大部分文献都直接使用“一次法”进行面板数据熵值法权重计算。
- 面板数据熵值法综合得分计算
在SPSSAU进行分析时,勾选【综合得分】按钮,会自动保存综合得分,如下图:
将数据下载到本地,最终将9家公司5年的综合得分整理成如下表格进行后续分析。
【补充】SPSSAU提供熵值法算法手册,部分如下图:
二、面板数据熵权TOPSIS
面板数据进行熵权TOPSIS法分析时,也会讨论应该如何分析。但与熵值法不同在于,熵值法目的是计算指标权重,而熵权TOPSIS法是进行综合评价,需要考虑的情况会更复杂一些。
熵权TOPSIS法的基本流程:熵权TOPSIS法核心在于TOPSIS,但在计算数据时,首先会利用熵值法计算得到各评价指标的权重,并且将评价指标数据与权重相乘,得到新的数据,利用新数据进行TOPSIS法研究。所以整个过程被分为两步,第一步熵值法计算指标权重;第二步TOPSIS法进行综合评价。
1、熵值法计算指标权重
关于面板数据进行熵值法权重计算,上文已经介绍两种方法,“一次法”和“多次法”,且“一次法”是绝大部分文献使用的方法。对于熵权TOPSIS法中第一步计算指标权重,通常是使用“一次法”,即直接对所有数据进行权重计算。这样做的优点是权重稳定,跨年可比性强,适合综合评价整个期间的表现。若“多次法”分年份进行熵值法缺点在于权重不同可能不可比。
那么在SPSSAU中,依旧使用上文的熵值法案例数据,我们首先进行熵值法,“一次法”得到各指标权重结果如下:
2、TOPSIS法综合评价
得到权重后进行第二步,TOPSIS法综合评价。此时我们需要筛选不同的年份依次进行TOPSIS法分析,同时将第一步得到的指标权重代入TOPSIS法计算中,SPSSAU软件操作如下图:
SPSSAU输出2008年TOPSIS法评价结果如下:
依次筛选每年数据进行分析后,可以汇总相对接近度C值,整理成如下表格进行分析:
以上两步完成面板数据熵权TOPSIS法的分析。
【提示】上文介绍的分析步骤为大部分文献所采纳,不同文献计算步骤可能不同,比如还可以直接对所有数据进行熵权TOPSIS法,得到整体分析结果,直接比较各对象综合得分;或者依次对每年数据进行熵权TOPSIS法,最后汇总结果。这两种方法与截面数据分析一样,可直接使用SPSSAU【熵权TOPSIS】进行分析。
点击查看:熵权TOPSIS法帮助手册
三、面板数据其他方法分析
举一反三,其他方法如因子分析、主成分分析、耦合协调度、障碍度等进行面板数据分析时,在SPSSAU中都可以直接进行分析,注意面板数据格式即可;也可参考相关文献研究方法,筛选年份分析后进行汇总。
更多推荐
所有评论(0)