基于熵权法的TOPSIS
层次分析的局限¶
- 决策层不能太多,容易导致判断矩阵和一致矩阵差异可能很大
- 如果决策层的指标的数据是已知的,如何利用数据是的评价更加准确?
引例:给考高数的同学打分¶
- 一个比较好的想法,构造评分的公式
\[\frac{x-min}{max-min}\quad max:理论最高分,min:理论最低分\]
- 局限:许多指标不存在理论上的最大值和最小值(例如:GDP增速)
- max改为最高成绩,min改为最低成绩
增加指标个数¶
- 指标类型:
- 极大性指标(效益型指标)
- 极小性指标(成本型指标)
如何统一指标类型?¶
极小值指标¶
指标正向化:\(max-x\)(将极小型转化为极大型)
中间型指标¶
\[M=max\{|x_{i}-x_{best}|\}\]
\[x_{i}=1-\frac{|x_{i}-x_{best}|}{M}\]
区间型指标¶
\[M=max\{a-min[x_{i}],max[x_{i}]-b\}\]
\[x_{i}=\begin{cases}1-\frac{a-x}{M}&x<a\\1&a≤x≤b\\1-\frac{x-b}{M}&x>b\end{cases}\]
标准化处理¶
对正向化的矩阵进行标准化处理
\[\left(\begin{matrix}z_{11}&z_{12}&...&z_{1m}\\z_{21}&z_{22}&...&z_{2m}\\z_{31}&z_{32}&...&z_{3m}\\...\end{matrix}\right)\]
将标准化后的矩阵记为A,则A中每个元素
\[a_{ij}=\frac{x_{ij}}{\sqrt{\sum_{i=1}^{n}x_{ij}^{2}}}\]
计算得分¶
- 构造计算的公式\(\frac{x-min}{max-min}=\frac{x-min}{(max-x)+(x-min)}\)
- 可以看作:\(\frac{x与最小值的距离}{x与最大值的距离+x与最小值的距离}\)
基于熵权法的TOPSIS¶
- 是一种客观赋权方式
- 原理:指标的变异程度越小,所反映的信息量越少,其对应权值越低
信息量如何度量?¶
- 越有可能发生的事情,信息量越少
- 用概率来衡量事情发生的可能性大小
- 使用一个函数构建
\[I(x)=-\ln\left(p(x)\right)\]
信息熵¶
- 假设x表示事件X发生的某种情况,p(x)表示这种情况的发生概率,可以定义\(I(x)=-\ln{(p(x))}\),因为\(0≤p(x)≤1\),所以\(I(x)≥0\),如果事件X可能发生的情况分别为\(x_{1},x_{2}\dots x_{n}\)
- 可以定义事件X的信息熵为
\[H(X)=\sum_{i=1}^{n}\left[p(x_{i})I(x_{i})\right]=-\sum_{i=1}^{n}\left[p(x_{i})\ln(p(x_{i}))\right]\]
信息熵本质是对信息量的期望值
定理:当所有事件发生可能性相等(所有样本指标相同)时,信息熵越大,最大值为\(\ln n\)
信息熵越大,熵权值越小
熵权法计算步骤¶
- 假设有n个评价对象,m个评价指标(已经正向化)
标准化¶
- 判断矩阵中是否有负数
- 若没有:使用\(z_{ij}=\frac{x_{ij}}{\sqrt{\sum_{i=1}^{n}}{x_{ij}^{2}}}\)
- 若有负数:使用\(z_{ij}=\frac{x_{ij}-min\{x_{1j},x_{2j},\dots,x_{nj}\}}{max\{x_{1j},x_{2j},\dots,x_{nj}\}-min\{x_{1j},x_{2j},\dots,x_{nj}\}}\)
概率计算¶
\[p_{ij}=\frac{z_{ij}}{\sum_{i=1}^{n}z_{ij}}\]
计算信息熵¶
- 对于第j个指标,计算公式为
\[e_{j}=-\frac{1}{\ln n}\sum_{i=1}^{n}p(x_{i})\ln(p(x_{i}))\]
- 信息效用值\(d_j=1-e_{j}\)
- 对信息效用值进行归一化得到权重
\[W_{i}=\frac{d_{i}}{\sum_{j=1}^{m} d_{j}}(i=1,2\dots,m)\]