ローレンツ曲線とジニ係数

ローレンツ曲線が右下にあるほど格差が大きい。
ジニ係数が大きいほど格差が大きい。

ローレンツ曲線とは

曲線が $(x,y)$ を通る $\iff$「上位 $100x$ %の人で全体の $100y$ %を占める」
というように定めた曲線をローレンツ曲線と言います。

例えば、国民の所得の分布に対して書いたローレンツ曲線が $(0.8,0.3)$ を通る時、
上位 $80$ %の人が全体の $30$ %の富を持っている
ことを表します。

ローレンツ曲線の両端は必ず $(0,0)$ と $(1,1)$ です(パーセントで表す場合は $(1,1)$ ではなく $(100,100)$ になります)。また、ローレンツ曲線は右上がりです(単調非減少です)。

ローレンツ曲線と格差

ローレンツ曲線は右下にあればあるほど格差が大きいと言えます。

ローレンツ曲線と格差

実際、
上位 $80$ %の人が全体の $30$%の富を持っている
という状況の方が
上位 $80$ %の人が全体の $60$%の富を持っている
という状況よりも格差が大きいですね。

最も偏っていない状況は、全ての人が同じ富を持っている状況です。つまり、全ての
$x$ に対して
「上位 $x$ %の人で全体の $x$ %を占める」
が成立する場合なので、ローレンツ曲線は $y=x$ になります。この線分を均等分配線と言います。

ローレンツ曲線が均等分配線から右下に離れれば離れるほど格差が大きい分布となります。

ジニ係数

「どれくらい格差があるか」

「ローレンツ曲線がどれくらい右下にあるか」
で表せることが分かりました。

「ローレンツ曲線がどれくらい右下にあるか」を具体的な数字で表現したものがジニ係数です。

ジニ係数の定義と意味

ジニ係数は、
均等分配線とローレンツ曲線で囲まれた部分の面積÷直角二等辺三角形 $OAB$ の面積
で定義されます。
(直角二等辺三角形 $OAB$ の面積は $\dfrac{1}{2}$ です)

・ジニ係数は $0$ 以上 $1$ 以下です。
・完全に平等なとき、つまりローレンツ曲線が均等分配線と一致するときは、ジニ係数は $0$ になります。
・最も格差が大きいとき、つまりローレンツ曲線が右下に張り付いているときは、ジニ係数は $1$ になります。

次:Jaccard係数、Dice係数、Simpson係数
前:平均と分散を逐次的に計算するアルゴリズム

スポンサーリンク

スポンサーリンク

誤植がございましたら @mathwordsnet までご連絡をお願いいたします。
ページ上部へ戻る