ミンコフスキー距離の意味と、関連する距離の性質

最終更新日 2019/05/12
ミンコフスキー距離

ミンコフスキー距離と、その特殊な場合であるユークリッド距離、チェビシェフ距離、マンハッタン距離について解説します。

ミンコフスキー距離とは

2つのベクトル $\overrightarrow{x}=(x_1,x_2,\dots,x_n)$、$\overrightarrow{y}=(y_1,y_2,\dots,y_n)$ がどれくらい離れているかを表す量がいくつかあります。

その中で、
$\left(\displaystyle\sum_{k=1}^n|x_k-y_k|^{p}\right)^{\frac{1}{p}}$
をミンコフスキー距離と言います。

ただし、$p$ は $1$ より大きい数(パラメータ)とします。

ユークリッド距離

ミンコフスキー距離で $p=2$ としたものはユークリッド距離と呼ばれます。

ミンコフスキー距離で $p=2$ とすると、
$\sqrt{\displaystyle\sum_{k=1}^n(x_k-y_k)^{2}}$
となります。

「各成分の差の二乗和のルート」という、よく見る普通の距離です。
参考:ユークリッド空間の意味を分かりやすく説明する

マンハッタン距離

ミンコフスキー距離で $p=1$ としたものはマンハッタン距離と呼ばれます。

ミンコフスキー距離で $p=1$ とすると、
$\displaystyle\sum_{k=1}^n|x_k-y_k|$
となります。

「各成分の差の絶対値の和」です。ユークリッド距離の次に有名な距離ではないでしょうか。

チェビシェフ距離

チェビシェフ距離は、
$\displaystyle\max_{k}|x_k-y_k|$
で定義されます。最も離れている成分についての差の絶対値です。

チェビシェフ距離は、ミンコフスキー距離で $p=\infty$ としたものに対応します。

これを導出してみます。

$|x_k-y_k|$ が最大となるような $k$ を $k_0$ と書くと、
$\left(\displaystyle\sum_{k=1}^n|x_k-y_k|^{p}\right)^{\frac{1}{p}}\\
=|x_{k_0}-y_{k_0}|\left(\displaystyle\sum_{k=1}^n\dfrac{|x_k-y_k|^{p}}{|x_{k_0}-y_{k_0}|^p}\right)^{\frac{1}{p}}$
と変形できますが、和の各項は全て $1$ 以下で、$k=k_0$ のときには $1$ なので、
和を $\dfrac{1}{p}$ 乗したものは $p\to\infty$ で $1$ に近づいていきます。

つまり、$p\to\infty$ で、ミンコフスキー距離は $|x_{k_0}-y_{k_0}|$ に収束します。

各距離の性質

ミンコフスキー距離では、$p$ が大きいほど「差が大きい成分を重視して、差が小さい成分は無視する」という傾向があります。

・$p=1$ のマンハッタン距離は「どの成分も平等に見る」
・$p=\infty$ のチェビシェフ距離は「差が一番大きい成分以外は完全無視する」
・$p=2$ のユークリッド距離はその中間くらい
と言えます。

三角不等式

ミンコフスキー距離において、三角不等式が成立します。

つまり、$D_p(\overrightarrow{x},\overrightarrow{y})=\left(\displaystyle\sum_{k=1}^n|x_k-y_k|^{p}\right)^{\frac{1}{p}}$
とおくと、全ての $\overrightarrow{x},\overrightarrow{y},\overrightarrow{z}$ に対して
$D_p(\overrightarrow{x},\overrightarrow{y})+D_p(\overrightarrow{y},\overrightarrow{z})\geq D_p(\overrightarrow{x},\overrightarrow{z})$
が成立します。

これをミンコフスキーの不等式と言うことがあります。

次回は マハラノビス距離の意味を2次元の場合で理解する を解説します。

ページ上部へ戻る