In der Mathematik ist die Wasserstein-Metrik ein zwischen Wahrscheinlichkeitsverteilungen definiert auf einer gegebenen metrischen Raum M. Abstandsfunktion
Intuitiv, wenn jede Verteilung wird als eine Einheit Menge von "Schmutz" auf M gestapelt betrachtet, ist die Metrik der minimale "Kosten" des Drehens einen Stapel in die andere, von der angenommen wird, um die Menge an Schmutz, die zu Zeiten bewegt werden muss sein die Distanz bewegt werden muß. Wegen dieser Analogie wird die Metrik in der Informatik wie die Erde mover der Abstand bekannt.
Der Name "Wasserstein / Vasershtein Abstand" wurde von RL Dobrushin im Jahr 1970 ins Leben gerufen, nachdem der russische Mathematiker Leonid Nasonovich Vasershtein, die das Konzept im Jahr 1969. Die meisten englischsprachigen Publikationen vorgestellt benutzen Sie deutsche Rechtschreibung "Wasserstein".
Definition
Lassen Sie ein metrischer Raum, für die jedes Wahrscheinlichkeitsmaß auf M ist eine Radon Maßnahme. Für p ≥ 1, lassen Pp bezeichnen die Sammlung aller Wahrscheinlichkeitsmaße & mgr; auf M mit endlichen p Moment: für einige x0 in M,
Dann mgr; p die Wasserstein Abstand zwischen zwei Wahrscheinlichkeitsmaße und ν in Pp ist definiert als
wobei Γ bezeichnet die Gesamtheit aller Maßnahmen auf die M × M Rn u und ν auf der ersten und zweiten Faktoren sind. (Der Satz Γ wird auch als die Menge aller Kopplungen von μ und ν.)
Der obige Abstand wird üblicherweise bezeichnet Wp oder lp. Der Rest dieses Artikels wird die Wp-Notation verwenden.
Der Wasserstein Metrik kann äquivalent durch definiert werden,
wobei E den Erwartungswert einer Zufallsvariablen Z und das Infimum über alle gemeinsamen Verteilungen der Zufallsvariablen X und Y mit Rn μ und ν jeweils entnommen.
Anwendungen
Das Wasserstein-Metrik ist ein natürlicher Weg, um die Wahrscheinlichkeitsverteilungen der beiden Variablen X und Y, wobei eine Variable von der durch kleine, nicht einheitliche Störungen abgeleitet vergleichen.
In der Informatik, zum Beispiel der Metrik W1 wird weithin verwendet, um diskrete Verteilungen zu vergleichen, zB die Farbhistogramme von zwei digitalen Bildern; siehe Bagger-Distanz für weitere Details.
Immobilien
Metric Struktur
Es kann gezeigt werden, dass Wp erfüllt alle Axiome der Metrik auf Pp. Darüber hinaus ist die Konvergenz in Bezug auf Wp entspricht der üblichen schwachen Konvergenz von Maßnahmen und Konvergenz der ersten p-ten Momente.
Dual-Darstellung W1
Die folgende Darstellung der Dual-W1 ist ein Spezialfall des Dualitätssatz von Kantorovich und Rubinstein: wenn μ und ν haben Unterstützung begrenzt,
wo Lip bezeichnet die minimal Lipschitz-Konstante für f.
Vergleichen Sie dies mit der Definition des Radon-Messdaten:
Wenn die Metrik d wird durch eine Konstante C begrenzt wird, dann
und so die Konvergenz in der Radon-Metrik bedeutet Konvergenz im Wasserstein-Metrik, aber nicht umgekehrt.
Trennbarkeit und Vollständigkeit
Für jede p ≥ 1 ist, ist die metrischen Raum (Pp, Wp) zerlegbar, und ist abgeschlossen, wenn zerlegbar und vollständig sind.
Kommentare - 0