Azərbaycan  AzərbaycanDeutschland  DeutschlandLietuva  LietuvaMalta  Maltaශ්‍රී ලංකාව  ශ්‍රී ලංකාවTürkmenistan  TürkmenistanTürkiyə  TürkiyəУкраина  Украина
Unterstützung
www.datawiki.de-de.nina.az
  • Heim

Die Kerndichteschätzung auch Parzen Fenster Methode englisch kernel density estimation KDE ist ein statistisches Verfahr

Kerndichteschätzer

  • Startseite
  • Kerndichteschätzer
Kerndichteschätzer
www.datawiki.de-de.nina.azhttps://www.datawiki.de-de.nina.az

Die Kerndichteschätzung (auch Parzen-Fenster-Methode;englisch kernel density estimation, KDE) ist ein statistisches Verfahren zur Schätzung der Wahrscheinlichkeitsverteilung einer Zufallsvariablen.

In der klassischen Statistik geht man davon aus, dass statistische Phänomene einer bestimmten Wahrscheinlichkeitsverteilung folgen und dass sich diese Verteilung in Stichproben realisiert. In der nichtparametrischen Statistik werden Verfahren entwickelt, um aus der Realisierung einer Stichprobe die zu Grunde liegende Verteilung zu identifizieren. Ein bekanntes Verfahren ist die Erstellung eines Histogramms. Nachteil dieses Verfahrens ist, dass das resultierende Histogramm nicht stetig ist. Vielfach ist aber davon auszugehen, dass die zu Grunde liegende Verteilung eine stetige Dichtefunktion hat, etwa die Verteilung von Wartezeiten in einer Schlange oder der Rendite von Aktien.

Die im Folgenden beschriebenen Kerndichteschätzer sind dagegen Verfahren, die eine stetige Schätzung der unbekannten Verteilung ermöglichen. Genauer: Ein Kerndichteschätzer ist ein gleichmäßig konsistenter, stetiger Schätzer der Dichte eines unbekannten Wahrscheinlichkeitsmaßes durch eine Folge von Dichten.

Beispiel

Im folgenden Beispiel wird die Dichte einer Standardnormalverteilung (schwarz gestrichelt) durch Kerndichteschätzung geschätzt. In der konkreten Situation des Schätzens ist diese Kurve natürlich unbekannt und soll durch die Kerndichteschätzung geschätzt werden. Es wurde eine Stichprobe (vom Umfang 100) generiert, die gemäß dieser Standardnormalverteilung verteilt ist. Mit verschiedenen Bandbreiten h{\displaystyle h} wurde dann eine Kerndichteschätzung durchgeführt. Man sieht deutlich, dass die Qualität des Kerndichteschätzers von der gewählten Bandbreite abhängt. Eine zu kleine Bandbreite erscheint „verwackelt“, während eine zu große Bandbreite zu „grob“ ist.

Kerne

Mit Kern wird die stetige Lebesgue-Dichte k{\displaystyle k} eines fast beliebig zu wählenden Wahrscheinlichkeitsmaßes K{\displaystyle K} bezeichnet. Mögliche Kerne sind etwa:

  • Gauß-Kern k(t):=12πexp⁡(−12t2){\displaystyle k(t):={\frac {1}{\sqrt {2\pi }}}\exp \left(-{\frac {1}{2}}t^{2}\right)}
  • Cauchy-Kern k(t):=1π(1+t2){\displaystyle k(t):={\frac {1}{\pi (1+t^{2})}}}
  • Picard-Kern k(t):=12exp⁡(−|t|){\displaystyle k(t):={\frac {1}{2}}\exp(-|t|)}
  • Epanechnikov-Kern k(t):={34(1−t2),wenn t∈[−1;1]0,sonst.{\displaystyle k(t):={\begin{cases}{\frac {3}{4}}(1-t^{2}),&{\text{wenn }}t\in [-1;1]\\0,&{\text{sonst.}}\end{cases}}}

Diese Kerne sind Dichten von ähnlicher Gestalt wie der abgebildete Cauchy-Kern. Der Kerndichteschätzer stellt eine Überlagerung in Form der Summe entsprechend skalierter Kerne dar, die abhängig von der Stichprobenrealisierung positioniert werden. Die Skalierung und ein Vorfaktor gewährleisten, dass die resultierende Summe wiederum die Dichte eines Wahrscheinlichkeitsmaßes darstellt. Der folgenden Abbildung wurde eine Stichprobe vom Umfang 10 zu Grunde gelegt, die als schwarze Kreise dargestellt ist. Darüber sind die Cauchy-Kerne (grün gestrichelt) dargestellt, aus deren Überlagerung der Kerndichteschätzer resultiert (rote Kurve).

Der Epanechnikov-Kern ist dabei derjenige Kern, der unter allen Kernen die mittlere quadratische Abweichung des zugehörigen Kerndichteschätzers minimiert.

Der Kerndichteschätzer

Definition

Ist x1,…,xn∈R{\displaystyle x_{1},\ldots ,x_{n}\in \mathbb {R} } eine Stichprobe, k{\displaystyle k} ein Kern, so wird der Kerndichteschätzer zur Bandbreite h>0{\displaystyle h>0} definiert als:

f~n:R→R+{\displaystyle {\tilde {f}}_{n}:\mathbb {R} \to \mathbb {R} _{+}}
f~n(t)=1n∑j=1nkh(t−xj)=1nh∑j=1nk(t−xjh){\displaystyle {\tilde {f}}_{n}(t)={\frac {1}{n}}\sum _{j=1}^{n}k_{h}(t-x_{j})={\frac {1}{nh}}\sum _{j=1}^{n}k\left({\frac {t-x_{j}}{h}}\right)}.

Satz von Nadaraya

Die Wahl der Bandbreite h{\displaystyle h} ist entscheidend für die Qualität der Approximation. Mit entsprechender, in Abhängigkeit vom Stichprobenumfang gewählter Bandbreite, konvergiert die Folge f~n{\displaystyle {\tilde {f}}_{n}} der Kerndichteschätzer fast sicher gleichmäßig gegen die Dichte des unbekannten Wahrscheinlichkeitsmaßes. Diese Aussage wird im Satz von Nadaraya konkretisiert. Der Satz liefert die Aussage, dass mit entsprechend gewählter Bandbreite eine beliebig gute Schätzung der unbekannten Verteilung durch Wahl einer entsprechend großen Stichprobe möglich ist:

Sei k{\displaystyle k} ein Kern von beschränkter Variation. Die Dichte f{\displaystyle f} eines Wahrscheinlichkeitsmaßes sei gleichmäßig stetig. Mit 0<α<12{\displaystyle 0<\alpha <{\tfrac {1}{2}}} und c>0{\displaystyle c>0} seien für n∈N{\displaystyle n\in \mathbb {N} } die Bandbreiten h(n)=cnα{\displaystyle h(n)={\tfrac {c}{n^{\alpha }}}} definiert. Dann konvergiert die Folge der Kerndichteschätzer f~n{\displaystyle {\tilde {f}}_{n}} mit Wahrscheinlichkeit 1 gleichmäßig gegen f{\displaystyle f}, d. h.

P(limn→∞supt∈R|f~n(t)−f(t)|=0)=1{\displaystyle P\left(\lim _{n\to \infty }\sup _{t\in \mathbb {R} }|{\tilde {f}}_{n}(t)-f(t)|=0\right)=1}.

Anwendung

Die Kerndichteschätzung wird von Statistikern seit etwa 1950 eingesetzt und wird in der Ökologie häufig zur Beschreibung des Aktionsraumes eines Tieres verwendet, seitdem diese Methode in den 1990ern in den Wissenschaftszweig Einzug hielt. Damit kann die Wahrscheinlichkeit errechnet werden, mit der ein Tier sich in einem bestimmten räumlichen Bereich aufhält. Aktionsraum-Voraussagen werden durch farbige Linien (z. B. Isolinien) dargestellt. Diese Anwendung liegt auch der seit etwa 2010 üblichen „Heatmap“-Visualisierung des Aufenthaltsorts von Mannschaftsspielern (z. B. im Fußball) während der Spielzeit zugrunde.

Siehe auch

  • Empirische Verteilungsfunktion

Einzelnachweise

  1. E. Parzen: On estimation of a probability density function and mode. In: Ann. Math. Stat., 33, 1962, S. 1065–1076. doi:10.1214/aoms/1177704472
  2. É. Nadaraya: On Non-Parametric Estimates of Density Functions and Regression Curves. In: Theory of Probability & Its Applications. Band 10, Nr. 1, 1. Januar 1965, ISSN 0040-585X, S. 186–190, doi:10.1137/1110024 (siam.org [abgerufen am 24. Juni 2016]). 
  3. Arthur R. Rodgers, John G. Kie: HRT: Home Range Tools for ArcGIS®. User’s Manual. 10. August 2011, S. 6 ff. (lakeheadu.ca [PDF; abgerufen am 24. Oktober 2011]). 

Autor: www.NiNa.Az

Veröffentlichungsdatum: 27 Jun 2025 / 20:40

wikipedia, wiki, deutsches, deutschland, buch, bücher, bibliothek artikel lesen, herunterladen kostenlos kostenloser herunterladen, MP3, Video, MP4, 3GP, JPG, JPEG, GIF, PNG, Bild, Musik, Lied, Film, Buch, Spiel, Spiele, Mobiltelefon, Mobil, Telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, komputer, Informationen zu Kerndichteschätzer, Was ist Kerndichteschätzer? Was bedeutet Kerndichteschätzer?

Die Kerndichteschatzung auch Parzen Fenster Methode englisch kernel density estimation KDE ist ein statistisches Verfahren zur Schatzung der Wahrscheinlichkeitsverteilung einer Zufallsvariablen In der klassischen Statistik geht man davon aus dass statistische Phanomene einer bestimmten Wahrscheinlichkeitsverteilung folgen und dass sich diese Verteilung in Stichproben realisiert In der nichtparametrischen Statistik werden Verfahren entwickelt um aus der Realisierung einer Stichprobe die zu Grunde liegende Verteilung zu identifizieren Ein bekanntes Verfahren ist die Erstellung eines Histogramms Nachteil dieses Verfahrens ist dass das resultierende Histogramm nicht stetig ist Vielfach ist aber davon auszugehen dass die zu Grunde liegende Verteilung eine stetige Dichtefunktion hat etwa die Verteilung von Wartezeiten in einer Schlange oder der Rendite von Aktien Die im Folgenden beschriebenen Kerndichteschatzer sind dagegen Verfahren die eine stetige Schatzung der unbekannten Verteilung ermoglichen Genauer Ein Kerndichteschatzer ist ein gleichmassig konsistenter stetiger Schatzer der Dichte eines unbekannten Wahrscheinlichkeitsmasses durch eine Folge von Dichten BeispielKerndichteschatzung Im folgenden Beispiel wird die Dichte einer Standardnormalverteilung schwarz gestrichelt durch Kerndichteschatzung geschatzt In der konkreten Situation des Schatzens ist diese Kurve naturlich unbekannt und soll durch die Kerndichteschatzung geschatzt werden Es wurde eine Stichprobe vom Umfang 100 generiert die gemass dieser Standardnormalverteilung verteilt ist Mit verschiedenen Bandbreiten h displaystyle h wurde dann eine Kerndichteschatzung durchgefuhrt Man sieht deutlich dass die Qualitat des Kerndichteschatzers von der gewahlten Bandbreite abhangt Eine zu kleine Bandbreite erscheint verwackelt wahrend eine zu grosse Bandbreite zu grob ist KerneKerndichteschatzung mit Cauchy Kern Mit Kern wird die stetige Lebesgue Dichte k displaystyle k eines fast beliebig zu wahlenden Wahrscheinlichkeitsmasses K displaystyle K bezeichnet Mogliche Kerne sind etwa Gauss Kern k t 12pexp 12t2 displaystyle k t frac 1 sqrt 2 pi exp left frac 1 2 t 2 right Cauchy Kern k t 1p 1 t2 displaystyle k t frac 1 pi 1 t 2 Picard Kern k t 12exp t displaystyle k t frac 1 2 exp t Epanechnikov Kern k t 34 1 t2 wenn t 1 1 0 sonst displaystyle k t begin cases frac 3 4 1 t 2 amp text wenn t in 1 1 0 amp text sonst end cases Diese Kerne sind Dichten von ahnlicher Gestalt wie der abgebildete Cauchy Kern Der Kerndichteschatzer stellt eine Uberlagerung in Form der Summe entsprechend skalierter Kerne dar die abhangig von der Stichprobenrealisierung positioniert werden Die Skalierung und ein Vorfaktor gewahrleisten dass die resultierende Summe wiederum die Dichte eines Wahrscheinlichkeitsmasses darstellt Der folgenden Abbildung wurde eine Stichprobe vom Umfang 10 zu Grunde gelegt die als schwarze Kreise dargestellt ist Daruber sind die Cauchy Kerne grun gestrichelt dargestellt aus deren Uberlagerung der Kerndichteschatzer resultiert rote Kurve Der Epanechnikov Kern ist dabei derjenige Kern der unter allen Kernen die mittlere quadratische Abweichung des zugehorigen Kerndichteschatzers minimiert Der KerndichteschatzerDefinition Ist x1 xn R displaystyle x 1 ldots x n in mathbb R eine Stichprobe k displaystyle k ein Kern so wird der Kerndichteschatzer zur Bandbreite h gt 0 displaystyle h gt 0 definiert als f n R R displaystyle tilde f n mathbb R to mathbb R f n t 1n j 1nkh t xj 1nh j 1nk t xjh displaystyle tilde f n t frac 1 n sum j 1 n k h t x j frac 1 nh sum j 1 n k left frac t x j h right Satz von Nadaraya Die Wahl der Bandbreite h displaystyle h ist entscheidend fur die Qualitat der Approximation Mit entsprechender in Abhangigkeit vom Stichprobenumfang gewahlter Bandbreite konvergiert die Folge f n displaystyle tilde f n der Kerndichteschatzer fast sicher gleichmassig gegen die Dichte des unbekannten Wahrscheinlichkeitsmasses Diese Aussage wird im Satz von Nadaraya konkretisiert Der Satz liefert die Aussage dass mit entsprechend gewahlter Bandbreite eine beliebig gute Schatzung der unbekannten Verteilung durch Wahl einer entsprechend grossen Stichprobe moglich ist Sei k displaystyle k ein Kern von beschrankter Variation Die Dichte f displaystyle f eines Wahrscheinlichkeitsmasses sei gleichmassig stetig Mit 0 lt a lt 12 displaystyle 0 lt alpha lt tfrac 1 2 und c gt 0 displaystyle c gt 0 seien fur n N displaystyle n in mathbb N die Bandbreiten h n cna displaystyle h n tfrac c n alpha definiert Dann konvergiert die Folge der Kerndichteschatzer f n displaystyle tilde f n mit Wahrscheinlichkeit 1 gleichmassig gegen f displaystyle f d h P limn supt R f n t f t 0 1 displaystyle P left lim n to infty sup t in mathbb R tilde f n t f t 0 right 1 AnwendungDie Kerndichteschatzung wird von Statistikern seit etwa 1950 eingesetzt und wird in der Okologie haufig zur Beschreibung des Aktionsraumes eines Tieres verwendet seitdem diese Methode in den 1990ern in den Wissenschaftszweig Einzug hielt Damit kann die Wahrscheinlichkeit errechnet werden mit der ein Tier sich in einem bestimmten raumlichen Bereich aufhalt Aktionsraum Voraussagen werden durch farbige Linien z B Isolinien dargestellt Diese Anwendung liegt auch der seit etwa 2010 ublichen Heatmap Visualisierung des Aufenthaltsorts von Mannschaftsspielern z B im Fussball wahrend der Spielzeit zugrunde Siehe auchEmpirische VerteilungsfunktionEinzelnachweiseE Parzen On estimation of a probability density function and mode In Ann Math Stat 33 1962 S 1065 1076 doi 10 1214 aoms 1177704472 E Nadaraya On Non Parametric Estimates of Density Functions and Regression Curves In Theory of Probability amp Its Applications Band 10 Nr 1 1 Januar 1965 ISSN 0040 585X S 186 190 doi 10 1137 1110024 siam org abgerufen am 24 Juni 2016 Arthur R Rodgers John G Kie HRT Home Range Tools for ArcGIS User s Manual 10 August 2011 S 6 ff lakeheadu ca PDF abgerufen am 24 Oktober 2011

Neueste Artikel
  • Juni 21, 2025

    Gefängnis

  • Juni 21, 2025

    Gefängnisstrafe

  • Juni 26, 2025

    Gefängnisausbruch

  • Juni 24, 2025

    Gefährdungsdelikt

  • Juni 24, 2025

    Gefährdungsbeurteilung

www.NiNa.Az - Studio

    Kontaktieren Sie uns
    Sprachen
    Kontaktieren Sie uns
    DMCA Sitemap
    © 2019 nina.az - Alle Rechte vorbehalten.
    Copyright: Dadash Mammadov
    Eine kostenlose Website, die Daten- und Dateiaustausch aus der ganzen Welt ermöglicht.
    Spi.