Azərbaycan  AzərbaycanDeutschland  DeutschlandLietuva  LietuvaMalta  Maltaශ්‍රී ලංකාව  ශ්‍රී ලංකාවTürkmenistan  TürkmenistanTürkiyə  TürkiyəУкраина  Украина
Unterstützung
www.datawiki.de-de.nina.az
  • Heim

Ein Histogramm von ἱστός Mast Balken ist eine grafische Darstellung der Häufigkeitsverteilung kardinal skalierter Merkma

Häufigkeitsdichte

  • Startseite
  • Häufigkeitsdichte
Häufigkeitsdichte
www.datawiki.de-de.nina.azhttps://www.datawiki.de-de.nina.az

Ein Histogramm (von ἱστός "Mast, Balken") ist eine grafische Darstellung der Häufigkeitsverteilung kardinal skalierter Merkmale. Es erfordert die Einteilung der Daten in Klassen, die eine konstante oder variable Breite haben können. Es werden direkt nebeneinanderliegende Rechtecke von der Breite der jeweiligen Klasse gezeichnet, deren Flächeninhalte die (relativen oder absoluten) Klassenhäufigkeiten darstellen. Die Höhe jedes Rechtecks stellt dann die (relative oder absolute) Häufigkeitsdichte dar, also die (relative oder absolute) Häufigkeit dividiert durch die Breite der entsprechenden Klasse.

Anwendung

Anwendung finden Histogramme in der beschreibenden Statistik und in der Bildverarbeitung. Man verwendet Histogramme beispielsweise dann,

  • wenn man den Verlauf der Häufigkeitsverteilung sehen möchte und nicht nur zusammenfassende Daten wie das arithmetische Mittel und die Standardabweichung,
  • wenn man vermutet, dass mehrere Faktoren einen Prozess beeinflussen, und man diese nachweisen will,
  • wenn man sinnvolle Spezifikationsgrenzen für einen Prozess definieren möchte.

In der physikalischen Forschung oder angewandten Gebieten (z. B. Analytik) werden gemessene Spektren als Histogramme dargestellt, siehe z. B. Vielkanalanalysator.

Konstruktion eines Histogramms

Folgende Schritte sind bei der Konstruktion eines Histogramms nötig:

  1. Wertemenge in Klassen aufteilen (Breite der Rechtecke festlegen)
  2. Absolute/Relative Klassenhäufigkeit bestimmen (Flächeninhalt der Rechtecke festlegen)
  3. Häufigkeitsdichte bestimmen (Höhe der Rechtecke festlegen)
  4. Histogramm grafisch darstellen

Einteilung in Klassen

Zur Konstruktion eines Histogramms wird der Wertebereich der Stichprobe in k aneinandergrenzende Intervalle geteilt, die Klassen. Dabei ist darauf zu achten, dass die Randklassen nicht offen sind. Das heißt, die erste und die letzte Klasse müssen eine untere bzw. obere Grenze besitzen. Die Klassen müssen nicht gleich breit sein. Allerdings vereinfachen zumindest im Mittelbereich gleich große Klassen die Interpretation. Über jede Klasse wird dann ein Rechteck errichtet, dessen Fläche proportional zur jeweiligen Klassenhäufigkeit ist. Im Histogramm entsprechen diese Klassen der Breite der einzelnen Rechtecke.

Bestimmung der Klassenhäufigkeit

Bei der Erstellung eines Histogramms gibt es zwei Vorgehensweisen: Die Klassenhäufigkeit spiegelt entweder einen absoluten oder einen relativen Wert wider. Der absolute Wert entspricht der Anzahl an Werten, die zu einer Klasse gehören. Der relative Wert hingegen drückt aus, wie viel Prozent der Werte einer Klasse angehören. Je nach Anwendungsfall kann sowohl das Arbeiten mit absoluten als auch mit relativen Werten Vorteile mit sich bringen. Im Histogramm entspricht die Klassenhäufigkeit dem Flächeninhalt der Rechtecke.

Bestimmung der Häufigkeitsdichte

Da die Fläche des j-ten Rechtecks gleich der Klassenhäufigkeit nj{\displaystyle n_{j}} ist, errechnet sich die Höhe des Rechtecks, die sogenannte Häufigkeitsdichte hj{\displaystyle h_{j}}, als Quotient nj/dj{\displaystyle n_{j}/d_{j}} der Klassenhäufigkeit nj{\displaystyle n_{j}} durch die Klassenbreite dj{\displaystyle d_{j}}. Dies wird unmittelbar klar, wenn man sich überlegt, dass die Fläche eines Rechtecks das Produkt aus Breite (Klassenbreite) und Höhe (Häufigkeitsdichte) ist. Die Klasse mit der größten Häufigkeitsdichte wird Modalklasse genannt. Sind die Klassen gleich breit, so sind Häufigkeitsdichte und absolute bzw. relative Häufigkeiten proportional zueinander. Die Höhen der Rechtecke sind in diesem Fall vergleichbar und (unter Beachtung der Klassenbreite als Proportionalitätsfaktor) als Häufigkeit interpretierbar.

Statistische Schwankung der Klassenhäufigkeit

Oft werden die ermittelten Klassenhäufigkeiten beim Wiederholen der Datenerfassung streuen. So stellt sich, beispielsweise bei einer Wahlprognose, die Frage nach der Präzision der erhobenen Zahlen. Die zu erwartende Schwankungsbreite der Klassenhäufigkeit strebt bei unbegrenzt wachsender Anzahl der Klassen gegen nj.{\displaystyle {\sqrt {n_{j}}}.}

Abschätzung der Anzahl der Klassen

Um ein Histogramm zeichnen zu können, muss eine genügend große Anzahl an Messwerten einen sinnvollen Verlauf ergeben. Eine falsche Einteilung der Klassen kann zu einer Fehlinterpretation des Histogramms führen. Für die Festlegung der Anzahl der Klassen bzw. Rechtecke existieren verschiedene Faustregeln:

Anzahl der Messungen Balkenzahl
<50 5 bis 7
50 bis 100 6 bis 10
100 bis 250 7 bis 12
>250 10 bis 20

Sturges-Regel

Gegebenenfalls kann man die Anzahl der Balken k{\displaystyle k} auch nach der -Regel berechnen:

k=1+log2⁡n≈1+3,3⋅log10⁡n{\displaystyle k=1+\log _{2}n\approx 1+3{,}3\cdot \log _{10}n}

Die Sturges-Regel hat den Nachteil, dass sie zum einen die Streuung nicht berücksichtigt. Zum anderen wählt sie die Klassenzahl zu klein für n>200{\displaystyle n>200} selbst im Fall einer (idealen) normalverteilten wahren Dichte.

Scott-Regel

Alternativ kann die Klassenbreite h{\displaystyle h} mit der Regel nach

h=3,49⋅σn3{\displaystyle h={\frac {3{,}49\cdot \sigma }{\sqrt[{3}]{n}}}}

Die Regel nach Scott ist so nur für normalverteilte Daten definiert. Für andere Fälle führte Scott Korrekturfaktoren in Abhängigkeit von Schiefe und Exzess ein.

Freedman-Regel

Nach Freedman und Diaconis

h=2⋅(Q3−Q1)n3.{\displaystyle h={\frac {2\cdot (Q_{3}-Q_{1})}{\sqrt[{3}]{n}}}.}

Dabei sind σ{\displaystyle \sigma } die Standardabweichung, n{\displaystyle n} die Anzahl der Messungen und Q3−Q1{\displaystyle Q_{3}-Q_{1}} der Interquartilsabstand.

Eigenschaften

Ein Histogramm ist eine flächenproportionale Darstellung der vorliegenden Häufigkeiten. Die Fläche eines Rechtecks entspricht c⋅f(xj){\displaystyle c\cdot f(x_{j})}, wobei f(xj){\displaystyle f(x_{j})\,} die relative Klassenhäufigkeit der Klasse j{\displaystyle j\,} und c{\displaystyle c\,} ein Proportionalitätsfaktor ist.

Ist c{\displaystyle c\,} gleich dem Stichprobenumfang, das heißt c=n{\displaystyle c=n\,}, so ist die Fläche eines jeden Rechtecks gleich der absoluten Klassenhäufigkeit. Das Histogramm wird in diesem Fall, in dem die Summe der Flächeninhalte der Rechtecke dem Stichprobenumfang n{\displaystyle n} entspricht, absolut genannt. Werden zur Konstruktion des Histogramms exakt die relativen Klassenhäufigkeiten verwendet (c=1{\displaystyle c=1\,}), wird das Histogramm als relativ oder normiert bezeichnet. Da die Flächeninhalte der Rechtecke nun den relativen Klassenhäufigkeiten entsprechen, summieren sich die Flächeninhalte in diesem Fall zu 1.

Bei einem Histogramm grenzen die Rechtecke im Gegensatz zum Säulendiagramm direkt aneinander, das heißt, es existieren keine Abstände zwischen ihnen. Denn die Breite der Rechtecke entspricht den gebildeten Intervallen (Klassen), die ebenfalls direkt aneinandergrenzen.

Im Unterschied zum Säulendiagramm muss bei einem Histogramm die x-Achse immer eine Skala sein, deren Werte geordnet und gleichabständig sind.

Drei Kennzeichen eines Histogramms können zur Beurteilung der dargestellten Verteilung dienen:

  • der allgemeine Kurvenverlauf
  • die Streuung
  • die Zentrierung (Lageparameter (deskriptive Statistik))

Beispiel für ein Histogramm

Es liegen für 32 europäische Länder als Indikator für den Wohlstand die Zahlen der PKWs pro 1000 Einwohner vor. Die Werte werden wie folgt in Klassen eingeteilt:

Klasse j Zahl der PKW pro 1000 Anzahl der Länder
(absolute Klassenhäufigkeit)
nj
Klassenbreite
dj
Rechteckhöhe
(Häufigkeitsdichte)
hj = nj/dj
1 über 0 – bis 200 5 200 – 0 = 200 0,025
2 über 200 bis 300 6 100 0,06
3 über 300 bis 400 6 100 0,06
4 über 400 bis 500 9 100 0,09
5 über 500 bis 700 6 200 0,03
Summe Σ   32  

Mit Hilfe der Tabelle erhält man das folgende Histogramm:

Auf der Abszisse werden die Klassengrenzen und Klassenmittel abgetragen. In der Regel gibt man bei einem Histogramm die Ordinate nicht an, weil sonst die Gefahr besteht, die Höhe eines Rechtecks, anstatt seiner Fläche, als Häufigkeit zu interpretieren. Sind dagegen alle Klassen gleich breit, kann man für die Höhe der Rechtecke die Klassenhäufigkeit nj verwenden und diese auf der Ordinate abtragen.

Average-Shifted-Histogramm

Das linke Bild zeigt vier Histogramme für den gleichen Datensatz. Zwar sind die Klassenbreiten in jedem Histogramm gleich 2,0, jedoch verschiebt sich der Beginn der ersten Klasse (-6.0, -5.5, -5.0 und -4.5). Obwohl jeweils der gleiche Datensatz benutzt wurde, kommen doch unterschiedliche Histogramme heraus.

Neben dem Problem der Klassenanzahl bzw. Klassenbreite spielt also auch die Wahl der (linken) Klassengrenzen eine Rolle. David Scott hat daher das Average-Shifted-Histogramm vorgeschlagen.

Im rechten Bild wurden die vier Histogramme überlagert und dann für jeden Wert x{\displaystyle x} die Histogrammhöhen gemittelt. Dies ergibt das Average-Shifted-Histogramm. Üblicherweise werden deutlich mehr als vier Histogramme überlagert und gemittelt.

Das Average-Shifted-Histogramm löst das Problem der Wahl der (linken) Klassengrenzen, jedoch nicht das Problem der Wahl der optimalen Klassenbreiten.

Einzuordnen ist das Average-Shifted-Histogramm zwischen dem Histogramm und der Kerndichteschätzung.

  • Vier Histogramme für den gleichen Datensatz. Die Klassenbreiten sind in jedem Histogramm gleich 2,0. Lediglich der Beginn der ersten Klasse verschiebt sich von -6,0 über -5,5 und -5,0 auf -4,5.
  • Average-Shifted-Histogramm, berechnet aus den Überlagerungen der vier Einzelhistogramme.

Histogramm in der Bildverarbeitung

In der digitalen Bildverarbeitung versteht man unter einem Histogramm die statistische Häufigkeit der Grauwerte bzw. der Farbwerte in einem Bild. Das Histogramm eines Bildes erlaubt eine Aussage über die vorkommenden Grau- bzw. Farbwerte und über Kontrastumfang und Helligkeit des Bildes. In einem farbigen Bild kann entweder ein Histogramm über alle möglichen Farben oder Histogramme über die einzelnen Farbkanäle erstellt werden. Letzteres ist meist sinnvoller, da die meisten Verfahren auf Grauwertbildern basieren und so die sofortige Weiterverarbeitung möglich ist. Die Anzahl der Farbkanäle in einem Bild ist abhängig vom Modus, das heißt pro Farbauszug gibt es einen Kanal. Daher haben CMYK-Bilder vier Farbkanäle, RGB-Farbbilder nur drei.

Ein Histogramm visualisiert die Verteilung der Helligkeitswerte eines Bildes. Über einer Achse, die den Wertebereich der Farbwerte darstellt, sind als Balken die einzelnen Häufigkeiten des Vorkommens der Farbwerte aufgetragen. Je höher der Balken über einem Farbwert ist, desto häufiger kommt dieser Farbwert im Bild vor.

Histogramme findet man häufig im Bereich der digitalen Fotografie. Gut ausgestattete digitale Fotoapparate zeigen auf dem Display während der Motivsuche als Hilfe für ein ausgewogeneres Bild in Echtzeit oder für bereits gespeicherte Aufnahmen ein Histogramm an. Das Betrachten eines Histogramms erlaubt es dem Fotografen, das Ergebnis oder das geplante Foto genauer zu kontrollieren, als es das Kameradisplay erlaubt. Zum Beispiel kann man typische Fehler wie Unter- und Überbelichtung erkennen und diese durch entsprechende Belichtungskorrektur beheben. Da die Helligkeit und vor allem der Kontrastumfang des Bildes bei der späteren Bearbeitung und Verwertung eine große Rolle spielen, lohnt es sich beim Fotografieren, auf die Histogrammanzeige zu achten.

Eine klassische Anwendung von Histogrammen in der Bildverarbeitung liegt in der Egalisierung (Äqualisierung, englisch equalizing), bei der das Histogramm mit einer Egalisierungsfunktion transformiert wird. Dadurch kann eine bessere Verteilung der Farbgebung erreicht werden, die über eine bloße Kontrastverstärkung hinausgeht.

Beispiel High-key- und Low-key-Fotografie

Bei Low-key-Aufnahmen konzentrieren sich die Details in den niedrigen Tonwerten. Der Ausschlag ist demnach im unteren Bereich am stärksten. (Es liegen viele Pixel mit niedrigen Tonwerten vor.)

Für High-key-Aufnahmen gilt das Gegenteil, also viele Pixel mit hohen Tonwerten und kaum ein Ausschlag in den niedrigen Tonwerten.

Bei überbelichteten Aufnahmen „schmiegt“ sich die Wahrscheinlichkeitskurve an der rechten (hellen) Seite an und das Maximum wird möglicherweise gar nicht erreicht. Es werden also nicht alle hellen Details wiedergegeben, da ein bestimmter Helligkeitsbereich abgeschnitten ist und der darunterliegende als weiß definiert wird.

Geschichte

Der genaue Ursprung von Histogrammen ist unklar. Vermutlich haben sie jedoch erst nach den Säulendiagrammen Einzug in die Literatur gefunden. Das erste bekannte Säulendiagramm tauchte 1786 in der Arbeit The Commercial and Political Atlas des schottischen Ingenieurs und Volkswirts William Playfair auf. Im Jahr 1833 verwendete der Franzose André-Michel Guerry Histogramme zur Visualisierung von Daten. Weiterentwickelt wurde das Histogramm durch den belgischen Statistiker und Sozialwissenschaftler Adolphe Quetelet um 1846.

Der Begriff Histogramm wird oft fälschlich auf historical diagram zurückgeführt, wurde jedoch vom englischen Mathematiker Karl Pearson als Begriff für vertikale Balkendiagramme von ἱστός "Mast, Balken" gewählt. Pearson war des Altgriechischen mächtig, und wählte bewusst einen Begriff für vertikale Balken für Häufigkeitsverteilungsdiagramme, da das Vertikale seiner Ansicht nach für die Anschauung psychologisch vorteilhaft sei.

Siehe auch

  • Häufigkeitspolygon
  • Jenks-Caspall-Algorithmus
  • Kerndichteschätzer
  • Wahrscheinlichkeitsverteilung

Weblinks

Commons: Histogramme – Sammlung von Bildern, Videos und Audiodateien
Wiktionary: Histogramm – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
  • Weitere Informationen zum Histogramm bei Digitalkameras

Einzelnachweise

  1. Daniel Riaño Rufilanchas: On the origin of Karl Pearson's term "histogram". In: Estadística Española. Band 59, Nr. 192, Januar 2017, S. 29–35 (researchgate.net). 
  2. Bernd Rönz, Hans G. Strohe: Lexikon Statistik. Gabler Verlag, 1994, S. 157
  3. Larry Wasserman: All of Nonparametric Statistics. Springer, 2005, S. 127
  4. Arens et al.: Mathematik. Spektrum Akademischer Verlag, 2008, S. 1226
  5. D. Freedman, R. Pisani, R. Purves: Statistics. Third edition. W.W.Norton, 1998.
  6. Thomas A. Runkler: Data Mining: Methoden und Algorithmen intelligenter Datenanalyse. 1. Auflage. Vieweg + Teubner, 2010, S. 47. 
  7. Erhard Cramer, Udo Kamps: Grundlagen der Wahrscheinlichkeitsrechnung und Statistik: Ein Skript für Studierende der Informatik, der Ingenieur- und Wirtschaftswissenschaften. 2. Auflage. Springer, 2008, S. 45. 
  8. Wolfgang Brauch, Hans-Joachim Dreyer, Wolfhart Haacke: Mathematik für Ingenieure. Springer, 2013, ISBN 978-3-322-91830-7, S. 658 (eingeschränkte Vorschau in der Google-Buchsuche). 
  9. Bernd Rönz, Hans G. Strohe (1994), Lexikon Statistik, Gabler Verlag, S. 250
  10. Herbert A. Sturges: The choice of a class interval. In: Journal of the American Statistical Association. Nr. 21, 1926, S. 65–66. 
  11. R. J. Hyndman: The problem with Sturges’ rule for constructing histograms. In: Technical report. Melbourne University. 
  12. David W. Scott: On optimal and data-based histogram. In: Biometrika. Band 3, Nr. 66, 1979, S. 605–610, doi:10.1093/biomet/66.3.605. 
  13. David Freedman, Persi Diaconis: n the histogram as a density estimator: L2{\displaystyle L_{2}} theory. In: Zeitschrift für Wahrscheinlichkeitstheorie und verwandte Gebiete. Band 57, Nr. 4, 1981, S. 453–476, doi:10.1007/BF01025868. 
  14. Jürgen Bortz: Statistik für Human- und Sozialwissenschaftler. 6. Auflage. Springer, 2005, S. 31–32. 
  15. David Scott: Multivariate Density Estimation: Theory, Practice, and Visualization. John Wiley, 1992, ISBN 978-0-471-54770-9. 
  16. Das bedeutet: Histogramm. (Memento des Originals vom 4. Dezember 2015 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2 test.de, 25. August 2011; abgerufen am 7. Januar 2013
  17. Yannis Ioannidis: The History of Histograms (abridged). In: Proceedings 2003 VLDB Conference. Morgan Kaufmann, 2003, ISBN 978-0-12-722442-8, S. 19 (sciencedirect.com). 
  18. André-Michel Guerry: Essai sur la Statistique Morale de la France. Paris 1833. 
  19. Yadolah Dodge: The Concise Encyclopedia of Statistics. Springer, 2008, S. 236–237. 
  20. Sheldon M. Ross: Introductory Statistics. 2. Auflage. Elsevier Academic Press, 2005, S. 56–57. 
  21. Eileen Magnello: Karl Pearson’s Gresham Lectures: W. F. R. Weldon, Speciation and the Origins of Pearsonian Statistics. In: The British Journal for the History of Science. Band 29, Nr. 1. Cambridge University Press, 1996, S. 48. 
  22. “He explained that the histogram could be used for historical purposes to create blocks of time of ‘charts about reigns or sovereigns or periods of different prime ministers’.” zitiert aus The Rutherford Journal

Autor: www.NiNa.Az

Veröffentlichungsdatum: 01 Jul 2025 / 20:11

wikipedia, wiki, deutsches, deutschland, buch, bücher, bibliothek artikel lesen, herunterladen kostenlos kostenloser herunterladen, MP3, Video, MP4, 3GP, JPG, JPEG, GIF, PNG, Bild, Musik, Lied, Film, Buch, Spiel, Spiele, Mobiltelefon, Mobil, Telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, komputer, Informationen zu Häufigkeitsdichte, Was ist Häufigkeitsdichte? Was bedeutet Häufigkeitsdichte?

Ein Histogramm von ἱstos Mast Balken ist eine grafische Darstellung der Haufigkeitsverteilung kardinal skalierter Merkmale Es erfordert die Einteilung der Daten in Klassen die eine konstante oder variable Breite haben konnen Es werden direkt nebeneinanderliegende Rechtecke von der Breite der jeweiligen Klasse gezeichnet deren Flacheninhalte die relativen oder absoluten Klassenhaufigkeiten darstellen Die Hohe jedes Rechtecks stellt dann die relative oder absolute Haufigkeitsdichte dar also die relative oder absolute Haufigkeit dividiert durch die Breite der entsprechenden Klasse Ein HistogrammAnwendungAnwendung finden Histogramme in der beschreibenden Statistik und in der Bildverarbeitung Man verwendet Histogramme beispielsweise dann wenn man den Verlauf der Haufigkeitsverteilung sehen mochte und nicht nur zusammenfassende Daten wie das arithmetische Mittel und die Standardabweichung wenn man vermutet dass mehrere Faktoren einen Prozess beeinflussen und man diese nachweisen will wenn man sinnvolle Spezifikationsgrenzen fur einen Prozess definieren mochte In der physikalischen Forschung oder angewandten Gebieten z B Analytik werden gemessene Spektren als Histogramme dargestellt siehe z B Vielkanalanalysator Konstruktion eines HistogrammsFolgende Schritte sind bei der Konstruktion eines Histogramms notig Wertemenge in Klassen aufteilen Breite der Rechtecke festlegen Absolute Relative Klassenhaufigkeit bestimmen Flacheninhalt der Rechtecke festlegen Haufigkeitsdichte bestimmen Hohe der Rechtecke festlegen Histogramm grafisch darstellenEinteilung in Klassen Zur Konstruktion eines Histogramms wird der Wertebereich der Stichprobe in k aneinandergrenzende Intervalle geteilt die Klassen Dabei ist darauf zu achten dass die Randklassen nicht offen sind Das heisst die erste und die letzte Klasse mussen eine untere bzw obere Grenze besitzen Die Klassen mussen nicht gleich breit sein Allerdings vereinfachen zumindest im Mittelbereich gleich grosse Klassen die Interpretation Uber jede Klasse wird dann ein Rechteck errichtet dessen Flache proportional zur jeweiligen Klassenhaufigkeit ist Im Histogramm entsprechen diese Klassen der Breite der einzelnen Rechtecke Bestimmung der Klassenhaufigkeit Bei der Erstellung eines Histogramms gibt es zwei Vorgehensweisen Die Klassenhaufigkeit spiegelt entweder einen absoluten oder einen relativen Wert wider Der absolute Wert entspricht der Anzahl an Werten die zu einer Klasse gehoren Der relative Wert hingegen druckt aus wie viel Prozent der Werte einer Klasse angehoren Je nach Anwendungsfall kann sowohl das Arbeiten mit absoluten als auch mit relativen Werten Vorteile mit sich bringen Im Histogramm entspricht die Klassenhaufigkeit dem Flacheninhalt der Rechtecke Bestimmung der Haufigkeitsdichte Beispiel fur ein Histogramm mit einer Verteilung von 1000 Werten Beispiel fur ein Histogramm mit konstanter Klassenbreite bei dem die absoluten Haufigkeiten auf der Ordinate abgetragen sind Da die Flache des j ten Rechtecks gleich der Klassenhaufigkeit nj displaystyle n j ist errechnet sich die Hohe des Rechtecks die sogenannte Haufigkeitsdichte hj displaystyle h j als Quotient nj dj displaystyle n j d j der Klassenhaufigkeit nj displaystyle n j durch die Klassenbreite dj displaystyle d j Dies wird unmittelbar klar wenn man sich uberlegt dass die Flache eines Rechtecks das Produkt aus Breite Klassenbreite und Hohe Haufigkeitsdichte ist Die Klasse mit der grossten Haufigkeitsdichte wird Modalklasse genannt Sind die Klassen gleich breit so sind Haufigkeitsdichte und absolute bzw relative Haufigkeiten proportional zueinander Die Hohen der Rechtecke sind in diesem Fall vergleichbar und unter Beachtung der Klassenbreite als Proportionalitatsfaktor als Haufigkeit interpretierbar Statistische Schwankung der Klassenhaufigkeit Oft werden die ermittelten Klassenhaufigkeiten beim Wiederholen der Datenerfassung streuen So stellt sich beispielsweise bei einer Wahlprognose die Frage nach der Prazision der erhobenen Zahlen Die zu erwartende Schwankungsbreite der Klassenhaufigkeit strebt bei unbegrenzt wachsender Anzahl der Klassen gegen nj displaystyle sqrt n j Abschatzung der Anzahl der Klassen Sturges Regel Um ein Histogramm zeichnen zu konnen muss eine genugend grosse Anzahl an Messwerten einen sinnvollen Verlauf ergeben Eine falsche Einteilung der Klassen kann zu einer Fehlinterpretation des Histogramms fuhren Fur die Festlegung der Anzahl der Klassen bzw Rechtecke existieren verschiedene Faustregeln Anzahl der Messungen Balkenzahl lt 50 5 bis 750 bis 100 6 bis 10100 bis 250 7 bis 12 gt 250 10 bis 20Sturges Regel Gegebenenfalls kann man die Anzahl der Balken k displaystyle k auch nach der Regel berechnen k 1 log2 n 1 3 3 log10 n displaystyle k 1 log 2 n approx 1 3 3 cdot log 10 n Die Sturges Regel hat den Nachteil dass sie zum einen die Streuung nicht berucksichtigt Zum anderen wahlt sie die Klassenzahl zu klein fur n gt 200 displaystyle n gt 200 selbst im Fall einer idealen normalverteilten wahren Dichte Scott Regel Alternativ kann die Klassenbreite h displaystyle h mit der Regel nach h 3 49 sn3 displaystyle h frac 3 49 cdot sigma sqrt 3 n Die Regel nach Scott ist so nur fur normalverteilte Daten definiert Fur andere Falle fuhrte Scott Korrekturfaktoren in Abhangigkeit von Schiefe und Exzess ein Freedman Regel Nach Freedman und Diaconis h 2 Q3 Q1 n3 displaystyle h frac 2 cdot Q 3 Q 1 sqrt 3 n Dabei sind s displaystyle sigma die Standardabweichung n displaystyle n die Anzahl der Messungen und Q3 Q1 displaystyle Q 3 Q 1 der Interquartilsabstand EigenschaftenEin Histogramm ist eine flachenproportionale Darstellung der vorliegenden Haufigkeiten Die Flache eines Rechtecks entspricht c f xj displaystyle c cdot f x j wobei f xj displaystyle f x j die relative Klassenhaufigkeit der Klasse j displaystyle j und c displaystyle c ein Proportionalitatsfaktor ist Ist c displaystyle c gleich dem Stichprobenumfang das heisst c n displaystyle c n so ist die Flache eines jeden Rechtecks gleich der absoluten Klassenhaufigkeit Das Histogramm wird in diesem Fall in dem die Summe der Flacheninhalte der Rechtecke dem Stichprobenumfang n displaystyle n entspricht absolut genannt Werden zur Konstruktion des Histogramms exakt die relativen Klassenhaufigkeiten verwendet c 1 displaystyle c 1 wird das Histogramm als relativ oder normiert bezeichnet Da die Flacheninhalte der Rechtecke nun den relativen Klassenhaufigkeiten entsprechen summieren sich die Flacheninhalte in diesem Fall zu 1 Bei einem Histogramm grenzen die Rechtecke im Gegensatz zum Saulendiagramm direkt aneinander das heisst es existieren keine Abstande zwischen ihnen Denn die Breite der Rechtecke entspricht den gebildeten Intervallen Klassen die ebenfalls direkt aneinandergrenzen Im Unterschied zum Saulendiagramm muss bei einem Histogramm die x Achse immer eine Skala sein deren Werte geordnet und gleichabstandig sind Drei Kennzeichen eines Histogramms konnen zur Beurteilung der dargestellten Verteilung dienen der allgemeine Kurvenverlauf die Streuung die Zentrierung Lageparameter deskriptive Statistik Beispiel fur ein HistogrammEs liegen fur 32 europaische Lander als Indikator fur den Wohlstand die Zahlen der PKWs pro 1000 Einwohner vor Die Werte werden wie folgt in Klassen eingeteilt Klasse j Zahl der PKW pro 1000 Anzahl der Lander absolute Klassenhaufigkeit nj Klassenbreite dj Rechteckhohe Haufigkeitsdichte hj nj dj1 uber 0 bis 200 5 200 0 200 0 0252 uber 200 bis 300 6 100 0 063 uber 300 bis 400 6 100 0 064 uber 400 bis 500 9 100 0 095 uber 500 bis 700 6 200 0 03Summe S 32 Mit Hilfe der Tabelle erhalt man das folgende Histogramm Histogramm der Zahl der PKWs auf 1000 Personen in 32 ausgewahlten Landern Auf der Abszisse werden die Klassengrenzen und Klassenmittel abgetragen In der Regel gibt man bei einem Histogramm die Ordinate nicht an weil sonst die Gefahr besteht die Hohe eines Rechtecks anstatt seiner Flache als Haufigkeit zu interpretieren Sind dagegen alle Klassen gleich breit kann man fur die Hohe der Rechtecke die Klassenhaufigkeit nj verwenden und diese auf der Ordinate abtragen Average Shifted HistogrammDas linke Bild zeigt vier Histogramme fur den gleichen Datensatz Zwar sind die Klassenbreiten in jedem Histogramm gleich 2 0 jedoch verschiebt sich der Beginn der ersten Klasse 6 0 5 5 5 0 und 4 5 Obwohl jeweils der gleiche Datensatz benutzt wurde kommen doch unterschiedliche Histogramme heraus Neben dem Problem der Klassenanzahl bzw Klassenbreite spielt also auch die Wahl der linken Klassengrenzen eine Rolle David Scott hat daher das Average Shifted Histogramm vorgeschlagen Im rechten Bild wurden die vier Histogramme uberlagert und dann fur jeden Wert x displaystyle x die Histogrammhohen gemittelt Dies ergibt das Average Shifted Histogramm Ublicherweise werden deutlich mehr als vier Histogramme uberlagert und gemittelt Das Average Shifted Histogramm lost das Problem der Wahl der linken Klassengrenzen jedoch nicht das Problem der Wahl der optimalen Klassenbreiten Einzuordnen ist das Average Shifted Histogramm zwischen dem Histogramm und der Kerndichteschatzung Vier Histogramme fur den gleichen Datensatz Die Klassenbreiten sind in jedem Histogramm gleich 2 0 Lediglich der Beginn der ersten Klasse verschiebt sich von 6 0 uber 5 5 und 5 0 auf 4 5 Average Shifted Histogramm berechnet aus den Uberlagerungen der vier Einzelhistogramme Histogramm in der BildverarbeitungHistogramm eines Graustufen Bildes mit einem hohen Anteil an Schwarz und Weiss In der digitalen Bildverarbeitung versteht man unter einem Histogramm die statistische Haufigkeit der Grauwerte bzw der Farbwerte in einem Bild Das Histogramm eines Bildes erlaubt eine Aussage uber die vorkommenden Grau bzw Farbwerte und uber Kontrastumfang und Helligkeit des Bildes In einem farbigen Bild kann entweder ein Histogramm uber alle moglichen Farben oder Histogramme uber die einzelnen Farbkanale erstellt werden Letzteres ist meist sinnvoller da die meisten Verfahren auf Grauwertbildern basieren und so die sofortige Weiterverarbeitung moglich ist Die Anzahl der Farbkanale in einem Bild ist abhangig vom Modus das heisst pro Farbauszug gibt es einen Kanal Daher haben CMYK Bilder vier Farbkanale RGB Farbbilder nur drei Ein Histogramm visualisiert die Verteilung der Helligkeitswerte eines Bildes Uber einer Achse die den Wertebereich der Farbwerte darstellt sind als Balken die einzelnen Haufigkeiten des Vorkommens der Farbwerte aufgetragen Je hoher der Balken uber einem Farbwert ist desto haufiger kommt dieser Farbwert im Bild vor Histogramme findet man haufig im Bereich der digitalen Fotografie Gut ausgestattete digitale Fotoapparate zeigen auf dem Display wahrend der Motivsuche als Hilfe fur ein ausgewogeneres Bild in Echtzeit oder fur bereits gespeicherte Aufnahmen ein Histogramm an Das Betrachten eines Histogramms erlaubt es dem Fotografen das Ergebnis oder das geplante Foto genauer zu kontrollieren als es das Kameradisplay erlaubt Zum Beispiel kann man typische Fehler wie Unter und Uberbelichtung erkennen und diese durch entsprechende Belichtungskorrektur beheben Da die Helligkeit und vor allem der Kontrastumfang des Bildes bei der spateren Bearbeitung und Verwertung eine grosse Rolle spielen lohnt es sich beim Fotografieren auf die Histogrammanzeige zu achten Eine klassische Anwendung von Histogrammen in der Bildverarbeitung liegt in der Egalisierung Aqualisierung englisch equalizing bei der das Histogramm mit einer Egalisierungsfunktion transformiert wird Dadurch kann eine bessere Verteilung der Farbgebung erreicht werden die uber eine blosse Kontrastverstarkung hinausgeht Beispiel High key und Low key Fotografie Histogramm einer High key Aufnahme 70 der Pixel in diesem Bild konzentrieren sich in den oberen 2 250 bis 255 des gesamten Tonwertumfangs 0 bis 255 Der Rest der Pixel 30 verteilt sich auf die restlichen 250 Tonwerte Bei Low key Aufnahmen konzentrieren sich die Details in den niedrigen Tonwerten Der Ausschlag ist demnach im unteren Bereich am starksten Es liegen viele Pixel mit niedrigen Tonwerten vor Fur High key Aufnahmen gilt das Gegenteil also viele Pixel mit hohen Tonwerten und kaum ein Ausschlag in den niedrigen Tonwerten Bei uberbelichteten Aufnahmen schmiegt sich die Wahrscheinlichkeitskurve an der rechten hellen Seite an und das Maximum wird moglicherweise gar nicht erreicht Es werden also nicht alle hellen Details wiedergegeben da ein bestimmter Helligkeitsbereich abgeschnitten ist und der darunterliegende als weiss definiert wird GeschichteDer genaue Ursprung von Histogrammen ist unklar Vermutlich haben sie jedoch erst nach den Saulendiagrammen Einzug in die Literatur gefunden Das erste bekannte Saulendiagramm tauchte 1786 in der Arbeit The Commercial and Political Atlas des schottischen Ingenieurs und Volkswirts William Playfair auf Im Jahr 1833 verwendete der Franzose Andre Michel Guerry Histogramme zur Visualisierung von Daten Weiterentwickelt wurde das Histogramm durch den belgischen Statistiker und Sozialwissenschaftler Adolphe Quetelet um 1846 Der Begriff Histogramm wird oft falschlich auf historical diagram zuruckgefuhrt wurde jedoch vom englischen Mathematiker Karl Pearson als Begriff fur vertikale Balkendiagramme von ἱstos Mast Balken gewahlt Pearson war des Altgriechischen machtig und wahlte bewusst einen Begriff fur vertikale Balken fur Haufigkeitsverteilungsdiagramme da das Vertikale seiner Ansicht nach fur die Anschauung psychologisch vorteilhaft sei Siehe auchHaufigkeitspolygon Jenks Caspall Algorithmus Kerndichteschatzer WahrscheinlichkeitsverteilungWeblinksCommons Histogramme Sammlung von Bildern Videos und Audiodateien Wiktionary Histogramm Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen Weitere Informationen zum Histogramm bei DigitalkamerasEinzelnachweiseDaniel Riano Rufilanchas On the origin of Karl Pearson s term histogram In Estadistica Espanola Band 59 Nr 192 Januar 2017 S 29 35 researchgate net Bernd Ronz Hans G Strohe Lexikon Statistik Gabler Verlag 1994 S 157 Larry Wasserman All of Nonparametric Statistics Springer 2005 S 127 Arens et al Mathematik Spektrum Akademischer Verlag 2008 S 1226 D Freedman R Pisani R Purves Statistics Third edition W W Norton 1998 Thomas A Runkler Data Mining Methoden und Algorithmen intelligenter Datenanalyse 1 Auflage Vieweg Teubner 2010 S 47 Erhard Cramer Udo Kamps Grundlagen der Wahrscheinlichkeitsrechnung und Statistik Ein Skript fur Studierende der Informatik der Ingenieur und Wirtschaftswissenschaften 2 Auflage Springer 2008 S 45 Wolfgang Brauch Hans Joachim Dreyer Wolfhart Haacke Mathematik fur Ingenieure Springer 2013 ISBN 978 3 322 91830 7 S 658 eingeschrankte Vorschau in der Google Buchsuche Bernd Ronz Hans G Strohe 1994 Lexikon Statistik Gabler Verlag S 250 Herbert A Sturges The choice of a class interval In Journal of the American Statistical Association Nr 21 1926 S 65 66 R J Hyndman The problem with Sturges rule for constructing histograms In Technical report Melbourne University David W Scott On optimal and data based histogram In Biometrika Band 3 Nr 66 1979 S 605 610 doi 10 1093 biomet 66 3 605 David Freedman Persi Diaconis n the histogram as a density estimator L2 displaystyle L 2 theory In Zeitschrift fur Wahrscheinlichkeitstheorie und verwandte Gebiete Band 57 Nr 4 1981 S 453 476 doi 10 1007 BF01025868 Jurgen Bortz Statistik fur Human und Sozialwissenschaftler 6 Auflage Springer 2005 S 31 32 David Scott Multivariate Density Estimation Theory Practice and Visualization John Wiley 1992 ISBN 978 0 471 54770 9 Das bedeutet Histogramm Memento des Originals vom 4 Dezember 2015 im Internet Archive Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 test de 25 August 2011 abgerufen am 7 Januar 2013 Yannis Ioannidis The History of Histograms abridged In Proceedings 2003 VLDB Conference Morgan Kaufmann 2003 ISBN 978 0 12 722442 8 S 19 sciencedirect com Andre Michel Guerry Essai sur la Statistique Morale de la France Paris 1833 Yadolah Dodge The Concise Encyclopedia of Statistics Springer 2008 S 236 237 Sheldon M Ross Introductory Statistics 2 Auflage Elsevier Academic Press 2005 S 56 57 Eileen Magnello Karl Pearson s Gresham Lectures W F R Weldon Speciation and the Origins of Pearsonian Statistics In The British Journal for the History of Science Band 29 Nr 1 Cambridge University Press 1996 S 48 He explained that the histogram could be used for historical purposes to create blocks of time of charts about reigns or sovereigns or periods of different prime ministers zitiert aus The Rutherford Journal

Neueste Artikel
  • Juni 21, 2025

    Palmengewächse

  • Juni 23, 2025

    Palkstraße

  • Juni 21, 2025

    Patrilinearität

  • Juni 26, 2025

    Patientenverfügung

  • Juni 24, 2025

    Pathogenität

www.NiNa.Az - Studio

    Kontaktieren Sie uns
    Sprachen
    Kontaktieren Sie uns
    DMCA Sitemap
    © 2019 nina.az - Alle Rechte vorbehalten.
    Copyright: Dadash Mammadov
    Eine kostenlose Website, die Daten- und Dateiaustausch aus der ganzen Welt ermöglicht.
    Spi.