Kapitel 11 Sprechweisen der Statistik
Abschnitt 11.2 Häufigkeitsverteilungen und Prozentrechnung11.2.5 Diagrammarten
Die graphische Darstellung von qualitativen bzw. quantitativ-diskreten Daten, welche durch eine Stichpobe gewonnen wurden, erfolgt oft mittels Stabdiagrammen (bzw. Balkendiagrammen).
Info 11.2.21
Das Stabdiagramm zeigt die absoluten bzw. relativen Häufigkeiten als Funktion der endlich vielen Merkmalswerte in der Stichprobe an. Das Darstellungsmittel ist die Länge der Stäbe bzw. Balken.
Dazu ein Beispiel: Bei Bäumen am Waldrand wurde die Baumart bestimmt. Die möglichen Merkmalsausprägungen des Merkmals Baumart sind:
Es ergab sich die folgende Urliste:
Daraus ergibt sich die folgende empirische Häufigkeitstabelle:
Ausprägung | absolut | relativ | in |
Eiche | 50 | ||
Buche | 20 | ||
Fichte | 30 |
Zu dieser empirischen Häufigkeitstabelle gehört das folgende Stabdiagramm:
Ein Stabdiagramm.
Zur Darstellung qualitativer Merkmale finden dagegen meist Kreisdiagramme Verwendung:
Info 11.2.22
Den Merkmalsausprägungen werden entsprechend ihren relativen Häufigkeiten Kreissektoren zugeordnet, wobei gilt:
wobei der Winkel (in Grad) des Kreissektors zur Ausprägung ist. Dabei bezeichnet die absolute und die relative Häufigkeit der Ausprägung in der Urliste .
Auch dazu ein Beispiel: Es wurden Haushalte befragt, wie zufrieden sie sind mit einem neuartigen Gartengrill. Es gab die Anwortmöglichkeiten sehr zufrieden (1), zufrieden (2), weniger zufrieden (3), unzufrieden (4).
Die Befragung ergab das folgende Ergebnis.
Ausprägung | absolute Häufigkeiten | relative Häufigkeiten | in Prozent |
sehr zufrieden | |||
zufrieden | |||
weniger zufrieden | |||
unzufrieden | |||
Summe |
Die Umrechnung für die Winkel ergibt
- ,
- ,
- ,
- .
Damit ergibt sich das folgende Kreisdiagramm:
Meist ist es nicht sinnvoll, alle möglichen Ausprägungen in einem Diagramm aufzuführen, sondern sie zu Klassen zu gruppieren und nur die Häufigkeiten der Klassen im Diagramm einzutragen. Dies ist auch die einzige Möglichkeit, die Häufigkeiten stetiger Merkmale in einem Stab- oder Kreisdiagramm zu visualisieren.
Es sei ein quantitatives (stetiges) Merkmal und die Urliste zu einer Stichprobe vom Umfang . Um eine empirische Häufigkeitsverteilung zu erhalten, ergibt sich das folgende Vorgehen:
- Man bestimme den kleinsten und den größten Stichprobenwert, also
- Man schreibe diese und alle anderen dazwischenliegenden Werte in der vorgeschriebenen Messgenauigkeit der Größe nach sortiert auf. Hierdurch wird das Merkmal de facto ein diskretes Merkmal.
- Man fertige eine Strichliste und eine empirische Häufigkeitsverteilung an.
Die empirische Häufigkeitsverteilung eines stetigen Merkmals kann sehr umfangreich sein, vor allem können sehr viele Nullen auftreten durch Messwerte, die in der Urliste (Stichprobe) nicht vorkommen. Dies macht die empirische Häufigkeitstabelle sehr unübersichtlich und unhandlich. Daher führt man eine Klassenbildung zur Verringerung der Datenmengen durch (Datenreduktion). Dies entspricht praktisch der Herabsetzung der Meßgenauigkeit (Rundung!).
Es gibt keine allgemeinen Vorschriften für die Anzahl der Klassen und für die Klassengrößen, aber folgende Richtlinien sind empfehlenswert:
- Gleichmäßige Einteilung: Man berechnet und . Dann teilt man das Intervall mit klein, in etwa gleichgroße, sich nicht überlappende halboffene Teilintervalle ein.
- Man vermeide zu kleine und zu große Klassen.
- Man vermeide, wenn möglich, Klassen, welche sehr wenige Beobachtungen enthalten.
- Man bilde etwa etwa gleichgroße Klassen, dabei bezeichne den Stichprobenumfang.
Es empfiehlt sich folgendes Vorgehen für die Erstellung eines Histogramms: Es sei
eine Urliste zu einer Stichprobe vom Umfang eines quantitativen Merkmals .
- Man verwendet eine Klasseneinteilung in Klassen. Es sei das Intervall für die te Klasse, .
- Weiter sei die Anzahl der Datenwerte im Intervall für . Die Zahlen nennt man auch die absoluten Klassenhäufigkeiten
- Bilde für jedes über der Grundseite ein Rechteck der Höhe mit dem Flächeninhalt . Die Flächeninhalte sind die relativen Klassenhäufigkeiten.
Die Gesamtfläche aller dieser Rechtecke ist dann gleich .
Ein ausführliches Beispiel dazu: In einem Rechenzentrum wurde die Bearbeitungsdauer (in sec., gerundet auf eine Nachkommastelle) von 20 Programmjobs bestimmt. Es ergab sich die folgende Urliste zu einer Stichprobe vom Umfang :
3,9 | 3,3 | 4,6 | 4,0 | 3,8 |
3,8 | 3,6 | 4,6 | 4,0 | 3,9 |
3,9 | 3,9 | 4,1 | 3,7 | 3,6 |
4,6 | 4,0 | 4,0 | 3,8 | 4,1 |
Der kleinste Wert beträgt , der größte Wert , die Abstufung ist . Aufgrund der Empfehlung sind etwa etwa gleichgroße Klassen zu wählen. Es wird die folgende Klasseneinteilung mit Klassen gewählt.
Klassen | Daten | |
Klasse 1 | „Von bis “ | |
Klasse 2 | „Von bis “ | |
Klasse 3 | „Von bis “ | |
Klasse 4 | „Von bis “ |
Die Tabelle der absoluten und relativen Häufigkeiten hat die folgende Gestalt.
Klasse | abs. Klassenhäufigkeiten | rel. Klassenhäufigkeiten |
Klasse 1 | ||
Klasse 2 | ||
Klasse 3 | ||
Klasse 4 |
Die Höhen der Rechtecke ergeben sich wie folgt:
- 1. Klasse: , also .
- 2. Klasse: , also .
- 3. Klasse: , also .
- 4. Klasse: , also .
Damit ergibt sich das folgende Histogramm: