Übung 2

Beschreibung univariater Datensätze I

Aufgabe 1)

Gegeben seien die Merkmalsbeobachtungen \(x_{i}\) mit:

Originale Tabelle der Merkmalsbeobachtungen.

\(i\)

1

2

3

4

5

6

7

8

9

\(x_{[i]}\)

3,75

4,43

5,50

3,5

3

3

6,5

6,25

2,5

a) Bestimmen Sie das Arithmetische Mitte, den Median und den Modus.

Zunächst sortieren wir erst einmal die Merkmalsbeobachtungen der Größe nach. Dies ergibt:

Sortierte Tabelle der Merkmalsbeobachtungen.

\(i\)

1

2

3

4

5

6

7

8

9

\(x_{[i]}\)

2,5

3

3

3,5

3,75

4,43

5,50

6,25

6,5

../../../../_images/template-occasion.svg

Occasion.

Arithmetische Mittel:

\begin{equation} \bar{x} := \frac{1}{n} \sum\limits^{n}_{i=1} x_{i} \end{equation}
\[\implies \frac{1}{9}(2,5 + 3 + \cdots + 6,5) = 4,27\]

Median:

\begin{equation} \bar{x}\ho{Med} = \left\{\begin{array}{ll} x_{[\frac{n+1}{2}]} & \text{für \(n\) ungerade}\\ \frac{1}{2}(x_{[\frac{n}{2}]} + x_{[\frac{n}{2}+1]}) & \text{für \(n\) gerade} \end{array}\right. \end{equation}
\[n:=9 \implies \bar{x}\ho{Med} = x_{[5]} = 3,75\]

Modus:

\[\bar{x}\ho{Mod} = \{{3}\}\]

Die 3 ist der Wert, welcher am häufigsten mehrfach auftritt und somit hier auch den Wert des Modus bestimmt.

Grafische Darstellung zur Bestimmung des Modus - Gnuplot

Aufsummierung der einzelnen Häufigkeiten der Elemente im vorliegenden Datensatz.

../../../../_images/template-sumoccasion.svg

Sum occasion.

b) Geben Sie an, ob die empirische Verteilung linkssteil, rechtssteil oder symmetrisch ist. Begründen Sie kurz Ihre Antwort.

Der Vergleich vom Arithmetische Mittel, Median und Modus ergibt: \(\bar{x} > \bar{x}^{Med} > \bar{x}^{Mod}\)

\(\implies\) Die Verteilung ist linkssteil bzw. rechtsschief

c) Bestimmen Sie die Varianz und die Standardabweichung.

Varianz:

\begin{equation} s^{2} = \frac{1}{n} \sum\limits^{n}_{i=1} (x_{i}-\bar{x})^2 ~~~ = ~~~ (\frac{1}{n} \sum\limits^{n}_{i=1} x_{i}^2)-\bar{x}^2 \end{equation}
\[= \frac{1}{9}(2,5^2 + 3^2 + \cdots + 6,5^2)- 4,27^2 = 1,9615\]

Standardabweichung:

Die Standardabweichung ergibt sich aus der quadratischen Wurzel der Varianz. Es interessiert hier nur das positive Ergebnis.

\begin{equation} s = \sqrt{s^{2}} \end{equation}
\[~~~~~~ = 1,4005\]

d) Bestimmen Sie die Schiefe und die Wölbung.

Schiefe:

\begin{equation} \gamma_{1,M} = \frac{\hat{M}_{3}}{|(\hat{M}_{2})^{\frac{3}{2}}|} = \frac{\hat{M}_{3}}{s^{3}} \end{equation}
\[\implies \hat{M}_{3} = \frac{1}{n} \sum\limits^{n}_{i=1} (x_{i}-\bar{x})^3 = \frac{1}{9}[(2,5-4,27)^3 + \cdots + (6,5-4,27)^3] = \frac{1}{9} \cdot 10,4778 = 1,1642\]
\[\gamma_{1,M} = \frac{\hat{M}_{3}}{s^3} = \frac{1,1642}{1,4005^3} = 0,4238\]

Wölbung:

\begin{equation} \gamma_{2} = \frac{\hat{M}_{4}}{|\hat{M}_{2}|^2} = \frac{\hat{M}_{4}}{s^4} \end{equation}
\[\hat{M}_{4} = \frac{1}{n} \sum\limits^{n}_{i=1} (x_{i}-\bar{x})^4 = \frac{1}{9}[(2,5-4,27)^4 + \cdots + (6,5-4,27)^4] = 2,3389\]
\[\implies \gamma_{2} = \frac{\hat{M}_{4}}{s^4} = \frac{2,3389}{1,4005^4} = 1,6701\]

e) Geben Sie an, wie sich das arithmetische Mittel, der Median, der Modus und die Varianz ändern, wenn die \(x_{i}\) alle um 20% steigen.

\[z_{i} = (1+0,2) \cdot x_{i} ~~~ \text{mit} ~~~ i=\{1,\cdots,9\}\]

Arithmetische Mittel:

\[\bar{z} = 1,2 \cdot \bar{x} = 5,124\]

Median:

\[\bar{z}\ho{Med} = 1,2 \cdot \bar{x}\ho{Med} = 1,2 \cdot 3,75 = 4,5\]

Modus:

\[\bar{z}\ho{Mod} = 1,2 \cdot \bar{x}\ho{Mod} = 1,2 \cdot 3 = 3,6\]

Für die Varianz nutzen wir die Transformationsregel Satz 2.33 der [Folie 102] aus dem Statistik I Skript.

Varianz:

\[s\ti{z}^{2} = 1,2^2 \cdot s\ti{x}^2 = 2,8246\]

f) Geben Sie an, wie sich das arithmetische Mittel, der Median und der Modus ändern, wenn sich \(x_{7}\) verdoppelt. Die Tendenz genügt als Antwort.

  • Arithmetische Mittel: unverändert

  • Median: unverändert

  • Modus: steigt

g) Gegeben sei eine zweite Stichprobe vom Umfang n = 10 mit \(\bar{z}\) = 50 und \(\sum^{n}_{i=1} (z_{i}-\bar{z})^2 = 250\). Geben Sie an, welche Stichprobe die größere Streuung aufweist?

Siehe zunächst im Skript [Folie 106], Stichwort: Variationskoeffizient. Aber erst einmal schauen wir uns den Unterschied der Streuung an. Hieraus können erste ungenaue Schlüsse gezogen werden. !!Vorsicht!!

\[\begin{equation} s\ti{y}^2 = \frac{1}{n} \sum\limits^{n}_{i=1} (y_{i}-\bar{y})^2 \end{equation}\]
\[\begin{split}\left.\begin{array}{r} n = 10\\ \bar{y}= 50 \\ \sum (y_{i}-\bar{y})^2 = 250 \end{array}\right\} ~~~ s\ti{y}^2 = \frac{1}{10} \cdot 250 = 25\end{split}\]
\[s\ti{y}^2 > s\ti{x}^2 = 1,9615\]
\[v_{x} = \frac{s_{x}}{\bar{x}} = \frac{1,4005}{4,27} = 0,3280\]
\[v_{y} = \frac{s_{y}}{\bar{y}} = \frac{\sqrt{25}}{50} = 0,1\]
\[\implies v_{x} > v_{y}\]

Die Stichprobe \(x\) weist eine höhere Streuung auf.

Aufgabe 2)

Gegeben seien nachfolgende \(n = 14\) Merkmalsbeobachtungen:

Tabelle der 14 Merkmalsbeobachtungen.

5,5

6

8

8,5

10,6

12,5

13,2

13,7

15

15,2

16,6

16,8

18,9

19,4

a) Bestimmen Sie das arithmetische Mittel \(\bar{x}\) der Merkmalsbeobachtungen.

\[\bar{x} = \frac{1}{n} \sum\limits^{n}_{i=1} x_{i} = \frac{1}{14}(5,5+6+8+ \cdots +19,4) = 12,85\]

b) Bilden Sie die Klassen über 5 bis 10, über 10 bis 15, über 15 bis 20 (jeweils bis einschließlich) und berechnen Sie das arithmetische Mittel für gruppierte Daten \(\bar{x_{k}}\) für jede Klasse und daraus erneut das arithmetische Mittel \(\bar{x}\).

Tabelle der \(\bar{x}\) der jeweiligen Merkmalsgruppen.

Klassen

Stichprobe

\(\bar{x_{k}}\)

(5:10]

5,5 ; 6 ; 8 ; 8,5

7

(10:15]

10,6 ; 12,5 ; 13,2 ; 13,7 ; 15

13

(15:20]

15,2 ; 16,6 ; 16,8 ; 18,9 ; 19,4

17,38

Notwendig für die folgende Berechnung ist das Wissen aus dem folgenden Aufgabenteil c):

\[\bar{x} = \frac{1}{n} \sum\limits^{3}_{k=1} \bar{x}_{k} \cdot n_{k} = \frac{1}{14} ((7 \cdot 4) + (13 \cdot 5) + (17,38 \cdot 5) ) = 12,85\]

c) Bestimmen Sie mithilfe der Klassenmitten eine Näherung \(\bar{x}^{'}\) für das arithmetische Mittel und vergleichen Sie die bisher ermittelten Ergebnisse.

Tabelle der \(n_{k}\) der jeweiligen Merkmalsgruppen.

Klassen

Klassenmitte

\(n_{k}\)

(5:10]

\(\frac{1}{2} \cdot (5+10)=7,5\)

4

(10:15]

12,5

5

(15:20]

17,5

5

\[\bar{x}^{'} = \frac{1}{n} \sum\limits^{3}_{k=1} \bar{x}_{k}^{'} \cdot n_{k} = \frac{1}{14} (7,5 \cdot 4 + 12,5 \cdot 5 + 17,5 \cdot 5) = 12,8571 \approx \bar{x}\]

d) Bestimmen Sie aus der klassierten Häufigkeitsverteilung ein möglichst kleines Intervall, welches das arithmetische Mittel enthält.

\[\bar{x}\ho{max} = \frac{1}{n} \sum\limits^{3}_{k=1} \bar{x}_{k}\ho{max} \cdot n_{k} = \frac{1}{14} (10 \cdot 4 + 15 \cdot 5 + 20 \cdot 5) = 15,3571\]
\[\bar{x}\ho{min} = \frac{1}{n} \sum\limits^{3}_{k=1} \bar{x}_{k}\ho{min} \cdot n_{k} = \frac{1}{14} (5 \cdot 4 + 10 \cdot 5 + 15 \cdot 5) = 10,3571\]
\[\implies \bar{x} \in \text{(}10,3571 ; 15,3571\text{]}\]

Aufgabe 3)

Der Absatz eines Gutes ist in nachfolgender Tabelle gegeben. Berechnen Sie die mittlere jährliche relative Absatzsteigerung.

Absatztabelle.

Jahr \(i\)

1

2

3

4

5

6

7

8

9

10

11

Absatz \(x_{[i]}\)

9

20

40

75

90

140

224

410

705

1.036

1.718

Bei der folgenden Wurzel wählen wir die 10’Wurzel, da wir 10 Periodendurchläufe haben.

\[\bar{x}\ho{Geo} = \sqrt[10]{\frac{x_{2}}{x_{1}} \cdot \frac{x_{3}}{x_{2}} \cdot ~~ \cdots ~~ \cdot \frac{x_{11}}{x_{10}}} = \sqrt[10]{\frac{x_{11}}{x_{1}}} = \sqrt[10]{\frac{1718}{9}} = 1,6907\]

\(\implies\) Es liegt eine durchschnittliche jährliche Absatzsteigerung von 69% vor.

Aufgabe 4)

Für vier Länder seien sowohl das BIP als auch das BIP/Kopf (jeweils in ) gegeben

BIP-Tabelle.

BIP

15.000

24.000

15.000

25.000

BIP/Kopf

1.500

500

1.250

2.500

Bestimmen Sie das länderübergreifende mittlere BIP/Kopf.

Zunächst gilt es zu Bedenken, dass in “jedem” Land die Bemessungsgrundlange verschieden ist. Somit gilt es das harmonische Mittel zu Betrachten.

\[\bar{x}\ho{Ham} = \frac{n}{\sum\limits^{k}_{k=1} \frac{n_{k}}{x_{k}}} = \frac{1500 + \cdots + 25000}{\frac{1500}{15000} + \cdots + \frac{2500}{25000}} = 987,5\]