Übung 3

Beschreibung univariater Datensätze II

Aufgabe 1)

Gegeben sei für \(n\) = 10 Beobachtungen der Verlauf der empirischen Verteilungsfunktion \(\hat{F}(x)\):

../../../../_images/Aufg1.svg

Stufen-Graph zu Aufgabe 1.

a) Geben Sie an, welche Merkmalsausprägungen beobachtet wurden.

zu a) mit geschätzten Werten.

\(x_{[i]}\)

1

2

4

5

7

8

9

\(\sum\)

\(h_{i}\)

0.1

0.2

0.1

0.2

0.1

0.2

0.1

1

\(H_{i}\)

1

2

1

2

1

2

1

6

b) Bestimmen Sie den Modus.

Resultierend aus a) ergibt sich für die am meist auftretende Häufigkeit der Elemente im Datensatz:

\[\bar{x}^{Mod} = \{{2}\}\]

c) Lesen Sie F(3) sowie F(0,5) und \(z_{0,25}\), \(z_{0,50}\), \(z_{0,60}\) sowie \(z_{0,75}\) ab.

\[\hat{F}(3) = 0,3\]
\[\hat{F}(0.5) = 0\]
\[z_{0.25} = 2\]
\[z_{0.50} = 5\]
\[z_{0.60} = 5\]
\[z_{0.75} = 8\]

Aufgabe 2)

Gegeben seien nachfolgende 17 Werte:

Datensatz-Tabelle.

\(x_{[i]}\)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

Datensatz

0

0

1

2

2

3

3

3

3

4

5

6

6

7

8

9

15

a) Zeichnen Sie den dazugehörigen Boxplot.

Die folgenden Werte gilt es zunächst aus dem Datensatz zu Erarbeiten:

Bestimmung der Quartile der Box:

\[x_{[1]}, ~~~~~ z_{0,25}, ~~~~~ \bar{x}\ho{Med}, ~~~~~ z_{0,25}, ~~~~~ x_{[17]}\]

Es folgt:

\[x_{[1]} = 0 ~~~~~ ; ~~~~~ x_{[17]} = 15\]

Die Anzahl an Elementen in unserem Datensatz ist ungerade, demnach gilt:

\[\bar{x}\ho{Med} = \bar{x}\ho{Med}_{[\frac{n+1}{2}]} = \bar{x}\ho{Med}_{[\frac{17+1}{2}=9]} = 3\]

Grafisch aufgezeigt:

../../../../_images/sumoccasion.svg

Summe der Häufigkeiten der Elemente im Datensatz.

\[z_{0,25} = n \cdot 0,25 = 4,25 ~~~~~ \Rightarrow x_{[5]} = 2\]
\[z_{0,75} = n \cdot 0,75 = 12,75 ~~~~~ \Rightarrow x_{[13]} = 6\]

Passend zu den zuvor gegebenen Datensatz, sieht unser Boxplot dann wie folgt aus:

../../../../_images/template-boxplot.svg

Boxplot zu den Elementen im Datensatz.

b) Treffen Sie eine Aussage zur Schiefe. Begründen Sie Ihre Aussage.

\[\gamma_{1,Q(P)} = \frac{(z_{1-p} - \bar{x}\ho{Med}) - (\bar{x}\ho{Med} - z_{p})}{z_{1-p} - z_{p}} = \frac{(6-3) - (3-2)}{6-2} = \frac{2}{4} = \frac{1}{2}\]
\[\implies \gamma_{1,Q} > 0 ~~~~~~~~~ \implies \text{Linkssteil bzw. rechtsschief}\]

Dies lässt sich auch recht leicht anhand der Boxplot-Abbildung erkennen.

Aufgabe 3)

Es wurden sechs Personen zu ihrem Jahreseinkommen (in 1.000 €) befragt. Dabei ergab sich folgende Tabelle:

Zunächst werden die gegebenen Werte aus der Tabelle sortiert und die Tabelle erweitert:

Jahreseinkommens-Tabelle.

\(\text{Person}_{k}\)

Einkommen

\(\text{P}_{k}\)

\(\text{CR}_{k}\)

extra 2P-Linie

extra Diagonale

0

0

0

0

0

0

1

100

0.500

0.500

1

2

40

0.200

0.700

3

25

0.125

0.825

4

15

0.075

0.900

5

15

0.075

0.975

6

5

0.025

1

1

1

Errechnung von \(\text{P}_{k}\):

\[\text{P}_{k} = \frac{x_{k}}{\sum\limits^{m}_{i=1} x_{k}}\]

Errechnung von \(\text{CR}_{k}\):

\[\text{CR}_{k} = \sum\limits^{k}_{i=1} \text{P}_{i}\]

a) Zeichnen Sie die dazugehörige Konzentrationskurve.

../../../../_images/Aufg3-fig1.svg

Konzentrationskurve zum Datensatz.

b) Das Gesamteinkommen beträgt 200.000 €. Eine Person verdient 100.000 €, also genau die Hälfte. Entscheiden Sie, ob man von einer hohen Konzentration sprechen kann. Begründen Sie Ihre Antwort.

\[\text{H} = \sum\limits^{m}_{k=1} h_{k}^2 = \sum\limits^{m}_{k=1} P_{k}^2 = 0,5^2 + \cdots + 0,0025^2 = 0,3175\]
\[\frac{1}{n} \le \text{H} \le 1\]
\[\implies 0,3175 ~~~ \text{eher an der Untergrenze} ~~~ \frac{1}{6} ~~~ \text{als an} ~~ 1.\]
\[\implies \text{keine starke Konzentration}.\]

Aufgabe 4)

Ein Markt mit zehn Unternehmen setzt insgesamt 15 Mio. € um und kann nach dem Umsatz in drei Klassen (klein, mittel, groß) unterteilt werden. Auf dem Markt agieren fünf kleine Unternehmen, vier mittlere Unternehmen und ein Marktführer. Die mittleren Unternehmen setzen dabei je 1,5 Mio. € um. Der Marktführer erzielt einen Umsatz von 6 Mio. €.

a) Zeichnen Sie die Lorenzkurve und bestimmen Sie den Gini-Koeffizienten. Beurteilen Sie die Konzentration.

This is the caption fitting to its meaning.

\(k\)

\(n_k\)

\(h_k\)

\(x_k\)

\(u_k\)

\(v_k\)

diagonal

0

0

0

0

0

0

1(kleine)

5

0.5

3

0.5

0.2

2(mittlere)

4

0.4

6

0.9

0.6

3(groß)

1

0.1

6

1

1

1

\(\sum\)

10

1

15

../../../../_images/aufg4-gnuplot-gini-plot.svg

Lorenzkurve mit Gini-Koeffizienten.

\[u_{k} = \sum h_{k}\]
\[v_{k} = \frac{\sum\limits^{k}_{i=1} x_{[i]}}{\sum\limits^{n}_{i=1} x_{i}}\]
\[\begin{split}\text{G} = 1 - \sum (v_{k} + v_{k-1}) \cdot (u_{k} - u_{k-1})\\ = 1 - [0,2 \cdot 0,5 + 0,8 \cdot 0,4 + 1,6 \cdot 0,1] = 0,42\end{split}\]
\[\implies 0 \le \text{G} \le \frac{n-1}{n} = 0,9 ~~ \Rightarrow ~~ \text{mittlere Konzentration}\]

b) Auf einem zweiten Markt agieren vier Unternehmen. Dabei beträgt \(G_{2}\) = 0,39. Geben Sie an, welcher der beiden Märkte eine höhere Konzentration aufweist.

\[\text{G}^{*} = \frac{G}{G_{\text{max}}} = \frac{n}{n-1} \cdot \text{G}\]
\[\text{G}_{1}^{*} = \frac{n}{n-1} \cdot \text{G}_{1} = \frac{10}{9} \cdot 0,42 = 0,4\bar{6}\]
\[\text{G}_{2}^{*} = \frac{n}{n-1} \cdot \text{G}_{2} = \frac{4}{3} \cdot 0,39 = 0,52\]
\[\implies \text{höhere Konzentration als in a).}\]