Übung 5¶
Das lineare Regressionsmodell¶
Aufgabe 1)¶
Gegeben sei folgende Tabelle:
Plan |
26 |
36 |
31 |
25 |
29 |
37 |
40 |
22 |
|---|---|---|---|---|---|---|---|---|
Tat |
35.0 |
42.5 |
37.5 |
34.0 |
31.3 |
40.5 |
57.0 |
35.0 |
Jedes Beobachtungspaar repräsentiert eine Busverbindung in Hamburg. Plan ist die Fahrzeit nach Fahrplan. Tat ist die tatsächlich benötigte Fahrzeit eines sich nach dem Fahrplan richtenden Fahrgastes (jeweils in Minuten).
a) Stellen Sie eine sinnvolle Regressionsbeziehung zwischen den beiden Merkmalen Plan und Tat im Rahmen des linearen Regressionsmodells auf.¶
Regressionsbeziehung zwischen den beiden Merkmalen Plan und Tat.
Aus der Definition des Einfach Regressionsmodell (F.243):
Erfolgt:
b) Zeichnen Sie das dazugehörige Streudiagramm.¶
c) Bestimmen Sie die geschätzte Regressionsgerade nach der Methode der kleinsten Quadrate und zeichnen Sie diese in das Streudiagramm ein.¶
Bestimmung über das Arithmetische Mittel (F.62):
Bestimmung mittels des Verschiebesatzes / Varianz (F.94):
Bestimmung der Standardabweichung aus der Wurzel der Varianz \(sqrt{s^2}\) (F.93/96):
Dies Ergebnis stellt einen fast perfekten Zusammenhang zwischen Tat und Plan + Konstante a dar! Ebenfalls ist zu erkennen, dass dies fast unabhängig von der Fahrzeit des Busses ist.
d) TODO Interpretieren Sie die geschätzten Regressionskoeffizienten im Kontext.¶
e) Geben Sie an, welche tatsächliche Fahrzeit Sie erwarten würden, wenn nach Plan 24 Minuten vorgesehen sind.¶
Aufgabe 2)¶
In einem Schwellenland wurde eine Studie zum Zusammenhang zwischen dem Einkommen der Eltern X und dem Geburtsgewicht des Kindes Y durchgeführt. Dabei wurden das monatliche Einkommen \(x_{i}\) in 1.000 GE und das Geburtsgewicht \(y_{i}\) in Pfund betrachtet:
x_i |
2.7 |
1.9 |
3.1 |
3.9 |
4.0 |
3.4 |
2.1 |
2.9 |
|---|---|---|---|---|---|---|---|---|
y_i |
5 |
6 |
9 |
8 |
7 |
6 |
7 |
8 |
a) Stellen Sie eine sinnvolle Regressionsbeziehung zwischen den beiden Merkmalen X und Y im Rahmen des linearen Regressionsmodells auf.¶
Die Definition des linearen Einfachregressionsmodells, welches den linearen Zusammenhang der beiden Merkmalen X und Y aufzeigt, lautet: (F.241)
Aus der Definition des Einfach Regressionsmodell (F.243) leiten wir wiederum ab:
b) Zeichnen Sie das dazugehörige Streudiagramm.¶
c) Bestimmen Sie die geschätzte Regressionsgerade nach der Methode der kleinsten Quadrate und zeichnen Sie diese in das Streudiagramm ein.¶
Als Regressionsgerade ergibt sich somit:
d) Das Einkommen einer Familie betrage 3.000 GE. Geben Sie an, welches Geburtsgewicht des Kindes Sie erwarten würden.¶
e) Entscheiden Sie, ob die gewählte Regressionsbeziehung geeignet ist. Nutzen Sie das Bestimmtheitsmaß für Ihre Entscheidung.¶
Bestimmung des Bestimmtheitsmaßes im Einfachregressionsmodell (F.270)
\(\implies\) Nur 10,75% kann durch das Modell erklärt werden. Die Reggression ist hier eher ungeeignet.
Aufgabe 3)¶
Gegeben sei folgende geschätzte Regressionsgerade:
Dabei ist schlaf die Zeit in Minuten, die pro Woche zum Schlafen genutzt wird. arbeit gibt die Minutenanzahlan, die pro Woche gearbeitet wird.
a) Interpretieren Sie den Achsenabschnitt.¶
(Wenn man 0 Min. Arbeiten würde.)
b) Angenommen arbeit steige um 2 Stunden pro Woche. Geben Sie an, wie sich diese Erhöhung auf schlaf auswirkt und, ob es sich um einen großen Effekt handelt.¶
(Wenn man 2 Stunden in der Woche arbeitet, hat man ca. 3 Minuten weniger schlaf als ohne Arbeit.)
Im gesamten ist somit also der Wert der “Effizienz” hier mit 0,5% sehr klein.