1. Berechnung von Mittelwert, Varianz und Kovarianz
Aufgabe:
Gegeben ist folgende Tabelle mit Werten für zwei Variablen \(X\) und \(Y\):
\(X\)
\(Y\)
2
3
4
7
6
5
8
9
10
11
Berechne den Mittelwert von \(X\), den Mittelwert von \(Y\), die Varianz von \(X\), die Varianz von \(Y\) und die Kovarianz zwischen \(X\) und \(Y\). Interpretiere anschließend die Kovarianz hinsichtlich der Beziehung zwischen \(X\) und \(Y\).
Interpretation der Kovarianz:
Die Kovarianz ((X, Y) = 7.2) ist positiv. Das bedeutet, dass \(X\) und \(Y\) positiv korreliert sind. Wenn die Werte von \(X\) steigen, tendieren auch die Werte von \(Y\) dazu, zu steigen, und umgekehrt. Eine positive Kovarianz zeigt somit eine gemeinsame Bewegungsrichtung der beiden Variablen an.
2. Beschreibung von Skalenniveaus von Variablen
Aufgabe:
Bestimme das Skalenniveau (nominal, ordinal, metrisch) der folgenden Variablen:
a) Geschlecht (männlich, weiblich, divers)
b) Schulnoten (1, 2, 3, 4, 5, 6)
c) Temperatur in Celsius
d) Lieblingsfarbe (rot, blau, grün, etc.)
e) Körpergröße in cm
Musterlösung
Musterlösung
Geschlecht: Nominal (Kategorien ohne Reihenfolge)
Schulnoten: Ordinal (Kategorien mit Reihenfolge, aber ungleiche Abstände)
Temperatur in Celsius: Metrisch (kontinuierliche Werte mit gleichen Abständen, aber kein absoluter Nullpunkt)
Lieblingsfarbe: Nominal (Kategorien ohne Reihenfolge)
Körpergröße in cm: Metrisch (kontinuierliche Werte mit wahrem Nullpunkt)
3. Berechnung von Wahrscheinlichkeiten mit Additions- und Multiplikationsregeln
Aufgabe:
In einem Kartenspiel mit 52 Karten (4 Farben, 13 Werte) ziehst du zwei Karten nacheinander ohne Zurücklegen. Berechne:
a) Die Wahrscheinlichkeit, dass die erste Karte ein Ass ist.
b) Die Wahrscheinlichkeit, dass die zweite Karte ein Ass ist, wenn die erste Karte ein Ass war.
c) Die Wahrscheinlichkeit, dass beide Karten Asse sind.
Musterlösung
Musterlösung
Erste Karte ein Ass:
Es gibt 4 Asse in einem Deck mit 52 Karten. Das Ereignis \(A_1\) (erste Karte ist ein Ass) hat die Wahrscheinlichkeit: \[
P(A_1) = \frac{\text{Anzahl der Asse}}{\text{Gesamtanzahl der Karten}} = \frac{4}{52} = \frac{1}{13} \approx 0.0769
\]
Zweite Karte ein Ass, wenn erste Karte ein Ass war:
Nachdem die erste Karte ein Ass war, bleiben 3 Asse und 51 Karten im Deck. Das Ereignis \(A_2\) (zweite Karte ist ein Ass) unter der Bedingung \(A_1\) hat die bedingte Wahrscheinlichkeit: \[
P(A_2 \mid A_1) = \frac{\text{Anzahl der verbleibenden Asse}}{\text{Anzahl der verbleibenden Karten}} = \frac{3}{51} = \frac{1}{17} \approx 0.0588
\]
Formalisierung: Die bedingte Wahrscheinlichkeit ist definiert als: \[
P(A_2 \mid A_1) = \frac{P(A_1 \cap A_2)}{P(A_1)}
\]
Dabei ist \(P(A_1 \cap A_2)\) die Wahrscheinlichkeit, dass beide Karten Asse sind (siehe c)), und \(P(A_1) = \frac{4}{52}\).
Beide Karten sind Asse:
Das Ereignis, dass beide Karten Asse sind, ist die Schnittmenge \(A_1 \cap A_2\). Nach der Multiplikationsregel für abhängige Ereignisse: \[
P(A_1 \cap A_2) = P(A_1) \cdot P(A_2 \mid A_1) = \frac{1}{13} \cdot \frac{1}{17} = \frac{1}{221} \approx 0.0045
\]
Alternative Berechnung:
- Erste Karte ein Ass: \(\frac{4}{52}\).
- Zweite Karte ein Ass (nach Ziehen eines Asses): \(\frac{3}{51}\).
- Gesamtwahrscheinlichkeit:
Aufgabe:
In einer Firma sind 60 % der Angestellten männlich. 30 % der männlichen Angestellten und 40 % der weiblichen Angestellten haben einen Hochschulabschluss. Berechne die Wahrscheinlichkeit, dass ein zufällig ausgewählter Angestellter mit Hochschulabschluss männlich ist.
Musterlösung
Musterlösung
Gegeben:
- \(P(M) = 0.6\): 60 % der Angestellten sind männlich.
- \(P(W) = 0.4\): 40 % der Angestellten sind weiblich (da \(P(M) + P(W) = 1\)).
- \(P(H \mid M) = 0.3\): 30 % der männlichen Angestellten haben einen Hochschulabschluss.
- \(P(H \mid W) = 0.4\): 40 % der weiblichen Angestellten haben einen Hochschulabschluss. Gesucht:
- \(P(M \mid H)\): Wahrscheinlichkeit, dass ein Angestellter männlich ist, unter der Bedingung, dass er einen Hochschulabschluss hat.
Schritt-für-Schritt-Berechnung
1. Definition der Ereignisse
\(M\): Der Angestellte ist männlich.
\(W\): Der Angestellte ist weiblich.
\(H\): Der Angestellte hat einen Hochschulabschluss.
2. Anwendung des Satzes von Bayes
Die gesuchte Wahrscheinlichkeit \(P(M \mid H)\) wird mit dem Satz von Bayes berechnet: \[
P(M \mid H) = \frac{P(H \mid M) \cdot P(M)}{P(H)}
\]
Hierbei ist \(P(H)\) die Gesamtwahrscheinlichkeit, dass ein Angestellter einen Hochschulabschluss hat, unabhängig vom Geschlecht.
3. Berechnung von \(P(H)\)
Da ein Angestellter entweder männlich oder weiblich ist (disjunkte und vollständige Partition), verwenden wir die Formel der totalen Wahrscheinlichkeit: \[
P(H) = P(H \mid M) \cdot P(M) + P(H \mid W) \cdot P(W)
\]
Einsetzen der gegebenen Werte: \[
P(H) = (0.3 \cdot 0.6) + (0.4 \cdot 0.4)
\]
- Männlicher Beitrag: \(0.3 \cdot 0.6 = 0.18\)
- Weiblicher Beitrag: \(0.4 \cdot 0.4 = 0.16\)
- Summe: \[
P(H) = 0.18 + 0.16 = 0.34
\]
Also: 34 % aller Angestellten haben einen Hochschulabschluss.
4. Berechnung von \(P(M \mid H)\)
Nun setzen wir die Werte in die Bayes-Formel ein: \[
P(M \mid H) = \frac{P(H \mid M) \cdot P(M)}{P(H)} = \frac{0.3 \cdot 0.6}{0.34} = \frac{0.18}{0.34}
\]
Berechnung: \[
\frac{0.18}{0.34} = \frac{18}{34} = \frac{9}{17} \approx 0.52941176
\]
Gerundet: \[
P(M \mid H) \approx 0.5294 \text{ oder } 52.94 \, \%
\]
Alternative Sichtweise: Intuitives Beispiel
Um die Lösung zu veranschaulichen, nehmen wir an, die Firma hat 100 Angestellte:
- 60 Angestellte sind männlich (\(0.6 \cdot 100\)).
- 40 Angestellte sind weiblich (\(0.4 \cdot 100\)).
- Von den 60 männlichen Angestellten haben 30 % einen Hochschulabschluss: \[
0.3 \cdot 60 = 18 \text{ männliche Angestellte mit Hochschulabschluss}
\]
- Von den 40 weiblichen Angestellten haben 40 % einen Hochschulabschluss: \[
0.4 \cdot 40 = 16 \text{ weibliche Angestellte mit Hochschulabschluss}
\]
- Insgesamt haben \(18 + 16 = 34\) Angestellte einen Hochschulabschluss.
- Die Wahrscheinlichkeit, dass ein Angestellter mit Hochschulabschluss männlich ist: \[
\frac{\text{Männliche Angestellte mit Hochschulabschluss}}{\text{Gesamtanzahl Angestellte mit Hochschulabschluss}} = \frac{18}{34} = \frac{9}{17} \approx 0.5294
\]
Dies bestätigt die formale Berechnung.
Baumdiagramm zur Visualisierung
Ein Baumdiagramm verdeutlicht die Wahrscheinlichkeiten:
1. Erster Ast: Geschlecht
- Männlich: \(P(M) = 0.6\)
- Weiblich: \(P(W) = 0.4\)
2. Zweiter Ast: Hochschulabschluss
- Für männlich:
- Hochschulabschluss: \(P(H \mid M) = 0.3\)
- Kein Hochschulabschluss: \(P(\neg H \mid M) = 0.7\)
- Für weiblich:
- Hochschulabschluss: \(P(H \mid W) = 0.4\)
- Kein Hochschulabschluss: \(P(\neg H \mid W) = 0.6\)
3. Pfadwahrscheinlichkeiten:
- Männlich und Hochschulabschluss: \(P(M \cap H) = 0.3 \cdot 0.6 = 0.18\)
- Weiblich und Hochschulabschluss: \(P(W \cap H) = 0.4 \cdot 0.4 = 0.16\)
4. Gesamtwahrscheinlichkeit für Hochschulabschluss: \[
P(H) = 0.18 + 0.16 = 0.34
\]
5. Bedingte Wahrscheinlichkeit: \[
P(M \mid H) = \frac{P(M \cap H)}{P(H)} = \frac{0.18}{0.34} \approx 0.5294
\]
Interpretation
Die Wahrscheinlichkeit, dass ein zufällig ausgewählter Angestellter mit Hochschulabschluss männlich ist, beträgt etwa 52.94 %. Obwohl 60 % der Angestellten männlich sind, ist der Anteil der männlichen Angestellten mit Hochschulabschluss (30 %) geringer als der der weiblichen (40 %), was die Wahrscheinlichkeit nahe an 50 % bringt.
5. Umrechnen von Werten einer Normalverteilung zur Standardnormalverteilung
Aufgabe:
Eine Zufallsvariable \(X\) ist normalverteilt mit \(\mu = 50\) und \(\sigma = 10\). Berechne die Wahrscheinlichkeit, dass \(X < 60\), indem du den Wert in die Standardnormalverteilung umrechnest und aus einer Standardnormalverteilungstabelle abliest.
Musterlösung
Musterlösung
Standardisiere \(X = 60\): \[
Z = \frac{X - \mu}{\sigma} = \frac{60 - 50}{10} = 1
\] In der Tabelle für \(Z = 1.00\) findest du \(\Phi(1.00) = 0.8413\).
Also: \[
P(X < 60) = P(Z < 1) = 0.8413
\]
6. Ablesen von Quantilen aus einem Boxplot
Aufgabe:
Erstelle mit Python einen Boxplot für eine Verteilung mit folgenden Eigenschaften: Die Box erstreckt sich von 20 bis 60, der Median liegt bei 40, und die Whisker reichen von 10 bis 70. Sieh dir den Boxplot in Figure 1 an und bestimme das 25 %-Quantil, das 50 %-Quantil (Median) und das 75 %-Quantil.
import numpy as npimport matplotlib.pyplot as plt# Daten generieren, die den Anforderungen entsprechennp.random.seed(42)data = np.concatenate([ np.random.uniform(10, 20, 25), # Unterer Whisker bis Q1 np.random.uniform(20, 40, 25), # Q1 bis Median np.random.uniform(40, 60, 25), # Median bis Q3 np.random.uniform(60, 70, 25) # Q3 bis oberer Whisker])plt.boxplot(data, vert=True, patch_artist=True, showmeans=False)plt.title('Boxplot der Verteilung')plt.ylabel('Werte')plt.grid(alpha=0.3)plt.show()
Figure 1: Boxplot zur Verteilung mit spezifizierten Quantilen.
Musterlösung
Musterlösung
25 %-Quantil (untere Quartil): Beginn der Box bei 20