Applets:WDF und VTF bei Gaußschen 2D Zufallsgrößen (Applet): Unterschied zwischen den Versionen

Aus LNTwww
Wechseln zu:Navigation, Suche
K (Textersetzung - „Biografien_und_Bibliografien/Beteiligte_der_Professur_Leitungsgebundene_%C3%9Cbertragungstechnik#Tasn.C3.A1d_Kernetzky.2C_M.Sc._.28bei_L.C3.9CT_seit_2014.29“ durch „Biografien_und_Bibliografien/An_LNTwww_beteiligte_LÜT-Angehörige#Dr.-Ing._Tasn.C3.A1d_Kernetzky_.28bei_L.C3.9CT_von_2014-2022.29“)
 
(23 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{LntAppletLink|verteilungen}}  
+
{{LntAppletLinkDeEn|gauss|gauss_en}}
 +
 
  
 
==Programmbeschreibung==
 
==Programmbeschreibung==
 
<br>
 
<br>
Dieses Applet ermöglicht die Berechnung und graphische Darstellung
+
Das Applet verdeutlicht die Eigenschaften zweidimensionaler Gaußscher Zufallsgrößen&nbsp; $XY\hspace{-0.1cm}$, gekennzeichnet durch die Standardabweichungen (Streuungen)&nbsp; $\sigma_X$&nbsp; und&nbsp; $\sigma_Y$&nbsp; ihrer beiden Komponenten sowie den Korrelationskoeffizienten&nbsp; $\rho_{XY}$&nbsp;zwischen diesen. Die Komponenten werden als mittelwertfrei vorausgesetzt:&nbsp; $m_X = m_Y = 0$.
*der Wahrscheinlichkeiten ${\rm Pr}(z=\mu)$ einer diskreten Zufallsgröße $z \in \{\mu \} =  \{0, 1, 2, 3, \text{...} \}$, welche die ''Wahrscheinlichkeitsdichtefunktion'' (WDF) &ndash; im Englischen ''Probability Density Function'' (PDF) &ndash; der Zufallsgröße $z$ bestimmen &ndash; hier Darstellung mit Diracfunktionen ${\rm \delta}( z-\mu)$:
 
:$$f_{z}(z)=\sum_{\mu=1}^{M}{\rm Pr}(z=\mu)\cdot {\rm \delta}( z-\mu),$$
 
*der Wahrscheinlichkeiten ${\rm Pr}(z \le \mu)$ der Verteilungsfunktion (VTF)  &ndash; im Englischen ''Cumulative Distribution Function'' (CDF):
 
:$$F_{z}(\mu)={\rm Pr}(z\le\mu).$$
 
  
 
+
Das Applet zeigt
Als diskrete Verteilungen stehen in zwei Parametersätzen zur Auswahl:
+
* die zweidimensionale Wahrscheinlichkeitsdichtefunktion &nbsp; &rArr; &nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$&nbsp; $f_{XY}(x, \hspace{0.1cm}y)$&nbsp; in dreidimensionaler Darstellung sowie in Form von Höhenlinien,
* die Binomialverteilung mit den Parametern $I$ und $p$ &nbsp; &rArr; &nbsp; $z \in  \{0, 1, \text{...} \ , I \}$ &nbsp; &rArr; &nbsp; $M = I+1$ mögliche Werte,
+
* die zugehörige Randwahrscheinlichkeitsdichtefunktion&nbsp; &rArr; &nbsp; $\rm 1D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$&nbsp; $f_{X}(x)$&nbsp;   der Zufallsgröße&nbsp; $X$&nbsp; als blaue Kurve; ebenso&nbsp; $f_{Y}(y)$&nbsp; für die zweite Zufallsgröße,  
*die Poissonverteilung mit Parameter $\lambda$ &nbsp; &rArr; &nbsp; $z \in  \{0, 1, 2, 3, \text{...}\}$ &nbsp; &rArr; &nbsp; $M \to \infty$.
+
* die zweidimensionale Verteilungsfunktion  &nbsp; &rArr; &nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$&nbsp; $F_{XY}(x, \hspace{0.1cm}y)$&nbsp; als 3D-Plot,
 
+
* die Verteilungsfunktion&nbsp; &rArr; &nbsp; $\rm 1D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$&nbsp; $F_{X}(x)$&nbsp; der Zufallsgröße&nbsp; $X$;  ebenso&nbsp; $F_{Y}(y)$&nbsp; als rote Kurve.
 
 
In der Versuchsdurchführung sollen Sie miteinander vergleichen:
 
* je zwei Binomialverteilungen mit unterschiedlichen Parameterwerten $I$ und $p$,
 
* je zwei Poissonverteilungen mit unterschiedlicher Rate $\lambda$,
 
*jeweils eine Binomial&ndash; und eine Poissonverteilung.
 
  
  
 +
Das Applet verwendet das Framework &nbsp;[https://en.wikipedia.org/wiki/Plotly Plot.ly]
 +
 
 
==Theoretischer Hintergrund==
 
==Theoretischer Hintergrund==
 
<br>
 
<br>
Zeile 29: Zeile 23:
 
{{BlaueBox|TEXT=   
 
{{BlaueBox|TEXT=   
 
$\text{Definition:}$&nbsp;  
 
$\text{Definition:}$&nbsp;  
Die &nbsp;'''Verbundwahrscheinlichkeitsdichtefunktion'''&nbsp; ist die Wahrscheinlichkeitsdichtefunktion (WDF, &nbsp;englisch:&nbsp; ''Probability Density Function'', kurz:&nbsp;PDF) der zweidimensionalen Zufallsgröße&nbsp; $XY$&nbsp; an der Stelle&nbsp; $(x, y)$&nbsp;
+
Die &nbsp;'''Verbundwahrscheinlichkeitsdichtefunktion'''&nbsp; ist die Wahrscheinlichkeitsdichtefunktion (WDF, &nbsp;englisch:&nbsp; ''Probability Density Function'', kurz:&nbsp;PDF) der zweidimensionalen Zufallsgröße&nbsp; $XY$&nbsp; an der Stelle&nbsp; $(x, y)$:
 
:$$f_{XY}(x, \hspace{0.1cm}y) =  \lim_{\left.{\Delta x\rightarrow 0 \atop {\Delta y\rightarrow 0} }\right.}\frac{ {\rm Pr}\big [ (x - {\rm \Delta} x/{\rm 2} \le X  \le x  + {\rm \Delta} x/{\rm 2}) \cap (y - {\rm \Delta} y/{\rm 2} \le Y \le y +{\rm \Delta}y/{\rm 2}) \big]  }{ {\rm \Delta} \ x\cdot{\rm \Delta} y}.$$
 
:$$f_{XY}(x, \hspace{0.1cm}y) =  \lim_{\left.{\Delta x\rightarrow 0 \atop {\Delta y\rightarrow 0} }\right.}\frac{ {\rm Pr}\big [ (x - {\rm \Delta} x/{\rm 2} \le X  \le x  + {\rm \Delta} x/{\rm 2}) \cap (y - {\rm \Delta} y/{\rm 2} \le Y \le y +{\rm \Delta}y/{\rm 2}) \big]  }{ {\rm \Delta} \ x\cdot{\rm \Delta} y}.$$
  
*Die Verbundwahrscheinlichkeitsdichtefunktion oder kurz&nbsp; $\text{2D-WDF}$&nbsp; ist eine Erweiterung der eindimensionalen WDF.
+
*Die Verbundwahrscheinlichkeitsdichtefunktion oder kurz&nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$&nbsp; ist eine Erweiterung der eindimensionalen WDF.
 
*$∩$&nbsp; kennzeichnet die logische UND-Verknüpfung.
 
*$∩$&nbsp; kennzeichnet die logische UND-Verknüpfung.
 
*$X$&nbsp; und&nbsp; $Y$ bezeichnen die beiden Zufallsgrößen, und&nbsp; $x \in X$&nbsp; sowie &nbsp; $y \in Y$ geben  Realisierungen hiervon an.
 
*$X$&nbsp; und&nbsp; $Y$ bezeichnen die beiden Zufallsgrößen, und&nbsp; $x \in X$&nbsp; sowie &nbsp; $y \in Y$ geben  Realisierungen hiervon an.
Zeile 45: Zeile 39:
 
*liefern lediglich statistische Aussagen über die Einzelkomponenten&nbsp; $X$&nbsp; bzw.&nbsp; $Y$,  
 
*liefern lediglich statistische Aussagen über die Einzelkomponenten&nbsp; $X$&nbsp; bzw.&nbsp; $Y$,  
 
*nicht jedoch über die Bindungen zwischen diesen.
 
*nicht jedoch über die Bindungen zwischen diesen.
 +
 +
 +
Als quantitatives Maß für die linearen statistischen Bindungen &nbsp; &rArr; &nbsp; '''Korrelation'''&nbsp; verwendet man
 +
* die&nbsp; '''Kovarianz'''&nbsp; $\mu_{XY}$, die bei mittelwertfreien Komponenten gleich dem gemeinsamen linearen Moment erster Ordnung ist:
 +
:$$\mu_{XY} = {\rm E}\big[X \cdot Y\big] = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} X \cdot Y \cdot f_{XY}(x,y) \,{\rm d}x \,  {\rm d}y ,$$ 
 +
*den&nbsp; '''Korrelationskoeffizienten'''&nbsp; nach Normierung auf die beiden  Effektivwerte &nbsp;$σ_X$&nbsp; und&nbsp;$σ_Y$&nbsp; der beiden Komponenten:
 +
:$$\rho_{XY}=\frac{\mu_{XY} }{\sigma_X \cdot \sigma_Y}.$$
 +
 +
{{BlaueBox|TEXT= 
 +
$\text{Eigenschaften des Korrelationskoeffizienten:}$&nbsp;
 +
*Aufgrund der Normierung gilt stets&nbsp;  $-1 \le  ρ_{XY}  ≤ +1$.
 +
*Sind die beiden Zufallsgrößen &nbsp;$X$&nbsp; und &nbsp;$Y$ unkorreliert, so ist &nbsp;$ρ_{XY} = 0$.
 +
*Bei strenger linearer Abhängigkeit zwischen &nbsp;$X$&nbsp; und &nbsp;$Y$ ist &nbsp;$ρ_{XY}= ±1$ &nbsp; &rArr; &nbsp; vollständige Korrelation.
 +
*Ein positiver Korrelationskoeffizient bedeutet, dass bei größerem &nbsp;$X$–Wert im statistischen Mittel auch &nbsp;$Y$&nbsp; größer ist als bei kleinerem &nbsp;$X$.
 +
*Dagegen drückt ein negativer Korrelationskoeffizient aus, dass &nbsp;$Y$&nbsp; mit steigendem &nbsp;$X$&nbsp; im Mittel kleiner wird.}} 
 
<br><br>
 
<br><br>
  
Zeile 50: Zeile 59:
  
 
Für den Sonderfall&nbsp; '''Gaußscher Zufallsgrößen'''&nbsp; – der Name geht auf den Wissenschaftler&nbsp; [https://de.wikipedia.org/wiki/Carl_Friedrich_Gau%C3%9F Carl Friedrich Gauß]&nbsp;  zurück – können wir weiterhin vermerken:  
 
Für den Sonderfall&nbsp; '''Gaußscher Zufallsgrößen'''&nbsp; – der Name geht auf den Wissenschaftler&nbsp; [https://de.wikipedia.org/wiki/Carl_Friedrich_Gau%C3%9F Carl Friedrich Gauß]&nbsp;  zurück – können wir weiterhin vermerken:  
*Die Verbund&ndash;WDF einer Gaußschen 2D-Zufallsgröße&nbsp; $XY$&nbsp; mit Mittelwerten&nbsp; $m_X = 0$,&nbsp; $m_Y = 0$&nbsp;  und Korrelationskoeffizienten&nbsp; $ρ = ρ_{XY}$&nbsp; lautet:  
+
*Die Verbund&ndash;WDF einer Gaußschen 2D-Zufallsgröße&nbsp; $XY$&nbsp; mit Mittelwerten&nbsp; $m_X = 0$&nbsp; und&nbsp; $m_Y = 0$&nbsp;  sowie dem Korrelationskoeffizienten&nbsp; $ρ = ρ_{XY}$&nbsp; lautet:  
 
:$$f_{XY}(x,y)=\frac{\rm 1}{\rm 2\it\pi \cdot \sigma_X \cdot \sigma_Y \cdot \sqrt{\rm 1-\rho^2}}\ \cdot\ \exp\Bigg[-\frac{\rm 1}{\rm 2 \cdot (1-\it\rho^{\rm 2} {\rm)}}\cdot(\frac {\it x^{\rm 2}}{\sigma_X^{\rm 2}}+\frac {\it y^{\rm 2}}{\sigma_Y^{\rm 2}}-\rm 2\it\rho\cdot\frac{x \cdot y}{\sigma_x \cdot \sigma_Y}\rm ) \rm \Bigg]\hspace{0.8cm}{\rm mit}\hspace{0.5cm}-1 \le \rho \le +1.$$
 
:$$f_{XY}(x,y)=\frac{\rm 1}{\rm 2\it\pi \cdot \sigma_X \cdot \sigma_Y \cdot \sqrt{\rm 1-\rho^2}}\ \cdot\ \exp\Bigg[-\frac{\rm 1}{\rm 2 \cdot (1-\it\rho^{\rm 2} {\rm)}}\cdot(\frac {\it x^{\rm 2}}{\sigma_X^{\rm 2}}+\frac {\it y^{\rm 2}}{\sigma_Y^{\rm 2}}-\rm 2\it\rho\cdot\frac{x \cdot y}{\sigma_x \cdot \sigma_Y}\rm ) \rm \Bigg]\hspace{0.8cm}{\rm mit}\hspace{0.5cm}-1 \le \rho \le +1.$$
 
*Ersetzt man&nbsp; $x$&nbsp; durch&nbsp; $(x - m_X)$&nbsp; sowie&nbsp; $y$&nbsp; durch&nbsp; $(y- m_Y)$, so ergibt sich die allgemeinere WDF einer zweidimensionalen Gaußschen Zufallsgröße mit Mittelwert.  
 
*Ersetzt man&nbsp; $x$&nbsp; durch&nbsp; $(x - m_X)$&nbsp; sowie&nbsp; $y$&nbsp; durch&nbsp; $(y- m_Y)$, so ergibt sich die allgemeinere WDF einer zweidimensionalen Gaußschen Zufallsgröße mit Mittelwert.  
Zeile 64: Zeile 73:
 
*Bei keiner anderen WDF kann aus der&nbsp; ''Unkorreliertheit''&nbsp; auf die&nbsp; ''statistische Unabhängigkeit''&nbsp; geschlossen werden.  
 
*Bei keiner anderen WDF kann aus der&nbsp; ''Unkorreliertheit''&nbsp; auf die&nbsp; ''statistische Unabhängigkeit''&nbsp; geschlossen werden.  
 
*Man kann aber stets  &nbsp; ⇒ &nbsp;  für jede beliebige 2D–WDF&nbsp; $f_{XY}(x, y)$&nbsp; von der&nbsp; ''statistischen Unabhängigkeit''&nbsp; auf die&nbsp; ''Unkorreliertheit''&nbsp; schließen, weil:  
 
*Man kann aber stets  &nbsp; ⇒ &nbsp;  für jede beliebige 2D–WDF&nbsp; $f_{XY}(x, y)$&nbsp; von der&nbsp; ''statistischen Unabhängigkeit''&nbsp; auf die&nbsp; ''Unkorreliertheit''&nbsp; schließen, weil:  
*Sind zwei Zufallsgrößen&nbsp; $X$&nbsp; und&nbsp; $Y$&nbsp; völlig voneinander (statistisch) unabhängig, so gibt es zwischen ihnen natürlich auch keine ''linearen''&nbsp; Abhängigkeiten &nbsp;  <br>⇒ &nbsp;  sie sind dann auch unkorreliert. }}
+
*Sind zwei Zufallsgrößen&nbsp; $X$&nbsp; und&nbsp; $Y$&nbsp; völlig voneinander (statistisch) unabhängig, so gibt es zwischen ihnen natürlich auch keine ''linearen''&nbsp; Abhängigkeiten &nbsp;  <br>⇒ &nbsp;  sie sind dann auch unkorreliert&nbsp; &rArr; &nbsp; $ρ = 0$. }}
 
+
<br><br>
 +
===Höhenlinien bei unkorrelierten Zufallsgrößen===
  
[[Datei:P_ID630__Sto_T_4_2_S1_neu.png |right|frame| Gaußsche 2D-WDF und 2D-VTF]]
+
[[Datei:Sto_App_Bild2.png |frame| Höhenlinien der 2D-WDF bei unkorrelierten Größen | rechts]]
{{GraueBox|TEXT= 
+
Aus der Bedingungsgleichung&nbsp; $f_{XY}(x, y) = {\rm const.}$&nbsp; können die Höhenlinien der WDF berechnet werden.
$\text{Beispiel 1:}$&nbsp; Die beiden Grafiken zeigen
 
*die Wahrscheinlichkeitsdichtefunktion (links) und
 
*Verteilungsfunktion (rechts)
 
  
 +
Sind die Komponenten&nbsp; $X$&nbsp; und&nbsp; $Y$ unkorreliert&nbsp; $(ρ_{XY} = 0)$, so erhält man als Gleichung für die Höhenlinien:
  
einer zweidimensionalen Gaußschen Zufallsgröße $(x, y)$ mit relativ starker positiver Korrelation der Einzelkomponenten: &nbsp; $ρ_{xy} = 0.8$.
+
:$$\frac{x^{\rm 2}}{\sigma_{X}^{\rm 2}}+\frac{y^{\rm 2}}{\sigma_{Y}^{\rm 2}} =\rm const.$$
 
+
Die Höhenlinien beschreiben in diesem Fall folgende Figuren:  
Wie bei den bisherigen Beispielen ist auch hier die 2D–Zufallsgröße in $x$–Richtung weiter ausgedehnt als in $y$–Richtung: &nbsp; $σ_x = 2 · σ_y$.  
+
*'''Kreise'''&nbsp; (falls&nbsp; $σ_X = σ_Y$, &nbsp; grüne Kurve), oder
 +
*'''Ellipsen'''&nbsp; (für&nbsp; $σ_X ≠ σ_Y$, &nbsp; blaue Kurve) in Ausrichtung der beiden Achsen.  
 
<br clear=all>
 
<br clear=all>
Diese Darstellungen können wie folgt interpretiert werden:
+
===Korrelationsgerade===
*Die WDF ist vergleichbar mit einem Bergkamm, der sich von links unten nach rechts oben erstreckt.
 
*Das Maximum liegt bei $m_x = 0$ und $m_y = 0$. Das bedeutet, dass die die 2D–Zufallsgröße mittelwertfrei ist.
 
*Die 2D–VTF als das Integral in zwei Richtungen über die 2D–WDF steigt von links unten nach rechts oben von $0$ auf $1$ kontinuierlich an. }}
 
  
 +
Als &nbsp;'''Korrelationsgerade'''&nbsp; bezeichnet man  die Gerade &nbsp;$y = K(x)$&nbsp;  in der &nbsp;$(x, y)$&ndash;Ebene durch den „Mittelpunkt” $(m_X, m_Y)$. Diese besitzt folgende Eigenschaften: 
 +
[[Datei:Sto_App_Bild1a.png|frame| Gaußsche 2D-WDF (Approximation mit $N$ Messpunkten) und <br>Korrelationsgerade &nbsp;$y = K(x)$]]
  
Das interaktive Applet  [[Applets:2D_Gauss|WDF und VTF bei Gaußschen 2D-Zufallsgrößen]] erlaubt die Darstellung der zweidimensionalen Funktionen für beliebige Werte von $σ_x, \ σ_y$ und $ρ_{xy}$.
+
*Die mittlere quadratische Abweichung von dieser Geraden – in &nbsp;$y$&ndash;Richtung betrachtet und über alle &nbsp;$N$&nbsp; Messpunkte gemittelt – ist minimal:  
+
:$$\overline{\varepsilon_y^{\rm 2} }=\frac{\rm 1}{N} \cdot \sum_{\nu=\rm 1}^{N}\; \;\big [y_\nu - K(x_{\nu})\big ]^{\rm 2}={\rm Minimum}.$$
 
+
*Die Korrelationsgerade kann als eine Art „statistische Symmetrieachse“ interpretiert werden. Die Geradengleichung lautet im allgemeinen Fall:  
==Zweidimensionale Verteilungsfunktion==
+
:$$y=K(x)=\frac{\sigma_Y}{\sigma_X}\cdot\rho_{XY}\cdot(x - m_X)+m_Y.$$
<br>
 
{{BlaueBox|TEXT= 
 
$\text{Definition:}$&nbsp; Die '''2D-Verteilungsfunktion''' ist ebenso wie die 2D-WDF lediglich eine sinnvolle Erweiterung der [[Stochastische_Signaltheorie/Verteilungsfunktion_(VTF)#VTF_bei_kontinuierlichen_Zufallsgr.C3.B6.C3.9Fen_.281.29|eindimensionalen Verteilungsfunktion]]  (VTF):  
 
:$$F_{xy}(r_{x},r_{y}) = {\rm Pr}\big [(x \le r_{x}) \cap (y \le r_{y}) \big ]  .$$}}
 
 
 
 
 
Es ergeben sich folgende Gemeinsamkeiten und Unterschiede zwischen der 1D-VTF und der 2D-VTF:
 
*Der Funktionalzusammenhang zwischen zweidimensionaler WDF und zweidimensionaler VTF ist wie im eindimensionalen Fall durch die Integration gegeben, aber nun in zwei Dimensionen. Bei kontinuierlichen Zufallsgrößen gilt:
 
:$$F_{xy}(r_{x},r_{y})=\int_{-\infty}^{r_{y}} \int_{-\infty}^{r_{x}} f_{xy}(x,y) \,\,{\rm d}x \,\, {\rm d}y  .$$
 
*Umgekehrt lässt sich die Wahrscheinlichkeitsdichtefunktion aus der Verteilungsfunktion durch partielle Differentiation nach $r_{x}$ und $r_{y}$ angeben:
 
:$$f_{xy}(x,y)=\frac{{\rm d}^{\rm 2} F_{xy}(r_{x},r_{y})}{{\rm d} r_{x} \,\, {\rm d} r_{y}}\Bigg|_{\left.{r_{x}=x \atop {r_{y}=y}}\right.}.$$
 
*Bezüglich der Verteilungsfunktion $F_{xy}(r_{x}, r_{y})$ gelten folgende Grenzwerte:
 
:$$F_{xy}(-\infty,-\infty) = 0,$$
 
:$$F_{xy}(r_{\rm x},+\infty)=F_{x}(r_{x} ),$$
 
:$$F_{xy}(+\infty,r_{y})=F_{y}(r_{y} ) ,$$
 
:$$F_{xy}+\infty,+\infty) = 1.$$
 
*Im Grenzfall (unendlich große $r_{x}$ und $r_{y}$) ergibt sich demnach für die 2D-VTF der Wert $1$. Daraus erhält man die '''Normierungsbedingung''' für die 2D-Wahrscheinlichkeitsdichtefunktion:
 
:$$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f_{xy}(x,y) \,\,{\rm d}x \,\,{\rm d}y=1  .   $$
 
 
 
{{BlaueBox|TEXT= 
 
$\text{Fazit:}$&nbsp; Beachten Sie den signifikanten Unterschied zwischen eindimensionalen und zweidimensionalen Zufallsgrößen:
 
*Bei eindimensionalen Zufallsgrößen ergibt die Fläche unter der WDF stets den Wert $1$.
 
*Bei zweidimensionalen Zufallsgrößen ist das WDF-Volumen immer gleich $1$.}}
 
  
==WDF und VTF bei statistisch unabhängigen Komponenten==
+
*Der Winkel, den die Korrelationsgerade zur &nbsp;$x$&ndash;Achse einnimmt, beträgt:  
<br>
+
:$$\theta={\rm arctan}(\frac{\sigma_{Y} }{\sigma_{X} }\cdot \rho_{XY}).$$
Bei statistisch unabhängigen Komponenten $x$ und $y$ gilt für die Verbundwahrscheinlichkeit nach den elementaren Gesetzmäßigkeiten der Statistik, falls $x$ und $y$ wertkontinuierlich sind:  
 
:$${\rm Pr} \big[(x_{\rm 1}\le x \le x_{\rm 2}) \cap( y_{\rm 1}\le y\le y_{\rm 2})\big] ={\rm Pr} (x_{\rm 1}\le x \le x_{\rm 2}) \cdot {\rm Pr}(y_{\rm 1}\le y\le y_{\rm 2}) .$$
 
Hierfür kann bei unabhängigen Komponenten auch geschrieben werden:
 
:$${\rm Pr} \big[(x_{\rm 1}\le x \le x_{\rm 2}) \cap(y_{\rm 1}\le y\le y_{\rm 2})\big] =\int _{x_{\rm 1}}^{x_{\rm 2}}f_{x}(x) \,{\rm d}x\cdot \int_{y_{\rm 1}}^{y_{\rm 2}} f_{y}(y) \, {\rm d}y.$$
 
  
{{BlaueBox|TEXT= 
 
$\text{Definition:}$&nbsp; Daraus folgt, dass bei '''statistischer Unabhängigkeit''' folgende Bedingung bezüglich der 2D&ndash;WDF erfüllt sein muss:
 
:$$f_{xy}(x,y)=f_{x}(x) \cdot f_y(y) .$$}}
 
  
  
{{GraueBox|TEXT=
+
===Höhenlinien bei korrelierten Zufallsgrößen===
$\text{Beispiel 2:}$&nbsp; In der Grafik sind die Momentanwerte einer zweidimensionalen Zufallsgröße als Punkte in der $(x, y)$-Ebene eingetragen.
 
*Bereiche mit vielen Punkten, die dementsprechend dunkel wirken, kennzeichnen große Werte der WDF $f_{xy}(x, y)$.
 
*Dagegen besitzt die Zufallsgröße $(x, y)$ in eher hellen Bereichen nur verhältnismäßig wenig Anteile.
 
  
 +
Bei korrelierten Komponenten&nbsp; $(ρ_{XY} ≠ 0)$&nbsp; sind die Höhenlinien der WDF (fast) immer elliptisch, also auch für den Sonderfall&nbsp; $σ_X = σ_Y$.
  
[[Datei:P_ID153__Sto_T_4_1_S4_nochmals_neu.png |frame| Statistisch unabhängige Komponenten: &nbsp; $f_{xy}(x,y)$, $f_{x}(x)$, $f_{y}(y)$]]
+
<u>Ausnahme:</u>&nbsp; $ρ_{XY}=\pm 1$ &nbsp; &rArr; &nbsp; Diracwand; siehe&nbsp; [[Aufgaben:Aufgabe_4.4:_Gaußsche_2D-WDF|Aufgabe 4.4]]&nbsp; im Buch &bdquo;Stochastische Signaltheorie&rdquo;, Teilaufgabe &nbsp;'''(5)'''.
 +
[[Datei:Sto_App_Bild3.png|right|frame|Höhenlinien der 2D-WDF bei korrelierten Größen]]
 +
Hier lautet die Bestimmungsgleichung der WDF-Höhenlinien:
  
Die Grafik kann wie folgt interpretiert werden:
+
:$$f_{XY}(x, y) = {\rm const.} \hspace{0.5cm} \Rightarrow \hspace{0.5cm} \frac{x^{\rm 2} }{\sigma_{X}^{\rm 2}}+\frac{y^{\rm 2} }{\sigma_{Y}^{\rm 2} }-{\rm 2}\cdot\rho_{XY}\cdot\frac{x\cdot y}{\sigma_X\cdot \sigma_Y}={\rm const.}$$
*Die Randwahrscheinlichkeitsdichten $f_{x}(x)$ und $f_{y}(y)$ lassen bereits erkennen, dass sowohl $x$ als auch $y$ gaußähnlich und mittelwertfrei sind, und dass die Zufallsgröße $x$ eine größere Streuung als $y$ aufweist.  
+
Die Grafik zeigt in hellerem Blau für zwei unterschiedliche Parametersätze je eine Höhenlinie.  
*$f_{x}(x)$ und $f_{y}(y)$ liefern jedoch keine Informationen darüber, ob bei der Zufallsgröße $(x, y)$ statistische Bindungen bestehen oder nicht.
 
*Anhand der 2D-WDF $f_{xy}(x,y)$ erkennt man aber, dass es hier zwischen den beiden Komponenten $x$ und $y$ keine statistischen Bindungen gibt.
 
*Bei statistischer Unabhängigkeit liefert jeder Schnitt durch $f_{xy}(x, y)$ parallel zur $y$-Achse eine Funktion, die formgleich mit der Rand&ndash;WDF $f_{y}(y)$ ist.
 
*Ebenso sind alle Schnitte parallel zur $x$-Achse formgleich mit $f_{x}(x)$.
 
<br clear=all>
 
Diese Tatsache ist gleichbedeutend mit der Aussage, dass in diesem Beispiel die 2D-WDF $f_{xy}(x, y)$ als Produkt der beiden Randwahrscheinlichkeitsdichten dargestellt werden kann: &nbsp; $f_{xy}(x,y)=f_{x}(x) \cdot f_y(y) .$}}
 
 
 
==WDF und VTF bei statistisch abhängigen Komponenten==
 
<br>
 
Bestehen statistische Bindungen zwischen den Komponenten $x$ und $y$, so liefern unterschiedliche Schnitte parallel zur $x$&ndash; bzw. $y$&ndash;Achse jeweils unterschiedliche, nicht formgleiche Funktionen.  
 
  
In diesem Fall lässt sich die Verbund&ndash;WDF natürlich auch nicht als Produkt der beiden (eindimensionalen) Randwahrscheinlichkeitsdichten beschreiben.
+
*Die Ellipsenhauptachse ist dunkelblau gestrichelt.
 +
*Die&nbsp; [[Stochastische_Signaltheorie/Zweidimensionale_Zufallsgrößen#Korrelationsgerade|Korrelationsgerade]]&nbsp; $K(x)$&nbsp; ist durchgehend rot eingezeichnet.  
  
[[Datei:P_ID156__Sto_T_4_1_S5_neu.png |right|frame|Statistisch abhängige Komponenten: &nbsp; $f_{xy}(x,y)$, $f_{x}(x)$, $f_{y}(y)$ ]]
 
{{GraueBox|TEXT= 
 
$\text{Beispiel 3:}$&nbsp; Die Grafik zeigt die Momentanwerte einer zweidimensionalen Zufallsgröße in der $(x,  y)$&ndash;Ebene, wobei nun im Gegensatz zum $\text{Beispiel 2}$ zwischen $x$ und $y$ statistische Bindungen bestehen.
 
*Die 2D&ndash;Zufallsgröße nimmt im blau eingezeichneten Parallelogramm alle Werte mit gleicher Wahrscheinlichkeit an.
 
*Außerhalb sind keine Werte möglich.
 
  
 
+
Anhand dieser Darstellung sind folgende Aussagen möglich:  
Man erkennt aus dieser Darstellung:
+
*Die Ellipsenform hängt außer vom Korrelationskoeffizienten&nbsp; $ρ_{XY}$&nbsp; auch vom Verhältnis der beiden Streuungen&nbsp; $σ_X$&nbsp; und&nbsp; $σ_Y$&nbsp; ab. 
*Die Integration über $f_{xy}(x, y)$ parallel zu der $x$&ndash;Achse führt zur dreieckförmigen Randdichte $f_{y}(y)$, die Integration parallel zur $y$&ndash;Achse zur trapezförmigen WDF $f_{x}(x)$.
+
*Der Neigungswinkel&nbsp; $α$&nbsp; der Ellipsenhauptachse (gestrichelte Gerade) gegenüber der&nbsp; $x$&ndash;Achse hängt ebenfalls von&nbsp; $σ_X$,&nbsp; $σ_Y$&nbsp; und&nbsp; $ρ_{XY}$&nbsp; ab:
*Aus der 2D-WDF $f_{xy}(x, y)$ ist bereits zu erahnen, dass für jeden $x$&ndash;Wert im statistischen Mittel ein anderer $y$&ndash;Wert zu erwarten ist.  
+
:$$\alpha = {1}/{2} \cdot {\rm arctan } \big ( 2 \cdot \rho_{XY} \cdot \frac {\sigma_X \cdot \sigma_Y}{\sigma_X^2 - \sigma_Y^2} \big ).$$
*Das bedeutet aber, dass hier die Komponenten $x$ und $y$ statistisch voneinander abhängen. }}
+
*Die (rote) Korrelationsgerade&nbsp; $y = K(x)$&nbsp; einer Gaußschen 2D–Zufallsgröße liegt stets unterhalb der (blau gestrichelten) Ellipsenhauptachse.  
 
+
* $K(x)$&nbsp; kann aus dem Schnittpunkt der Höhenlinien und ihrer vertikalen Tangenten geometrisch konstruiert werden, wie in der Skizze in grüner Farbe angedeutet.
==Erwartungswerte zweidimensionaler Zufallsgrößen==
+
<br><br>
<br>
+
===Zweidimensionale Verteilungsfunktion &nbsp; &rArr; &nbsp; 2D&ndash;VTF===
Ein Sonderfall der statistischen Abhängigkeit ist die ''Korrelation''.
 
  
 
{{BlaueBox|TEXT=   
 
{{BlaueBox|TEXT=   
$\text{Definition:}$&nbsp; Unter '''Korrelation''' versteht man eine ''lineare Abhängigkeit''&nbsp; zwischen den Einzelkomponenten $x$ und $y$.
+
$\text{Definition:}$&nbsp; Die&nbsp; '''2D-Verteilungsfunktion'''&nbsp; ist ebenso wie die 2D-WDF lediglich eine sinnvolle Erweiterung der&nbsp; [[Stochastische_Signaltheorie/Verteilungsfunktion_(VTF)#VTF_bei_kontinuierlichen_Zufallsgr.C3.B6.C3.9Fen_.281.29|eindimensionalen Verteilungsfunktion]]&nbsp; (VTF):
*Korrelierte Zufallsgrößen sind damit stets auch statistisch abhängig.
+
:$$F_{XY}(x,y) = {\rm Pr}\big [(X \le x) \cap (Y \le y) \big ]  .$$}}
*Aber nicht jede statistische Abhängigkeit bedeutet gleichzeitig eine Korrelation.}}  
 
  
  
Zur quantitativen Erfassung der Korrelation verwendet man verschiedene Erwartungswerte der 2D-Zufallsgröße $(x, y)$.  
+
Es ergeben sich folgende Gemeinsamkeiten und Unterschiede zwischen der &bdquo;1D-VTF&rdquo; und der&bdquo; 2D-VTF&rdquo;:
 
+
*Der Funktionalzusammenhang zwischen &bdquo;2D&ndash;WDF&rdquo; und &bdquo;2D&ndash;VTF&rdquo; ist wie im eindimensionalen Fall durch die Integration gegeben, aber nun in zwei Dimensionen. Bei kontinuierlichen Zufallsgrößen gilt:
Diese sind analog  definiert zum eindimensionalen Fall 
+
:$$F_{XY}(x,y)=\int_{-\infty}^{y} \int_{-\infty}^{x} f_{XY}(\xi,\eta) \,\,{\rm d}\xi \,\, {\rm d}\eta  .$$
*gemäß [[Stochastische_Signaltheorie/Momente_einer_diskreten_Zufallsgröße|Kapitel 2]] (bei wertdiskreten Zufallsgrößen)  
+
*Umgekehrt lässt sich die Wahrscheinlichkeitsdichtefunktion aus der Verteilungsfunktion durch partielle Differentiation nach&nbsp; $x$&nbsp; und&nbsp; $y$&nbsp; angeben:
*bzw. [[Stochastische_Signaltheorie/Erwartungswerte_und_Momente|Kapitel 3]] (bei wertkontinuierlichen Zufallsgrößen):
+
:$$f_{XY}(x,y)=\frac{{\rm d}^{\rm 2} F_{XY}(\xi,\eta)}{{\rm d} \xi \,\, {\rm d} \eta}\Bigg|_{\left.{x=\xi \atop {y=\eta}}\right.}.$$
   
+
*Bezüglich der Verteilungsfunktion&nbsp; $F_{XY}(x, y)$&nbsp; gelten folgende Grenzwerte:
 +
:$$F_{XY}(-\infty,\ -\infty) = 0,\hspace{0.5cm}F_{XY}(x,\ +\infty)=F_{X}(x ),\hspace{0.5cm}
 +
F_{XY}(+\infty,\ y)=F_{Y}(y ) ,\hspace{0.5cm}F_{XY}(+\infty,\ +\infty) = 1.$$
 +
*Im Grenzfall $($unendlich große&nbsp; $x$&nbsp; und&nbsp; $y)$&nbsp; ergibt sich demnach für die &bdquo;2D-VTF&rdquo; der Wert&nbsp; $1$. Daraus erhält man die&nbsp; '''Normierungsbedingung'''&nbsp; für die 2D-Wahrscheinlichkeitsdichtefunktion:  
 +
:$$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}x \,\,{\rm d}y=1 .  $$
  
 
{{BlaueBox|TEXT=   
 
{{BlaueBox|TEXT=   
$\text{Definition:}$&nbsp; Für die (nichtzentrierten) '''Momente''' gilt die Beziehung:  
+
$\text{Fazit:}$&nbsp; Beachten Sie den signifikanten Unterschied zwischen eindimensionalen und zweidimensionalen Zufallsgrößen:  
:$$m_{kl}={\rm E}\big[x^k\cdot y^l\big]=\int_{-\infty}^{+\infty}\hspace{0.2cm}\int_{-\infty}^{+\infty} x\hspace{0.05cm}^{k} \cdot y\hspace{0.05cm}^{l} \cdot f_{xy}(x,y) \, {\rm d}x\, {\rm d}y.$$
+
*Bei eindimensionalen Zufallsgrößen ergibt die Fläche unter der WDF stets den Wert $1$.  
Die beiden linearen Mittelwerte sind somit $m_x = m_{10}$ und $m_y = m_{01}.$ }}  
+
*Bei zweidimensionalen Zufallsgrößen ist das WDF-Volumen immer gleich $1$.}}
 +
<br><br>
  
 
+
==Versuchsdurchführung==
{{BlaueBox|TEXT=
 
$\text{Definition:}$&nbsp; Die auf $m_x$ bzw. $m_y$ bezogenen '''Zentralmomente''' lauten:
 
:$$\mu_{kl} = {\rm E}\big[(x-m_{x})\hspace{0.05cm}^k \cdot (y-m_{y})\hspace{0.05cm}^l\big] .$$
 
In dieser allgemein gültigen Definitionsgleichung sind die Varianzen $σ_x^2$ und $σ_y^2$ der zwei Einzelkomponenten durch $\mu_{20}$ bzw. $\mu_{02}$ mit enthalten. }}
 
 
 
 
 
{{BlaueBox|TEXT= 
 
$\text{Definition:}$&nbsp; Besondere Bedeutung besitzt die  '''Kovarianz''' $(k = l = 1)$, die ein Maß für die ''lineare statistische Abhängigkeit'' zwischen den Zufallsgrößen $x$ und $y$ ist:
 
:$$\mu_{11} = {\rm E}\big[(x-m_{x})\cdot(y-m_{y})\big] = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x-m_{x}) (y-m_{y})\cdot f_{xy}(x,y) \,{\rm d}x \,  {\rm d}y .$$}}
 
 
 
 
 
Im Folgenden bezeichnen wir die Kovarianz $\mu_{11}$ teilweise auch mit $\mu_{xy}$, falls sich die Kovarianz auf die Zufallsgrößen $x$ und $y$ bezieht. Die Kovarianz hängt wie folgt mit dem nichtzentrierten Moment $m_{11} = m_{xy} = {\rm E}\big[x · y\big]$ zusammen:
 
:$$\mu_{xy} = m_{xy} -m_{x }\cdot m_{y}.$$
 
 
 
''Anmerkung:''
 
*Diese Gleichung ist für die numerische Auswertung enorm vorteilhaft, da $m_{xy}$, $m_x$ und $m_y$ aus den Folgen $〈x_v〉$ und $〈y_v〉$ in einem Durchlauf gefunden werden können.
 
*Würde man dagegen die Kovarianz $\mu_{xy}$ entsprechend der oberen Definitionsgleichung berechnen, so müsste man in einem ersten Durchlauf die Mittelwerte $m_x$ und $m_y$ ermitteln und dann in einem zweiten Durchlauf den Erwartungswert ${\rm E}\big[(x - m_x) · (y - m_y)\big]$.
 
 
 
 
 
{{GraueBox|TEXT= 
 
$\text{Beispiel 4:}$&nbsp; In den beiden ersten Zeilen der folgenden Tabelle sind die jeweils ersten Elemente zweier Zufallsfolgen $〈x_ν〉$ und $〈y_ν〉$ eingetragen. In der letzten Zeile sind die jeweiligen Produkte $x_ν · y_ν$ angegeben.
 
 
 
[[Datei:P_ID628__Sto_T_4_1_S6Neu.png |center|frame| Beispielhafte 2D-Erwartungswerte]]
 
 
 
Die Tabelle zeigt folgenden Sachverhalt: 
 
*Durch Mittelung über die jeweils zehn Folgenelemente erhält man $m_x =0.5$, $m_y = 1$ und $m_{xy} = 0.69$.
 
*Daraus ergibt sich die Kovarianz zu $\mu_{xy} = 0.69 - 0.5 · 1 = 0.19.$
 
*Ohne Kenntnis der Gleichung $\mu_{xy} = m_{xy} - m_x · m_y$ hätte man zunächst im ersten Durchlauf die Mittelwerte $m_x$ und $m_y$ ermitteln müssen, um im zweiten Durchlauf die Kovarianz $\mu_{xy}$ als Erwartungswert des Produkts der mittelwertfreien Größen bestimmen zu können.}}
 
 
 
==Korrelationskoeffizient==
 
<br>
 
Bei statististischer Unabhängigkeit der beiden Komponenten $x$ und $y$ ist die Kovarianz $\mu_{xy} \equiv 0$. Dieser Fall wurde bereits im $\text{Beispiel 2}$ auf der Seite [[Stochastische_Signaltheorie/Zweidimensionale_Zufallsgrößen#WDF_und_VTF_bei_statistisch_unabh.C3.A4ngigen_Komponenten|WDF und VTF bei statistisch unabhängigen Komponenten]] betrachtet.
 
 
 
*Das Ergebnis $\mu_{xy} = 0$ ist aber auch bei statistisch abhängigen Komponenten $x$ und $y$ möglich, nämlich dann, wenn diese unkorreliert, also    ''linear unabhängig'' sind.
 
*Die  statistische Abhängigkeit ist dann nicht von erster, sondern von höherer Ordnung, zum Beispiel entsprechend der Gleichung $y=x^2.$
 
 
 
 
 
Man spricht von &bdquo;vollständiger Korrelation&rdquo;, wenn die (deterministische) Abhängigkeit zwischen $x$ und  $y$  durch die Gleichung $y = K · x$ ausgedrückt wird. Dann ergibt sich  für die Kovarianz:
 
* $\mu_{xy} = σ_x · σ_y$ bei positivem Wert von $K$,
 
* $\mu_{xy} = - σ_x · σ_y$ bei negativem $K$&ndash;Wert. 
 
 
 
 
 
Deshalb verwendet man häufig als Beschreibungsgröße anstelle der Kovarianz den so genannten Korrelationskoeffizienten.
 
 
 
{{BlaueBox|TEXT= 
 
$\text{Definition:}$&nbsp; Der '''Korrelationskoeffizient''' ist der Quoient aus Kovarianz $\mu_{xy}$ und dem Produkt der Effektivwerte $σ_x$ und $σ_y$ der beiden Komponenten:
 
:$$\rho_{xy}=\frac{\mu_{xy} }{\sigma_x \cdot \sigma_y}.$$}}
 
 
 
 
 
Der Korrelationskoeffizient $\rho_{xy}$ weist folgende Eigenschaften auf:
 
*Aufgrund der Normierung gilt stets  $-1 \le  ρ_{xy}  ≤ +1$.
 
*Sind die beiden Zufallsgrößen $x$ und $y$ unkorreliert, so ist $ρ_{xy} = 0$.
 
*Bei strenger linearer Abhängigkeit zwischen $x$ und $y$ ist $ρ_{xy}= ±1$ &nbsp; &rArr; &nbsp; vollständige Korrelation.
 
*Ein positiver Korrelationskoeffizient bedeutet, dass bei größerem $x$–Wert im statistischen Mittel auch $y$&nbsp; größer ist als bei kleinerem $x$.
 
*Dagegen drückt ein negativer Korrelationskoeffizient aus, dass $y$&nbsp; mit steigendem $x$ im Mittel kleiner wird. 
 
 
 
 
 
[[Datei:P_ID232__Sto_T_4_1_S7a_neu.png |right|frame| Gaußsche 2D-WDF mit Korrelation]]
 
{{GraueBox|TEXT= 
 
$\text{Beispiel 5:}$&nbsp;  Es gelten folgende Voraussetzungen:
 
*Die betrachteten Komponenten $x$ und $y$ besitzen jeweils eine gaußförmige WDF.
 
*Die beiden Streuungen sind unterschiedlich $(σ_y < σ_x)$.
 
*Der Korrelationskoeffizient beträgt $ρ_{xy} = 0.8$.
 
 
 
 
 
Im Unterschied zum [[Stochastische_Signaltheorie/Zweidimensionale_Zufallsgrößen#WDF_und_VTF_bei_statistisch_unabh.C3.A4ngigen_Komponenten| Beispiel 2]] mit statistisch unabhängigen Komponenten &nbsp; &rArr; &nbsp; $ρ_{xy} = 0$ (trotz $σ_y < σ_x$) erkennt man, dass hier bei größerem $x$–Wert im statistischen Mittel auch $y$ größer ist als bei kleinerem $x$.}}
 
 
 
 
 
==Korrelationsgerade==
 
 
<br>
 
<br>
 +
[[Datei:Aufgaben_2D-Gauss.png|right]]
  
[[Datei: P_ID1089__Sto_T_4_1_S7b_neu.png  |frame| Gaußsche 2D-WDF mit Korrelationsgerade]]
+
*Wählen Sie zunächst die Nummer ('''1''', ...) der zu bearbeitenden Aufgabe.
{{BlaueBox|TEXT= 
 
$\text{Definition:}$&nbsp; Als '''Korrelationsgerade''' bezeichnet man  die Gerade $y = K(x)$  in der $(x, y)$&ndash;Ebene durch den „Mittelpunkt” $(m_x, m_y)$. Manchmal wird diese Gerade auch  ''Regressionsgerade'' genannt.
 
 
 
Die Korrelationsgerade besitzt folgende Eigenschaften: 
 
 
 
*Die mittlere quadratische Abweichung von dieser Geraden – in $y$&ndash;Richtung betrachtet und über alle $N$ Punkte gemittelt – ist minimal:
 
:$$\overline{\varepsilon_y^{\rm 2} }=\frac{\rm 1}{N} \cdot \sum_{\nu=\rm 1}^{N}\; \;\big [y_\nu - K(x_{\nu})\big ]^{\rm 2}={\rm Minimum}.$$
 
*Die Korrelationsgerade kann als eine Art „statistische Symmetrieachse“ interpretiert werden. Die Geradengleichung lautet:
 
:$$y=K(x)=\frac{\sigma_y}{\sigma_x}\cdot\rho_{xy}\cdot(x - m_x)+m_y.$$}}
 
 
 
 
 
Der Winkel, den die Korrelationsgerade zur $x$&ndash;Achse einnimmt, beträgt:
 
:$$\theta_{y\hspace{0.05cm}\rightarrow \hspace{0.05cm}x}={\rm arctan}(\frac{\sigma_{y} }{\sigma_{x} }\cdot \rho_{xy}).$$
 
 
 
Durch diese Nomenklatur soll deutlich gemacht werden, dass es sich hier um die Regression von $y$ auf $x$ handelt.
 
 
 
*Die Regression in Gegenrichtung – also von $x$ auf $y$ – bedeutet dagegen die Minimierung der mittleren quadratischen Abweichung in $x$–Richtung.
 
 
 
*Das interaktive Applet  [[Applets:Korrelationskoeffizient_%26_Regressionsgerade|Korrelationskoeffizient und Regressionsgerade]] verdeutlicht, dass sich im Allgemeinen (falls $σ_y \ne σ_x$) für die Regression von $x$ auf $y$  ein anderer Winkel und damit auch eine andere Regressionsgerade ergeben wird:
 
:$$\theta_{x\hspace{0.05cm}\rightarrow \hspace{0.05cm} y}={\rm arctan}(\frac{\sigma_{x}}{\sigma_{y}}\cdot \rho_{xy}).$$
 
 
 
 
 
 
 
 
 
 
 
{{Display}}
 
 
 
 
 
 
 
'''Wahrscheinlichkeiten der Binomialverteilung'''
 
 
Hierfür gilt mit $μ = 0, \text{...}\ , I$:
 
:$$p_\mu = {\rm Pr}(z=\mu)={I \choose \mu}\cdot p^\mu\cdot ({\rm 1}-p)^{I-\mu}.$$
 
Der erste Term gibt hierbei die Anzahl der Kombinationen $(I \text{ über }\mu)$ an:
 
:$${I \choose \mu}=\frac{I !}{\mu !\cdot (I-\mu) !}=\frac{ {I\cdot (I- 1) \cdot \ \cdots \ \cdot (I-\mu+ 1)} }{ 1\cdot  2\cdot \ \cdots \ \cdot  \mu}.$$
 
 
 
 
 
'''Momente der Binomialverteilung'''
 
 
 
Für das Moment $k$-ter Ordnung einer binomialverteilten Zufallsgröße $z$ gilt:
 
:$$m_k={\rm E}[z^k]=\sum_{\mu={\rm 0}}^{I}\mu^k\cdot{I \choose \mu}\cdot p^\mu\cdot ({\rm 1}-p)^{I-\mu}.$$
 
 
 
Daraus erhält man nach einigen Umformungen für
 
*den linearen Mittelwert:  &nbsp; $m_1 = I\cdot p,$
 
*den quadratischen Mittelwert: &nbsp;  $m_2 = (I^2-I)\cdot p^2+I\cdot p,$
 
*die Varianz bzw. die Streuung: &nbsp;  $\sigma^2 = {m_2-m_1^2} = {I \cdot p\cdot (1-p)} \hspace{0.3cm}\Rightarrow \hspace{0.3cm}
 
\sigma =  \sqrt{I \cdot p\cdot (1-p)}.$
 
 
 
 
 
'''Anwendungen der Binomialverteilung'''
 
 
 
Die Binomialverteilung findet in der Nachrichtentechnik ebenso wie in anderen Disziplinen mannigfaltige Anwendungen: 
 
*Sie beschreibt die Verteilung von Ausschussstücken in der statistischen Qualitätskontrolle.
 
*Auch die per Simulation gewonnene Bitfehlerquote eines digitalen Übertragungssystems ist eigentlich eine binomialverteilte Zufallsgröße.
 
*Die Binomialverteilung erlaubt die Berechnung der Restfehlerwahrscheinlichkeit bei blockweiser Codierung, wie das folgende Beispiel zeigt.
 
 
 
 
 
{{GraueBox|TEXT= 
 
$\text{Beispiel 1:}$&nbsp;
 
Überträgt man jeweils Blöcke von $I =5$ Binärsymbolen über einen Kanal, der
 
*mit der Wahrscheinlichkeit $p = 0.1$ ein Symbol verfälscht &nbsp; &rArr; &nbsp; Zufallsgröße $e_i = 1$, und
 
*entsprechend mit der Wahrscheinlichkeit $1 - p = 0.9$ das Symbol unverfälscht überträgt  &nbsp; &rArr; &nbsp; Zufallsgröße $e_i = 0$,
 
 
 
 
so gilt für die neue Zufallsgröße $f$  (&bdquo;Fehler pro Block&rdquo;):
 
:$$f=\sum_{i=1}^{I}e_i.$$
 
 
 
Die Zufallsgröße $f$ kann nun alle ganzzahligen Werte zwischen $\mu = 0$ (kein Symbol verfälscht) und $\mu = I = 5$ (alle fünf Symbole falsch) annehmen. Die Wahrscheinlichkeiten für $\mu$ Verfälschungen bezeichnen wir mit $p_μ = {\rm Pr}(f = \mu)$.
 
*Der Fall, dass alle fünf Symbole richtig übertragen werden, tritt mit der Wahrscheinlichkeit $p_0 = 0.9^{5} ≈ 0.5905$ ein. Dies ergibt sich auch aus der Binomialformel für $μ = 0$ unter Berücksichtigung der Definition $5\text{ über } 0 = 1$.
 
*Ein einziger Symbolfehler $(f = 1)$ tritt mit der Wahrscheinlichkeit $p_1 = 5\cdot 0.1\cdot 0.9^4\approx 0.3281$ auf. Der erste Faktor berücksichtigt, dass es für die Position eines einzigen Fehlers genau $5\text{ über } 1 = 5$ Möglichkeiten gibt. Die beiden weiteren Faktoren beücksichtigen, dass ein Symbol verfälscht und vier richtig übertragen werden müssen, wenn $f =1$ gelten soll.
 
*Für $f =2$ gibt es mehr Kombinationen, nämlich $5\text{ über } 2 = (5 \cdot 4)/(1 \cdot 2) = 10$, und man erhält $p_2 = 10\cdot 0.1^2\cdot 0.9^3\approx 0.0729$.
 
 
 
 
 
Kann ein Blockcode bis zu zwei Fehlern korrigieren, so ist die Restfehlerwahrscheinlichkeit $p_{\rm R} =  1-p_{\rm 0}-p_{\rm 1}-p_{\rm 2}\approx 0.85\%$. Eine zweite Berechnungsmöglichkeit wäre $p_{\rm R} =  p_{3}  + p_{4} + p_{5}$ mit der Näherung $p_{\rm R} \approx p_{3} = 0.81\%.$
 
 
 
Die mittlere  Fehleranzahl in einem Block ist $m_f = 5 \cdot 0.1 = 0.5$. Die Varianz der Zufallsgröße $f$ beträgt $\sigma_f^2 = 5 \cdot 0.1 \cdot 0.9= 0.45$ &nbsp; &rArr; &nbsp;  Streuung $\sigma_f \approx 0.671.$}}
 
 
 
===Eigenschaften der Poissonverteilung===
 
<br>
 
Die ''Poissonverteilung'' ist ein Grenzfall der Binomialverteilung, wobei
 
*zum einen von den Grenzübergängen $I → ∞$ und $p →$ 0 ausgegangen wird,
 
*zusätzlich vorausgesetzt ist, dass das Produkt $I · p = λ$ einen endlichen Wert besitzt.
 
 
 
 
 
Der Parameter $λ$ gibt die mittlere Anzahl der „Einsen” in einer festgelegten Zeiteinheit an und wird als die ''Rate'' bezeichnet.
 
 
 
Im Gegensatz zur Binomialverteilung ($0 ≤ μ ≤ I$) kann hier die Zufallsgröße beliebig große (ganzzahlige, nichtnegative) Werte annehmen, was bedeutet, dass die Menge der möglichen Werte hier nicht abzählbar ist. Da jedoch keine Zwischenwerte auftreten können, spricht man auch hier von einer ''diskreten Verteilung''.
 
 
 
 
 
'''Wahrscheinlichkeiten der Poissonverteilung'''
 
 
 
Berücksichtigt man die oben genannten Grenzübergänge in der Gleichung für die Wahrscheinlichkeiten der Binomialverteilung, so folgt für die Auftrittswahrscheinlichkeiten der poissonverteilten Zufallsgröße $z$:
 
:$$p_\mu = {\rm Pr} ( z=\mu ) = \lim_{I\to\infty} \cdot \frac{I !}{\mu ! \cdot (I-\mu  )!} \cdot (\frac{\lambda}{I}  )^\mu \cdot  ( 1-\frac{\lambda}{I})^{I-\mu}.$$
 
Daraus erhält man nach einigen algebraischen Umformungen:
 
:$$p_\mu = \frac{ \lambda^\mu}{\mu!}\cdot {\rm e}^{-\lambda}.$$
 
 
 
 
 
'''Momente der Poissonverteilung'''
 
 
 
Bei der Poissonverteilung ergeben sich Mittelwert und Streuung direkt aus den entsprechenden Gleichungen der Binomialverteilung durch zweifache Grenzwertbildung:
 
:$$m_1 =\lim_{\left.{I\hspace{0.05cm}\to\hspace{0.05cm}\infty, \hspace{0.2cm}  {p\hspace{0.05cm}\to\hspace{0.05cm} 0}}\right.} \hspace{0.2cm} I \cdot p= \lambda,$$
 
:$$\sigma =\lim_{\left.{I\hspace{0.05cm}\to\hspace{0.05cm}\infty, \hspace{0.2cm}  {p\hspace{0.05cm}\to\hspace{0.05cm} 0}}\right.} \hspace{0.2cm} \sqrt{I \cdot p \cdot (1-p)} = \sqrt {\lambda}.$$
 
 
 
Daraus ist zu erkennen, dass bei der Poissonverteilung stets $\sigma^2 = m_1 = \lambda$ ist. Dagegen gilt bei der Binomialverteilung immer $\sigma^2 < m_1$.
 
 
 
[[Datei: P_ID616__Sto_T_2_4_S2neu.png |frame| Momente der Poissonverteilung | rechts]]
 
{{GraueBox|TEXT= 
 
$\text{Beispiel 2:}$&nbsp;
 
Wir vergleichen nun die Binomialverteilung mit den Parametern $I =6$ und $p = 0.4$ und die Poissonverteilung mit $λ = 2.4$:
 
*Beide Verteilungen besitzen genau den gleichen Mittelwert $m_1 = 2.4$.
 
*Bei der Poissonverteilung (im Bild rot markiert) beträgt die Streuung $σ ≈ 1.55$.
 
*Bei der (blauen) Binomialverteilung ist die Standardabweichung nur $σ = 1.2$.}}
 
 
 
 
 
'''Anwendungen der Poissonverteilung'''
 
 
 
Die Poissonverteilung ist das Ergebnis eines so genannten ''Poissonprozesses''. Ein solcher dient häufig als Modell für Folgen von Ereignissen, die zu zufälligen Zeitpunkten eintreten können. Beispiele für derartige Ereignisse sind
 
*der Ausfall von Geräten – eine wichtige Aufgabenstellung in der Zuverlässigkeitstheorie,
 
*das Schrotrauschen bei der optischen Übertragung, und
 
*der Beginn von Telefongesprächen in einer Vermittlungsstelle („Verkehrstheorie”).
 
 
 
 
 
{{GraueBox|TEXT= 
 
$\text{Beispiel 3:}$&nbsp;
 
Gehen bei einer Vermittlungsstelle im Langzeitmittel neunzig Vermittlungswünsche pro Minute ein (also $λ = 1.5 \text{ pro Sekunde}$), so lauten die Wahrscheinlichkeiten $p_{\mu}$, dass in einem beliebigen Zeitraum von einer Sekunde genau $\mu$ Belegungen auftreten:
 
:$$p_\mu = \frac{1.5^\mu}{\mu!}\cdot {\rm e}^{-1.5}.$$
 
 
 
Es ergeben sich die Zahlenwerte $p_0 = 0.223$, $p_1 = 0.335$, $p_2 = 0.251$, usw.
 
 
 
Daraus lassen sich weitere Kenngrößen ableiten:
 
*Die Abstand $τ$ zwischen zwei Vermittlungswünschen genügt der ''Exponentialverteilung''.
 
*Die mittlere Zeitspanne zwischen Vermittlungswünschen beträgt ${\rm E}[τ] = 1/λ ≈ 0.667 \ \rm s$.}}
 
 
 
 
 
 
 
===Gegenüberstellung Binomialverteilung vs. Poissonverteilung===
 
<br>
 
Hier sollen die Gemeinsamkeiten und die Unterschiede zwischen binomial- und poissonverteilten Zufallsgrößen herausgearbeitet werden.
 
 
 
[[Datei:  P_ID60__Sto_T_2_4_S3_neu.png |frame| Binomialverteilung vs. Poissonverteilung]]
 
Die '''Binomialverteilung''' ist zur Beschreibung solcher stochastischer Ereignisse geeignet, die durch einen festen Takt $T$ gekennzeichnet sind. Beispielsweise beträgt bei ISDN  (''Integrated Services Digital Network'') mit $64 \ \rm kbit/s$ die Taktzeit $T \approx 15.6 \ \rm &micro; s$.
 
*Nur in diesem Zeitraster treten binäre Ereignisse auf. Solche Ereignisse sind beispielsweise die fehlerfreie $(e_i = 0)$ oder fehlerhafte $(e_i = 1)$ Übertragung einzelner Symbole.
 
*Die Binomialverteilung ermöglicht nun statistische Aussagen über die Anzahl der in einem längeren Zeitintervall $T_{\rm I} = I · T$ zu erwartenden Übertragungsfehler entsprechend des skizzierten Zeitdiagramms (blau markierte Zeitpunkte).
 
*Für sehr große Werte von $I$ und gleichzeitig sehr kleine Werte von $p$ kann die Binomialverteilung durch die ''Poissonverteilung'' mit $\lambda = I \cdot p$ angenähert werden.
 
*Ist gleichzeitig das Produkt $I · p \gg 1$, so geht nach dem ''Grenzwertsatz von de Moivre-Laplace'' die Poissonverteilung (und damit auch die Binomialverteilung) in eine diskrete Gaußverteilung über.
 
 
 
 
 
Die '''Poissonverteilung''' macht ebenfalls Aussagen über die Anzahl eintretender Binärereignisse in einem endlichen Zeitintervall.
 
 
Geht man hierbei vom gleichen Betrachtungszeitraum $T_{\rm I}$ aus und vergrößert die Anzahl $I$ der Teilintervalle immer mehr, so wird die Taktzeit $T,$ zu der jeweils ein neues Binärereignis ($0$ oder $1$) eintreten kann, immer kleiner. Im Grenzfall geht $T$ gegen Null. Das heißt:
 
*Bei der Poissonverteilung sind die binären Ereignisse nicht nur zu diskreten, durch ein Zeitraster vorgegebenen Zeitpunkten möglich, sondern jederzeit. Das untere Zeitdiagramm verdeutlicht diesen Sachverhalt.
 
*Um im Mittel während der Zeit $T_{\rm I}$ genau so viele „Einsen” wie bei der Binomialverteilung zu erhalten (im Beispiel: sechs), muss allerdings die auf das infinitesimal kleine Zeitintervall $T$ bezogene charakteristische Wahrscheinlichkeit $p = {\rm Pr}( e_i = 1)$ gegen Null tendieren.
 
 
 
 
 
 
 
==Versuchsdurchführung==
 
 
 
[[Datei:Exercises_binomial_fertig.png|right]]
 
*Wählen Sie zunächst die Nummer '''1''' ... '''6''' der zu bearbeitenden Aufgabe.
 
 
*Eine Aufgabenbeschreibung wird angezeigt. Die Parameterwerte sind angepasst.
 
*Eine Aufgabenbeschreibung wird angezeigt. Die Parameterwerte sind angepasst.
*Lösung nach Drücken von &bdquo;Hide solution&rdquo;.
+
*Lösung nach Drücken von &bdquo;Musterlösung&rdquo;.
*Aufgabenstellung und Lösung in Englisch.  
+
*Bei der Aufgabenbeschreibung verwenden wir &nbsp;$\rho$&nbsp; anstelle von &nbsp;$\rho_{XY}$.
 +
*Für die &bdquo;1D-WDF&rdquo; gilt:&nbsp;  $f_{X}(x) = \sqrt{1/(2\pi \cdot \sigma_X^2)} \cdot {\rm e}^{-x^2/(2 \hspace{0.05cm}\cdot \hspace{0.05cm} \sigma_X^2)}$.  
  
  
Zeile 422: Zeile 163:
 
*Ausgabe eines &bdquo;Reset&ndash;Textes&rdquo; mit weiteren Erläuterungen zum Applet.
 
*Ausgabe eines &bdquo;Reset&ndash;Textes&rdquo; mit weiteren Erläuterungen zum Applet.
  
 
In der folgenden Beschreibung bedeutet
 
*'''Blau''': &nbsp; Verteilungsfunktion 1 (im Applet blau markiert),
 
*'''Rot''': &nbsp; &nbsp; Verteilungsfunktion 2 (im Applet rot markiert).
 
  
  
 
{{BlaueBox|TEXT=
 
{{BlaueBox|TEXT=
'''(1)'''&nbsp; Setzen Sie '''Blau''': Binomialverteilung $(I=5, \ p=0.4)$ und '''Rot''': Binomialverteilung $(I=10, \ p=0.2)$.
+
'''(1)'''&nbsp; Machen Sie sich anhand der Voreinstellung &nbsp;$(\sigma_X=1, \ \sigma_Y=0.5, \ \rho = 0.7)$&nbsp; mit dem Programm vertraut. Interpretieren Sie die Grafiken für &nbsp;$\rm WDF$&nbsp; und&nbsp; $\rm VTF$.}}
:Wie lauten die Wahrscheinlichkeiten ${\rm Pr}(z=0)$ und ${\rm Pr}(z=1)$?}}
 
  
 +
::*&nbsp;$\rm WDF$&nbsp; ist ein Bergrücken mit dem Maximum bei&nbsp; $x = 0, \ y = 0$. Der Bergkamm ist leicht verdreht gegenüber der &nbsp;$x$&ndash;Achse.
 +
::*&nbsp;$\rm VTF$&nbsp; ergibt sich aus &nbsp;$\rm WDF$&nbsp; durch fortlaufende Integration in beide Richtungen. Das Maximum $($nahezu &nbsp;$1)$&nbsp; tritt bei &nbsp;$x=3, \ y=3$&nbsp; auf. 
  
$\hspace{1.0cm}\Rightarrow\hspace{0.3cm}\text{Blau: }{\rm Pr}(z=0)=0.6^5=7.78\%, \hspace{0.3cm}{\rm Pr}(z=1)=0.4 \cdot 0.6^4=25.92\%;$
+
{{BlaueBox|TEXT=
 +
'''(2)'''&nbsp; Nun lautet die Einstellung &nbsp;$\sigma_X= \sigma_Y=1, \ \rho = 0$. Welche Werte ergeben sich für &nbsp;$f_{XY}(0,\ 0)$&nbsp; und &nbsp;$F_{XY}(0,\ 0)$? Interpretieren Sie die Ergebnisse.}}
  
$\hspace{1.85cm}\text{Rot: }{\rm Pr}(z=0)=0.8^10=10.74\%, \hspace{0.3cm}{\rm Pr}(z=1)=0.2 \cdot 0.8^9=26.84\%.$
+
::*&nbsp;Das WDF&ndash;Maximum ist&nbsp;  $f_{XY}(0,\ 0) = 1/(2\pi)= 0.1592$, wegen &nbsp;$\sigma_X= \sigma_Y = 1, \ \rho = 0$. Die Höhenlinien sind Kreise.
 +
::*&nbsp;Für den VTF-Wert gilt:&nbsp; $F_{XY}(0,\ 0) = [{\rm Pr}(X \le 0)] \cdot [{\rm Pr}(Y \le 0)] = 0.25$. Geringfügige Abweichung wegen numerischer Integration.
  
 
{{BlaueBox|TEXT=
 
{{BlaueBox|TEXT=
'''(2)'''&nbsp; Es gelten weiter die Einstellungen von '''(1)'''. Wie groß sind die Wahrscheinlichkeiten ${\rm Pr}(3 \le z \le 5)$?}}
+
'''(3)'''&nbsp; Es gelten weiter die Einstellungen von '''(2)'''. Welche Werte ergeben sich für &nbsp;$f_{XY}(0,\ 1)$&nbsp; und &nbsp;$F_{XY}(0,\ 1)$? Interpretieren Sie die Ergebnisse.}}
  
 +
::*&nbsp;Es gilt&nbsp;  $f_{XY}(0,\ 1) = f_{X}(0) \cdot f_{Y}(1) = [ \sqrt{1/(2\pi)}]  \cdot [\sqrt{1/(2\pi)} \cdot {\rm e}^{-0.5}] = 1/(2\pi) \cdot {\rm e}^{-0.5} = 0.0965$.
 +
::*&nbsp;Das Programm liefert&nbsp;  $F_{XY}(0,\ 1) = [{\rm Pr}(X \le 0)] \cdot [{\rm Pr}(Y \le 1)] = 0.4187$, also einen größeren Wert als in '''(2)''', da weiter integriert wird.
  
$\hspace{1.0cm}\Rightarrow\hspace{0.3cm}\text{Es gilt }{\rm Pr}(3 \le z \le 5) = {\rm Pr}(z=3) + {\rm Pr}(z=4) + {\rm Pr}(z=5)\text{, oder }
+
{{BlaueBox|TEXT=
{\rm Pr}(3 \le z \le 5) = {\rm Pr}(z \le 5) - {\rm Pr}(z \le 2)$.
+
'''(4)'''&nbsp; Die Einstellungen bleiben erhalten. Welche Werte ergeben sich für &nbsp;$f_{XY}(1,\ 0)$&nbsp; und &nbsp;$F_{XY}(1,\ 0)$? Interpretieren Sie die Ergebnisse.}}
  
$\hspace{1.85cm}\text{Blau: }{\rm Pr}(3 \le z \le 5) = 0.2304+ 0.0768 + 0.0102 =1 - 0.6826 = 0.3174;$
+
::*&nbsp;Aufgrund der Rotationssysmmetrie gleiche Ergebnisse wie in '''(3)'''.
 
 
$\hspace{1.85cm}\text{Rot: }{\rm Pr}(3 \le z \le 5) = 0.2013 + 0.0881 + 0.0264 = 0.9936 - 0.6778 = 0.3158.$
 
  
 
{{BlaueBox|TEXT=
 
{{BlaueBox|TEXT=
'''(3)'''&nbsp; Es gelten weiter die Einstellungen von '''(1)'''. Wie unterscheiden sich der Mittelwert $m_1$ und die Streuung $\sigma$ der beiden Binomialverteilungen?}}
+
'''(5)'''&nbsp; Stimmt die Aussage:&nbsp;&bdquo;Elliptische Höhenlinien gibt es nur für &nbsp;$\rho \ne 0$&rdquo;. Interpretieren Sie die&nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$&nbsp; und $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$&nbsp; für &nbsp;$\sigma_X=1, \ \sigma_Y=0.5$&nbsp; und&nbsp; $\rho = 0$.}}
  
 +
::*&nbsp;Nein! Auch für&nbsp; $\ \rho = 0$&nbsp; sind die Höhenlinien elliptisch (nicht kreisförmig), falls &nbsp;$\sigma_X \ne \sigma_Y$.
 +
::*&nbsp;Für&nbsp;$\sigma_X \gg \sigma_Y$&nbsp; hat die&nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$&nbsp; die Form eines langgestreckten Bergkamms parallel zur&nbsp; $x$&ndash;Achse, für&nbsp;$\sigma_X \ll \sigma_Y$&nbsp; parallel zur&nbsp; $y$&ndash;Achse.
 +
::*&nbsp;Für&nbsp;$\sigma_X \gg \sigma_Y$&nbsp; ist der Anstieg der&nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$&nbsp; in Richtung der &nbsp;$y$&ndash;Achse deutlich steiler als in Richtung der &nbsp;$x$&ndash;Achse.
  
$\hspace{1.0cm}\Rightarrow\hspace{0.3cm}\text{Mittelwert:}\hspace{0.2cm}m_\text{1} = I \cdot p\hspace{0.3cm} \Rightarrow\hspace{0.3cm} m_\text{1, Blau} = 5 \cdot 0.4\underline{ = 2 =}  \ m_\text{1, Rot} = 10 \cdot 0.2; $
+
{{BlaueBox|TEXT=
 +
'''(6)'''&nbsp; Variieren Sie ausgehend von&nbsp; $\sigma_X=\sigma_Y=1, \ \rho = 0.7$&nbsp; den Korrelationskoeffizienten&nbsp; $\rho$. Wie groß ist der Neigungswinkel &nbsp;$\alpha$&nbsp; der Ellipsen&ndash;Hauptachse?}}
  
$\hspace{1.85cm}\text{Streuung:}\hspace{0.4cm}\sigma = \sqrt{I \cdot p \cdot (1-p)} = \sqrt{m_1 \cdot (1-p)}\hspace{0.3cm}\Rightarrow\hspace{0.3cm} \sigma_{\rm Blau} = \sqrt{2 \cdot 0.6} =1.095 < \sigma_{\rm Rot} = \sqrt{2 \cdot 0.8} = 1.265.$
+
::*&nbsp;Für&nbsp; $\rho > 0$&nbsp; ist &nbsp;$\alpha = 45^\circ$&nbsp; und für&nbsp; $\rho < 0$&nbsp; ist &nbsp;$\alpha = -45^\circ$. Für&nbsp; $\rho = 0$&nbsp; sind die Höhenlinien kreisfömig und somit gibt es auch keine Ellipsen&ndash;Hauptachse.
  
 
{{BlaueBox|TEXT=
 
{{BlaueBox|TEXT=
'''(4)'''&nbsp; Setzen Sie '''Blau''': Binomialverteilung $(I=15, p=0.3)$ und '''Rot''': Poissonverteilung $(\lambda=4.5)$.
+
'''(7)'''&nbsp; Variieren Sie ausgehend von&nbsp; $\sigma_X=\sigma_Y=1, \ \rho = 0.7$&nbsp; den Korrelationskoeffizienten&nbsp; $\rho > 0$. Wie groß ist der Neigungswinkel &nbsp;$\theta$&nbsp; der Korrelationsgeraden&nbsp; $K(x)$?}}
:Welche Unterschiede ergeben sich  zwischen beiden Verteilungen hinsichtlich Mittelwert $m_1$ und Varianz $\sigma^2$?}}
 
  
 +
::*&nbsp;Für&nbsp; $\sigma_X=\sigma_Y$&nbsp; ist &nbsp;$\theta={\rm arctan}\ (\rho)$. Die Steigung nimmt mit wachsendem&nbsp; $\rho > 0$&nbsp; zu. In allen Fällen gilt  &nbsp;$\theta < \alpha = 45^\circ$. Für&nbsp; $\rho = 0.7$&nbsp; ergibt sich &nbsp;$\theta = 35^\circ$.
  
$\hspace{1.0cm}\Rightarrow\hspace{0.3cm}\text{Beide Verteilungern haben gleichen Mittelwert:}\hspace{0.2cm}m_\text{1, Blau}  =  I \cdot p\ = 15 \cdot 0.3\hspace{0.15cm}\underline{ = 4.5 =} \  m_\text{1, Rot} = \lambda$;
+
{{BlaueBox|TEXT=
 +
'''(8)'''&nbsp; Variieren Sie ausgehend von&nbsp; $\sigma_X=\sigma_Y=0.75, \ \rho = 0.7$&nbsp; die Parameter&nbsp; $\sigma_Y$&nbsp; und&nbsp; $\rho \ (>0)$. Welche Aussagen gelten für die Winkel &nbsp;$\alpha$&nbsp; und&nbsp; $\theta$?}}
  
$\hspace{1.85cm} \text{Binomialverteilung: }\hspace{0.2cm} \sigma_\text{Blau}^2 = m_\text{1, Blau} \cdot (1-p)\hspace{0.15cm}\underline { = 3.15} \le \text{Poissonverteilung: }\hspace{0.2cm} \sigma_\text{Rot}^2 = \lambda\hspace{0.15cm}\underline { = 4.5}$;
+
::*&nbsp;Für&nbsp; $\sigma_Y<\sigma_X$&nbsp; ist &nbsp;$\alpha < 45^\circ$&nbsp; und für&nbsp; $\sigma_Y>\sigma_X$&nbsp; dagegen &nbsp;$\alpha > 45^\circ$.  
 +
::*&nbsp;Bei allen Einstellungen gilt:&nbsp;  '''Die Korrelationsgerade liegt unter der Ellipsen&ndash;Hauptachse'''.
  
 
{{BlaueBox|TEXT=
 
{{BlaueBox|TEXT=
'''(5)'''&nbsp; Es gelten die Einstellungen von '''(4)'''. Wie groß sind die Wahrscheinlichkeiten ${\rm Pr}(z  \gt 10)$ und ${\rm Pr}(z \gt 15)$?}}
+
'''(9)'''&nbsp; Gehen Sie von&nbsp; $\sigma_X= 1, \ \sigma_Y=0.75, \ \rho = 0.7$&nbsp; aus und variieren Sie&nbsp; $\rho$. Wie könnte man die Korrelationsgerade aus den Höhenlinien konstruieren?}}
  
 +
::*&nbsp;Die Korrelationsgerade schneidet alle Höhenlinien an den Punkten, an denen die Tangente zu der Höhenlinie senkrecht verläuft.
  
$\hspace{1.0cm}\Rightarrow\hspace{0.3cm} \text{Binomial: }\hspace{0.2cm} {\rm Pr}(z  \gt 10) = 1 - {\rm Pr}(z  \le 10) = 1 - 0.9993 = 0.0007;\hspace{0.3cm} {\rm Pr}(z \gt 15) = 0 \ {\rm  (exakt)}$.
+
{{BlaueBox|TEXT=
 +
'''(10)'''&nbsp; Nun gelte&nbsp; $\sigma_X=  \sigma_Y=1, \ \rho = 0.95$. Interpretieren Sie die&nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$. Welche Aussagen würden für den Grenzfall&nbsp; $\rho \to 1$&nbsp; zutreffen?}}
  
$\hspace{1.85cm}\text{Poisson: }\hspace{0.2cm} {\rm Pr}(z  \gt 10) = 1 - 0.9933 = 0.0067;\hspace{0.3cm}{\rm Pr}(z \gt 15) \gt  0 \ ( \approx 0)$
+
::*&nbsp;Die&nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$&nbsp; hat nur Anteile in der Nähe der Ellipsen&ndash;Hauptachse. Die Korrelationsgerade liegt nur knapp darunter:&nbsp; $\alpha = 45^\circ, \ \theta = 43.5^\circ$.
 +
::*&nbsp;Im Grenzfall&nbsp; $\rho \to 1$&nbsp; wäre&nbsp; $\theta = \alpha = 45^\circ$. Außerhalb der Korrelationsgeraden hätte die&nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$&nbsp; keine Anteile. Das heißt:
 +
::*&nbsp;Längs der Korrelationsgeraden ergäbe sich eine '''Diracwand'''&nbsp; &rArr; &nbsp; Alle Werte sind unendlich groß, trotzdem um den Mittelwert gaußisch gewichtet.
  
$\hspace{1.85cm} \text{Näherung: }\hspace{0.2cm}{\rm Pr}(z \gt 15) \ge {\rm Pr}(z = 16) = \lambda^{16}/{16!}\approx 2 \cdot 10^{-22}$.
 
  
{{BlaueBox|TEXT=
 
'''(6)'''&nbsp; Es gelten weiter die Einstellungen von '''(4)'''. Mit welchen Parametern ergeben sich symmetrische Verteilungen um $m_1$?}}
 
  
  
$\hspace{1.0cm}\Rightarrow\hspace{0.3cm} \text{Binomialverung mit }p = 0.5\text{:  }p_\mu =  {\rm Pr}(z  = \mu)\text{ symmetrisch um } m_1 = I/2 = 7.5 \ ⇒  \ p_μ = p_{I–μ}\ ⇒  \  p_8 = p_7, \ p_9 = p_6,  \text{usw.}$
 
  
$\hspace{1.85cm}\text{Die Poissonverteilung wird dagegen nie symmetrisch, da sie sich bis ins Unendliche erstreckt!}$
 
  
 
==Zur Handhabung des Applets==
 
==Zur Handhabung des Applets==
[[Datei:Handhabung_binomial.png|left|600px]]
+
<br>
&nbsp; &nbsp; '''(A)''' &nbsp; &nbsp; Vorauswahl für blauen Parametersatz
+
[[Datei:Anleitung_2D-Gauss.png|left|600px]]
 +
&nbsp; &nbsp; '''(A)''' &nbsp; &nbsp; Parametereingabe per Slider:&nbsp; $\sigma_X$, &nbsp;$\sigma_Y$ und&nbsp; $\rho$
  
&nbsp; &nbsp; '''(B)''' &nbsp; &nbsp; Parametereingabe $I$ und $p$ per Slider
+
&nbsp; &nbsp; '''(B)''' &nbsp; &nbsp; Auswahl:&nbsp; Darstellung von WDF oder VTF
  
&nbsp; &nbsp; '''(C)''' &nbsp; &nbsp; Vorauswahl für roten Parametersatz
+
&nbsp; &nbsp; '''(C)''' &nbsp; &nbsp; Reset:&nbsp; Einstellung wie beim Programmstart
  
&nbsp; &nbsp; '''(D)''' &nbsp; &nbsp; Parametereingabe $\lambda$ per Slider
+
&nbsp; &nbsp; '''(D)''' &nbsp; &nbsp; Höhenlinien darstellen anstelle von &bdquo;1D-WDF&rdquo;
  
&nbsp; &nbsp; '''(E)''' &nbsp; &nbsp; Graphische Darstellung der Verteilungen
+
&nbsp; &nbsp; '''(E)''' &nbsp; &nbsp; Darstellungsbereich für &bdquo;2D-WDF&rdquo;
  
&nbsp; &nbsp; '''(F)''' &nbsp; &nbsp; Momentenausgabe für blauen Parametersatz
+
&nbsp; &nbsp; '''(F)''' &nbsp; &nbsp; Manipulation der 3D-Grafik (Zoom, Drehen, ...)
  
&nbsp; &nbsp; '''(G)''' &nbsp; &nbsp; Momentenausgabe für roten Parametersatz
+
&nbsp; &nbsp; '''(G)''' &nbsp; &nbsp; Darstellungsbereich für &bdquo;1D-WDF&rdquo; bzw. &bdquo;Höhenlinien&rdquo;
  
&nbsp; &nbsp; '''(H)''' &nbsp; &nbsp; Variation der grafischen Darstellung
+
&nbsp; &nbsp; '''(H)''' &nbsp; &nbsp; Manipulation der 2D-Grafik (&bdquo;1D-WDF&rdquo;)
  
 +
&nbsp; &nbsp; '''( I )''' &nbsp; &nbsp; Bereich für die Versuchsdurchführung:  Aufgabenauswahl 
  
$\hspace{1.5cm}$&bdquo;$+$&rdquo; (Vergrößern),
+
&nbsp; &nbsp; '''(J)''' &nbsp; &nbsp; Bereich für die Versuchsdurchführung:  Aufgabenstellung
  
$\hspace{1.5cm}$ &bdquo;$-$&rdquo; (Verkleinern)
+
&nbsp; &nbsp; '''(K)''' &nbsp; &nbsp; Bereich für die Versuchsdurchführung:  Musterlösung einblenden
  
$\hspace{1.5cm}$ &bdquo;$\rm o$&rdquo; (Zurücksetzen)
+
&nbsp; &nbsp; '''( L)''' &nbsp; &nbsp; Bereich für die Versuchsdurchführung:  Musterlösung
 
+
<br><br><br><br><br><br><br><br>
$\hspace{1.5cm}$ &bdquo;$\leftarrow$&rdquo; (Verschieben nach links),  usw.
+
Werte&ndash;Ausgabe über Maussteuerung (sowohl bei 2D als auch bei 3D)   
 
+
<br clear=all>
&nbsp; &nbsp; '''( I )''' &nbsp; &nbsp; Ausgabe von ${\rm Pr} (z = \mu)$ und ${\rm Pr} (z \le \mu)$
 
  
&nbsp; &nbsp; '''(J)''' &nbsp; &nbsp; Bereich für die Versuchsdurchführung
 
<br clear=all>
 
<br>'''Andere Möglichkeiten zur Variation der grafischen Darstellung''':
 
*Gedrückte Shifttaste und Scrollen:  Zoomen im Koordinatensystem,
 
*Gedrückte Shifttaste und linke Maustaste: Verschieben des Koordinatensystems.
 
  
 
==Über die Autoren==
 
==Über die Autoren==
 
Dieses interaktive Berechnungstool  wurde am [http://www.lnt.ei.tum.de/startseite Lehrstuhl für Nachrichtentechnik] der [https://www.tum.de/ Technischen Universität München] konzipiert und realisiert.  
 
Dieses interaktive Berechnungstool  wurde am [http://www.lnt.ei.tum.de/startseite Lehrstuhl für Nachrichtentechnik] der [https://www.tum.de/ Technischen Universität München] konzipiert und realisiert.  
 
*Die erste Version wurde 2003 von [[Biografien_und_Bibliografien/An_LNTwww_beteiligte_Studierende#Ji_Li_.28Bachelorarbeit_EI_2003.2C_Diplomarbeit_EI_2005.29|Ji Li]] im Rahmen ihrer Diplomarbeit mit &bdquo;FlashMX&ndash;Actionscript&rdquo; erstellt (Betreuer: [[Biografien_und_Bibliografien/An_LNTwww_beteiligte_Mitarbeiter_und_Dozenten#Prof._Dr.-Ing._habil._G.C3.BCnter_S.C3.B6der_.28am_LNT_seit_1974.29|Günter Söder]]).  
 
*Die erste Version wurde 2003 von [[Biografien_und_Bibliografien/An_LNTwww_beteiligte_Studierende#Ji_Li_.28Bachelorarbeit_EI_2003.2C_Diplomarbeit_EI_2005.29|Ji Li]] im Rahmen ihrer Diplomarbeit mit &bdquo;FlashMX&ndash;Actionscript&rdquo; erstellt (Betreuer: [[Biografien_und_Bibliografien/An_LNTwww_beteiligte_Mitarbeiter_und_Dozenten#Prof._Dr.-Ing._habil._G.C3.BCnter_S.C3.B6der_.28am_LNT_seit_1974.29|Günter Söder]]).  
*2018 wurde das Programm  von [[Biografien_und_Bibliografien/An_LNTwww_beteiligte_Studierende#Jimmy_He_.28Bachelorarbeit_2018.29|Jimmy He]]  (Bachelorarbeit, Betreuer: [[Biografien_und_Bibliografien/Beteiligte_der_Professur_Leitungsgebundene_%C3%9Cbertragungstechnik#Tasn.C3.A1d_Kernetzky.2C_M.Sc._.28bei_L.C3.9CT_seit_2014.29|Tasnád Kernetzky]] ) auf &bdquo;HTML5&rdquo; umgesetzt und neu gestaltet.
+
* 2019 wurde das Programm  von&nbsp;[[Biografien_und_Bibliografien/An_LNTwww_beteiligte_Studierende#Carolin_Mirschina_.28Ingenieurspraxis_Math_2019.2C_danach_Werkstudentin.29|Carolin Mirschina]]&nbsp; im Rahmen einer Werkstudententätigkeit auf &bdquo;HTML5&rdquo; umgesetzt und neu gestaltet (Betreuer: [[Biografien_und_Bibliografien/An_LNTwww_beteiligte_LÜT-Angehörige#Dr.-Ing._Tasn.C3.A1d_Kernetzky_.28bei_L.C3.9CT_von_2014-2022.29|Tasnád Kernetzky]]).
 +
 
 +
 
 +
Die Umsetzung dieses Applets auf HTML 5 wurde durch&nbsp; [https://www.ei.tum.de/studium/studienzuschuesse/ Studienzuschüsse]&nbsp; der Fakultät EI der TU München finanziell unterstützt. Wir bedanken uns.
 +
 
  
 
==Nochmalige Aufrufmöglichkeit des Applets in neuem Fenster==
 
==Nochmalige Aufrufmöglichkeit des Applets in neuem Fenster==
  
{{LntAppletLink|verteilungen}}
+
{{LntAppletLinkDeEn|gauss|gauss_en}}

Aktuelle Version vom 26. Oktober 2023, 12:14 Uhr

Applet in neuem Tab öffnen   Open English Version


Programmbeschreibung


Das Applet verdeutlicht die Eigenschaften zweidimensionaler Gaußscher Zufallsgrößen  $XY\hspace{-0.1cm}$, gekennzeichnet durch die Standardabweichungen (Streuungen)  $\sigma_X$  und  $\sigma_Y$  ihrer beiden Komponenten sowie den Korrelationskoeffizienten  $\rho_{XY}$ zwischen diesen. Die Komponenten werden als mittelwertfrei vorausgesetzt:  $m_X = m_Y = 0$.

Das Applet zeigt

  • die zweidimensionale Wahrscheinlichkeitsdichtefunktion   ⇒   $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$  $f_{XY}(x, \hspace{0.1cm}y)$  in dreidimensionaler Darstellung sowie in Form von Höhenlinien,
  • die zugehörige Randwahrscheinlichkeitsdichtefunktion  ⇒   $\rm 1D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$  $f_{X}(x)$  der Zufallsgröße  $X$  als blaue Kurve; ebenso  $f_{Y}(y)$  für die zweite Zufallsgröße,
  • die zweidimensionale Verteilungsfunktion   ⇒   $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$  $F_{XY}(x, \hspace{0.1cm}y)$  als 3D-Plot,
  • die Verteilungsfunktion  ⇒   $\rm 1D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$  $F_{X}(x)$  der Zufallsgröße  $X$; ebenso  $F_{Y}(y)$  als rote Kurve.


Das Applet verwendet das Framework  Plot.ly

Theoretischer Hintergrund


Verbundwahrscheinlichkeitsdichtefunktion   ⇒   2D–WDF

Wir betrachten zwei wertkontinuierliche Zufallsgrößen  $X$  und  $Y\hspace{-0.1cm}$, zwischen denen statistische Abhängigkeiten bestehen können. Zur Beschreibung der Wechselbeziehungen zwischen diesen Größen ist es zweckmäßig, die beiden Komponenten zu einer  zweidimensionalen Zufallsgröße  $XY =(X, Y)$  zusammenzufassen. Dann gilt:

$\text{Definition:}$  Die  Verbundwahrscheinlichkeitsdichtefunktion  ist die Wahrscheinlichkeitsdichtefunktion (WDF,  englisch:  Probability Density Function, kurz: PDF) der zweidimensionalen Zufallsgröße  $XY$  an der Stelle  $(x, y)$:

$$f_{XY}(x, \hspace{0.1cm}y) = \lim_{\left.{\Delta x\rightarrow 0 \atop {\Delta y\rightarrow 0} }\right.}\frac{ {\rm Pr}\big [ (x - {\rm \Delta} x/{\rm 2} \le X \le x + {\rm \Delta} x/{\rm 2}) \cap (y - {\rm \Delta} y/{\rm 2} \le Y \le y +{\rm \Delta}y/{\rm 2}) \big] }{ {\rm \Delta} \ x\cdot{\rm \Delta} y}.$$
  • Die Verbundwahrscheinlichkeitsdichtefunktion oder kurz  $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$  ist eine Erweiterung der eindimensionalen WDF.
  • $∩$  kennzeichnet die logische UND-Verknüpfung.
  • $X$  und  $Y$ bezeichnen die beiden Zufallsgrößen, und  $x \in X$  sowie   $y \in Y$ geben Realisierungen hiervon an.
  • Die für dieses Applet verwendete Nomenklatur unterscheidet sich also geringfügig gegenüber der Beschreibung im Theorieteil.


Anhand dieser 2D–WDF  $f_{XY}(x, y)$  werden auch statistische Abhängigkeiten innerhalb der zweidimensionalen Zufallsgröße  $XY$  vollständig erfasst im Gegensatz zu den beiden eindimensionalen Dichtefunktionen   ⇒   Randwahrscheinlichkeitsdichtefunktionen:

$$f_{X}(x) = \int _{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}y ,$$
$$f_{Y}(y) = \int_{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}x .$$

Diese beiden Randdichtefunktionen  $f_X(x)$  und  $f_Y(y)$

  • liefern lediglich statistische Aussagen über die Einzelkomponenten  $X$  bzw.  $Y$,
  • nicht jedoch über die Bindungen zwischen diesen.


Als quantitatives Maß für die linearen statistischen Bindungen   ⇒   Korrelation  verwendet man

  • die  Kovarianz  $\mu_{XY}$, die bei mittelwertfreien Komponenten gleich dem gemeinsamen linearen Moment erster Ordnung ist:
$$\mu_{XY} = {\rm E}\big[X \cdot Y\big] = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} X \cdot Y \cdot f_{XY}(x,y) \,{\rm d}x \, {\rm d}y ,$$
  • den  Korrelationskoeffizienten  nach Normierung auf die beiden Effektivwerte  $σ_X$  und $σ_Y$  der beiden Komponenten:
$$\rho_{XY}=\frac{\mu_{XY} }{\sigma_X \cdot \sigma_Y}.$$

$\text{Eigenschaften des Korrelationskoeffizienten:}$ 

  • Aufgrund der Normierung gilt stets  $-1 \le ρ_{XY} ≤ +1$.
  • Sind die beiden Zufallsgrößen  $X$  und  $Y$ unkorreliert, so ist  $ρ_{XY} = 0$.
  • Bei strenger linearer Abhängigkeit zwischen  $X$  und  $Y$ ist  $ρ_{XY}= ±1$   ⇒   vollständige Korrelation.
  • Ein positiver Korrelationskoeffizient bedeutet, dass bei größerem  $X$–Wert im statistischen Mittel auch  $Y$  größer ist als bei kleinerem  $X$.
  • Dagegen drückt ein negativer Korrelationskoeffizient aus, dass  $Y$  mit steigendem  $X$  im Mittel kleiner wird.



2D–WDF bei Gaußschen Zufallsgrößen

Für den Sonderfall  Gaußscher Zufallsgrößen  – der Name geht auf den Wissenschaftler  Carl Friedrich Gauß  zurück – können wir weiterhin vermerken:

  • Die Verbund–WDF einer Gaußschen 2D-Zufallsgröße  $XY$  mit Mittelwerten  $m_X = 0$  und  $m_Y = 0$  sowie dem Korrelationskoeffizienten  $ρ = ρ_{XY}$  lautet:
$$f_{XY}(x,y)=\frac{\rm 1}{\rm 2\it\pi \cdot \sigma_X \cdot \sigma_Y \cdot \sqrt{\rm 1-\rho^2}}\ \cdot\ \exp\Bigg[-\frac{\rm 1}{\rm 2 \cdot (1-\it\rho^{\rm 2} {\rm)}}\cdot(\frac {\it x^{\rm 2}}{\sigma_X^{\rm 2}}+\frac {\it y^{\rm 2}}{\sigma_Y^{\rm 2}}-\rm 2\it\rho\cdot\frac{x \cdot y}{\sigma_x \cdot \sigma_Y}\rm ) \rm \Bigg]\hspace{0.8cm}{\rm mit}\hspace{0.5cm}-1 \le \rho \le +1.$$
  • Ersetzt man  $x$  durch  $(x - m_X)$  sowie  $y$  durch  $(y- m_Y)$, so ergibt sich die allgemeinere WDF einer zweidimensionalen Gaußschen Zufallsgröße mit Mittelwert.
  • Die Randwahrscheinlichkeitsdichtefunktionen  $f_{X}(x)$  und  $f_{Y}(y)$  einer Gaußschen 2D-Zufallsgröße sind ebenfalls gaußförmig mit den Streuungen  $σ_X$  bzw.  $σ_Y$.
  • Bei unkorrelierten Komponenten  $X$  und  $Y$ muss in obiger Gleichung  $ρ = 0$  eingesetzt werden, und man erhält dann das Ergebnis:
$$f_{XY}(x,y)=\frac{1}{\sqrt{2\pi}\cdot\sigma_{X}} \cdot\rm e^{-\it {x^{\rm 2}}\hspace{-0.08cm}/{\rm (}{\rm 2\hspace{0.05cm}\it\sigma_{X}^{\rm 2}} {\rm )}} \cdot\frac{1}{\sqrt{2\pi}\cdot\sigma_{\it Y}}\cdot e^{-\it {y^{\rm 2}}\hspace{-0.08cm}/{\rm (}{\rm 2\hspace{0.05cm}\it\sigma_{Y}^{\rm 2}} {\rm )}} = \it f_{X} \rm ( \it x \rm ) \cdot \it f_{Y} \rm ( \it y \rm ) .$$

$\text{Fazit:}$  Im Sonderfall einer 2D-Zufallsgröße mit Gaußscher WDF  $f_{XY}(x, y)$  folgt aus der  Unkorreliertheit  auch direkt die  statistische Unabhängigkeit:

$$f_{XY}(x,y)= f_{X}(x) \cdot f_{Y}(y) . $$

Bitte beachten Sie:

  • Bei keiner anderen WDF kann aus der  Unkorreliertheit  auf die  statistische Unabhängigkeit  geschlossen werden.
  • Man kann aber stets   ⇒   für jede beliebige 2D–WDF  $f_{XY}(x, y)$  von der  statistischen Unabhängigkeit  auf die  Unkorreliertheit  schließen, weil:
  • Sind zwei Zufallsgrößen  $X$  und  $Y$  völlig voneinander (statistisch) unabhängig, so gibt es zwischen ihnen natürlich auch keine linearen  Abhängigkeiten  
    ⇒   sie sind dann auch unkorreliert  ⇒   $ρ = 0$.



Höhenlinien bei unkorrelierten Zufallsgrößen

Höhenlinien der 2D-WDF bei unkorrelierten Größen

Aus der Bedingungsgleichung  $f_{XY}(x, y) = {\rm const.}$  können die Höhenlinien der WDF berechnet werden.

Sind die Komponenten  $X$  und  $Y$ unkorreliert  $(ρ_{XY} = 0)$, so erhält man als Gleichung für die Höhenlinien:

$$\frac{x^{\rm 2}}{\sigma_{X}^{\rm 2}}+\frac{y^{\rm 2}}{\sigma_{Y}^{\rm 2}} =\rm const.$$

Die Höhenlinien beschreiben in diesem Fall folgende Figuren:

  • Kreise  (falls  $σ_X = σ_Y$,   grüne Kurve), oder
  • Ellipsen  (für  $σ_X ≠ σ_Y$,   blaue Kurve) in Ausrichtung der beiden Achsen.


Korrelationsgerade

Als  Korrelationsgerade  bezeichnet man die Gerade  $y = K(x)$  in der  $(x, y)$–Ebene durch den „Mittelpunkt” $(m_X, m_Y)$. Diese besitzt folgende Eigenschaften:

Gaußsche 2D-WDF (Approximation mit $N$ Messpunkten) und
Korrelationsgerade  $y = K(x)$
  • Die mittlere quadratische Abweichung von dieser Geraden – in  $y$–Richtung betrachtet und über alle  $N$  Messpunkte gemittelt – ist minimal:
$$\overline{\varepsilon_y^{\rm 2} }=\frac{\rm 1}{N} \cdot \sum_{\nu=\rm 1}^{N}\; \;\big [y_\nu - K(x_{\nu})\big ]^{\rm 2}={\rm Minimum}.$$
  • Die Korrelationsgerade kann als eine Art „statistische Symmetrieachse“ interpretiert werden. Die Geradengleichung lautet im allgemeinen Fall:
$$y=K(x)=\frac{\sigma_Y}{\sigma_X}\cdot\rho_{XY}\cdot(x - m_X)+m_Y.$$
  • Der Winkel, den die Korrelationsgerade zur  $x$–Achse einnimmt, beträgt:
$$\theta={\rm arctan}(\frac{\sigma_{Y} }{\sigma_{X} }\cdot \rho_{XY}).$$


Höhenlinien bei korrelierten Zufallsgrößen

Bei korrelierten Komponenten  $(ρ_{XY} ≠ 0)$  sind die Höhenlinien der WDF (fast) immer elliptisch, also auch für den Sonderfall  $σ_X = σ_Y$.

Ausnahme:  $ρ_{XY}=\pm 1$   ⇒   Diracwand; siehe  Aufgabe 4.4  im Buch „Stochastische Signaltheorie”, Teilaufgabe  (5).

Höhenlinien der 2D-WDF bei korrelierten Größen

Hier lautet die Bestimmungsgleichung der WDF-Höhenlinien:

$$f_{XY}(x, y) = {\rm const.} \hspace{0.5cm} \Rightarrow \hspace{0.5cm} \frac{x^{\rm 2} }{\sigma_{X}^{\rm 2}}+\frac{y^{\rm 2} }{\sigma_{Y}^{\rm 2} }-{\rm 2}\cdot\rho_{XY}\cdot\frac{x\cdot y}{\sigma_X\cdot \sigma_Y}={\rm const.}$$

Die Grafik zeigt in hellerem Blau für zwei unterschiedliche Parametersätze je eine Höhenlinie.

  • Die Ellipsenhauptachse ist dunkelblau gestrichelt.
  • Die  Korrelationsgerade  $K(x)$  ist durchgehend rot eingezeichnet.


Anhand dieser Darstellung sind folgende Aussagen möglich:

  • Die Ellipsenform hängt außer vom Korrelationskoeffizienten  $ρ_{XY}$  auch vom Verhältnis der beiden Streuungen  $σ_X$  und  $σ_Y$  ab.
  • Der Neigungswinkel  $α$  der Ellipsenhauptachse (gestrichelte Gerade) gegenüber der  $x$–Achse hängt ebenfalls von  $σ_X$,  $σ_Y$  und  $ρ_{XY}$  ab:
$$\alpha = {1}/{2} \cdot {\rm arctan } \big ( 2 \cdot \rho_{XY} \cdot \frac {\sigma_X \cdot \sigma_Y}{\sigma_X^2 - \sigma_Y^2} \big ).$$
  • Die (rote) Korrelationsgerade  $y = K(x)$  einer Gaußschen 2D–Zufallsgröße liegt stets unterhalb der (blau gestrichelten) Ellipsenhauptachse.
  • $K(x)$  kann aus dem Schnittpunkt der Höhenlinien und ihrer vertikalen Tangenten geometrisch konstruiert werden, wie in der Skizze in grüner Farbe angedeutet.



Zweidimensionale Verteilungsfunktion   ⇒   2D–VTF

$\text{Definition:}$  Die  2D-Verteilungsfunktion  ist ebenso wie die 2D-WDF lediglich eine sinnvolle Erweiterung der  eindimensionalen Verteilungsfunktion  (VTF):

$$F_{XY}(x,y) = {\rm Pr}\big [(X \le x) \cap (Y \le y) \big ] .$$


Es ergeben sich folgende Gemeinsamkeiten und Unterschiede zwischen der „1D-VTF” und der„ 2D-VTF”:

  • Der Funktionalzusammenhang zwischen „2D–WDF” und „2D–VTF” ist wie im eindimensionalen Fall durch die Integration gegeben, aber nun in zwei Dimensionen. Bei kontinuierlichen Zufallsgrößen gilt:
$$F_{XY}(x,y)=\int_{-\infty}^{y} \int_{-\infty}^{x} f_{XY}(\xi,\eta) \,\,{\rm d}\xi \,\, {\rm d}\eta .$$
  • Umgekehrt lässt sich die Wahrscheinlichkeitsdichtefunktion aus der Verteilungsfunktion durch partielle Differentiation nach  $x$  und  $y$  angeben:
$$f_{XY}(x,y)=\frac{{\rm d}^{\rm 2} F_{XY}(\xi,\eta)}{{\rm d} \xi \,\, {\rm d} \eta}\Bigg|_{\left.{x=\xi \atop {y=\eta}}\right.}.$$
  • Bezüglich der Verteilungsfunktion  $F_{XY}(x, y)$  gelten folgende Grenzwerte:
$$F_{XY}(-\infty,\ -\infty) = 0,\hspace{0.5cm}F_{XY}(x,\ +\infty)=F_{X}(x ),\hspace{0.5cm} F_{XY}(+\infty,\ y)=F_{Y}(y ) ,\hspace{0.5cm}F_{XY}(+\infty,\ +\infty) = 1.$$
  • Im Grenzfall $($unendlich große  $x$  und  $y)$  ergibt sich demnach für die „2D-VTF” der Wert  $1$. Daraus erhält man die  Normierungsbedingung  für die 2D-Wahrscheinlichkeitsdichtefunktion:
$$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}x \,\,{\rm d}y=1 . $$

$\text{Fazit:}$  Beachten Sie den signifikanten Unterschied zwischen eindimensionalen und zweidimensionalen Zufallsgrößen:

  • Bei eindimensionalen Zufallsgrößen ergibt die Fläche unter der WDF stets den Wert $1$.
  • Bei zweidimensionalen Zufallsgrößen ist das WDF-Volumen immer gleich $1$.



Versuchsdurchführung


Aufgaben 2D-Gauss.png
  • Wählen Sie zunächst die Nummer (1, ...) der zu bearbeitenden Aufgabe.
  • Eine Aufgabenbeschreibung wird angezeigt. Die Parameterwerte sind angepasst.
  • Lösung nach Drücken von „Musterlösung”.
  • Bei der Aufgabenbeschreibung verwenden wir  $\rho$  anstelle von  $\rho_{XY}$.
  • Für die „1D-WDF” gilt:  $f_{X}(x) = \sqrt{1/(2\pi \cdot \sigma_X^2)} \cdot {\rm e}^{-x^2/(2 \hspace{0.05cm}\cdot \hspace{0.05cm} \sigma_X^2)}$.


Die Nummer 0 entspricht einem „Reset”:

  • Gleiche Einstellung wie beim Programmstart.
  • Ausgabe eines „Reset–Textes” mit weiteren Erläuterungen zum Applet.


(1)  Machen Sie sich anhand der Voreinstellung  $(\sigma_X=1, \ \sigma_Y=0.5, \ \rho = 0.7)$  mit dem Programm vertraut. Interpretieren Sie die Grafiken für  $\rm WDF$  und  $\rm VTF$.

  •  $\rm WDF$  ist ein Bergrücken mit dem Maximum bei  $x = 0, \ y = 0$. Der Bergkamm ist leicht verdreht gegenüber der  $x$–Achse.
  •  $\rm VTF$  ergibt sich aus  $\rm WDF$  durch fortlaufende Integration in beide Richtungen. Das Maximum $($nahezu  $1)$  tritt bei  $x=3, \ y=3$  auf.

(2)  Nun lautet die Einstellung  $\sigma_X= \sigma_Y=1, \ \rho = 0$. Welche Werte ergeben sich für  $f_{XY}(0,\ 0)$  und  $F_{XY}(0,\ 0)$? Interpretieren Sie die Ergebnisse.

  •  Das WDF–Maximum ist  $f_{XY}(0,\ 0) = 1/(2\pi)= 0.1592$, wegen  $\sigma_X= \sigma_Y = 1, \ \rho = 0$. Die Höhenlinien sind Kreise.
  •  Für den VTF-Wert gilt:  $F_{XY}(0,\ 0) = [{\rm Pr}(X \le 0)] \cdot [{\rm Pr}(Y \le 0)] = 0.25$. Geringfügige Abweichung wegen numerischer Integration.

(3)  Es gelten weiter die Einstellungen von (2). Welche Werte ergeben sich für  $f_{XY}(0,\ 1)$  und  $F_{XY}(0,\ 1)$? Interpretieren Sie die Ergebnisse.

  •  Es gilt  $f_{XY}(0,\ 1) = f_{X}(0) \cdot f_{Y}(1) = [ \sqrt{1/(2\pi)}] \cdot [\sqrt{1/(2\pi)} \cdot {\rm e}^{-0.5}] = 1/(2\pi) \cdot {\rm e}^{-0.5} = 0.0965$.
  •  Das Programm liefert  $F_{XY}(0,\ 1) = [{\rm Pr}(X \le 0)] \cdot [{\rm Pr}(Y \le 1)] = 0.4187$, also einen größeren Wert als in (2), da weiter integriert wird.

(4)  Die Einstellungen bleiben erhalten. Welche Werte ergeben sich für  $f_{XY}(1,\ 0)$  und  $F_{XY}(1,\ 0)$? Interpretieren Sie die Ergebnisse.

  •  Aufgrund der Rotationssysmmetrie gleiche Ergebnisse wie in (3).

(5)  Stimmt die Aussage: „Elliptische Höhenlinien gibt es nur für  $\rho \ne 0$”. Interpretieren Sie die  $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$  und $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$  für  $\sigma_X=1, \ \sigma_Y=0.5$  und  $\rho = 0$.

  •  Nein! Auch für  $\ \rho = 0$  sind die Höhenlinien elliptisch (nicht kreisförmig), falls  $\sigma_X \ne \sigma_Y$.
  •  Für $\sigma_X \gg \sigma_Y$  hat die  $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$  die Form eines langgestreckten Bergkamms parallel zur  $x$–Achse, für $\sigma_X \ll \sigma_Y$  parallel zur  $y$–Achse.
  •  Für $\sigma_X \gg \sigma_Y$  ist der Anstieg der  $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$  in Richtung der  $y$–Achse deutlich steiler als in Richtung der  $x$–Achse.

(6)  Variieren Sie ausgehend von  $\sigma_X=\sigma_Y=1, \ \rho = 0.7$  den Korrelationskoeffizienten  $\rho$. Wie groß ist der Neigungswinkel  $\alpha$  der Ellipsen–Hauptachse?

  •  Für  $\rho > 0$  ist  $\alpha = 45^\circ$  und für  $\rho < 0$  ist  $\alpha = -45^\circ$. Für  $\rho = 0$  sind die Höhenlinien kreisfömig und somit gibt es auch keine Ellipsen–Hauptachse.

(7)  Variieren Sie ausgehend von  $\sigma_X=\sigma_Y=1, \ \rho = 0.7$  den Korrelationskoeffizienten  $\rho > 0$. Wie groß ist der Neigungswinkel  $\theta$  der Korrelationsgeraden  $K(x)$?

  •  Für  $\sigma_X=\sigma_Y$  ist  $\theta={\rm arctan}\ (\rho)$. Die Steigung nimmt mit wachsendem  $\rho > 0$  zu. In allen Fällen gilt  $\theta < \alpha = 45^\circ$. Für  $\rho = 0.7$  ergibt sich  $\theta = 35^\circ$.

(8)  Variieren Sie ausgehend von  $\sigma_X=\sigma_Y=0.75, \ \rho = 0.7$  die Parameter  $\sigma_Y$  und  $\rho \ (>0)$. Welche Aussagen gelten für die Winkel  $\alpha$  und  $\theta$?

  •  Für  $\sigma_Y<\sigma_X$  ist  $\alpha < 45^\circ$  und für  $\sigma_Y>\sigma_X$  dagegen  $\alpha > 45^\circ$.
  •  Bei allen Einstellungen gilt:  Die Korrelationsgerade liegt unter der Ellipsen–Hauptachse.

(9)  Gehen Sie von  $\sigma_X= 1, \ \sigma_Y=0.75, \ \rho = 0.7$  aus und variieren Sie  $\rho$. Wie könnte man die Korrelationsgerade aus den Höhenlinien konstruieren?

  •  Die Korrelationsgerade schneidet alle Höhenlinien an den Punkten, an denen die Tangente zu der Höhenlinie senkrecht verläuft.

(10)  Nun gelte  $\sigma_X= \sigma_Y=1, \ \rho = 0.95$. Interpretieren Sie die  $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$. Welche Aussagen würden für den Grenzfall  $\rho \to 1$  zutreffen?

  •  Die  $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$  hat nur Anteile in der Nähe der Ellipsen–Hauptachse. Die Korrelationsgerade liegt nur knapp darunter:  $\alpha = 45^\circ, \ \theta = 43.5^\circ$.
  •  Im Grenzfall  $\rho \to 1$  wäre  $\theta = \alpha = 45^\circ$. Außerhalb der Korrelationsgeraden hätte die  $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$  keine Anteile. Das heißt:
  •  Längs der Korrelationsgeraden ergäbe sich eine Diracwand  ⇒   Alle Werte sind unendlich groß, trotzdem um den Mittelwert gaußisch gewichtet.




Zur Handhabung des Applets


Anleitung 2D-Gauss.png

    (A)     Parametereingabe per Slider:  $\sigma_X$,  $\sigma_Y$ und  $\rho$

    (B)     Auswahl:  Darstellung von WDF oder VTF

    (C)     Reset:  Einstellung wie beim Programmstart

    (D)     Höhenlinien darstellen anstelle von „1D-WDF”

    (E)     Darstellungsbereich für „2D-WDF”

    (F)     Manipulation der 3D-Grafik (Zoom, Drehen, ...)

    (G)     Darstellungsbereich für „1D-WDF” bzw. „Höhenlinien”

    (H)     Manipulation der 2D-Grafik („1D-WDF”)

    ( I )     Bereich für die Versuchsdurchführung: Aufgabenauswahl

    (J)     Bereich für die Versuchsdurchführung: Aufgabenstellung

    (K)     Bereich für die Versuchsdurchführung: Musterlösung einblenden

    ( L)     Bereich für die Versuchsdurchführung: Musterlösung







Werte–Ausgabe über Maussteuerung (sowohl bei 2D als auch bei 3D)


Über die Autoren

Dieses interaktive Berechnungstool wurde am Lehrstuhl für Nachrichtentechnik der Technischen Universität München konzipiert und realisiert.

  • Die erste Version wurde 2003 von Ji Li im Rahmen ihrer Diplomarbeit mit „FlashMX–Actionscript” erstellt (Betreuer: Günter Söder).
  • 2019 wurde das Programm von Carolin Mirschina  im Rahmen einer Werkstudententätigkeit auf „HTML5” umgesetzt und neu gestaltet (Betreuer: Tasnád Kernetzky).


Die Umsetzung dieses Applets auf HTML 5 wurde durch  Studienzuschüsse  der Fakultät EI der TU München finanziell unterstützt. Wir bedanken uns.


Nochmalige Aufrufmöglichkeit des Applets in neuem Fenster

Applet in neuem Tab öffnen   Open English Version