Analytical inequalities and statistical tests. (Q2599486)

Verf. kehrt das in der angewandten Mathematik übliche Verfahren derart um, daß er sich die Frage vorlegt, ``für welche konkreten Probleme eine bestimmte Klasse von mathematischen Hilfsmitteln geeignet ist''. Und zwar untersucht er die Anwendbarkeit verschiedener bekannter analytischer Ungleichungen auf die Konstruktion statistischer Maßzahlen. \[ \displaylines{\rlap{\qquad\!(1)} \hfill \begin{matrix}\,&\;&\;&\\ a_{11},&\,a_{12},&\dots,&a_{1m}\\ a_{21},&\,a_{22},&\dots,&a_{2m}\\ \spaceinnerhdots{1.4}\for{4}\after\;\\ a_{n1},&a_{n2},&\dots,&a_{nm}\end{matrix} \hfill} \] sei eine Matrix reeller Zahlen, \[ c_{ih}=\frac{\textstyle \sum\limits_{k}a_{ik}\,a_{hk}}{\sqrt{\sum\limits_{k} a_{ik}^2\sum\limits_{k}a_{hk}^2}},\quad\;K_n=\begin{vmatrix}\l\;&\;&\;&\\ 1&c_{12},&\dots,&c_{1n}\\ c_{21}&1,&\dots,&c_{2n}\\ \spaceinnerhdots{1.6}\for{4}\after\;\\ c_{n1}&c_{n2},&\dots,&1\,\end{vmatrix}. \] Nach der verallgemeinerten Cauchyschen Ungleichung ist \(0\leqq K_n\leqq 1\). Die Bedeutung dieser Beziehung in der Theorie der Mehrfachkorrelation ist bekannt. Sind jedoch die \(a_{ik}\) die Häufigkeiten zweidimensionaler Merkmale \((x_i, y_k)\), so kann \(K_{n}\) als eine Art Kontingenzkoeffizient aufgefaßt werden. Aus \(K_{n} = 0\) folgt, daß die Zeilen in (1) linear abhängig sind, so daß \(x\) in gewissem Sinne von \(y\) unabhängig ist. Aus \(K_{n} = 1\) folgt die funktionelle Abhängigkeit von \(x\) und \(y\) in dem Sinne, daß z. B. bei \(m = n\) in jeder Zeile und in jeder Spalte von (1) je eine von 0 verschiedene Häufigkeit \(a_{ik}\) steht. Sind andererseits die \(a_{ik}\) die Werte von Größen \(a_{\imath}\) (\(i - 1\), 2,\dots, \(n\)), die diese unter dem Einfluß gewisser Faktoren \(B_k\)\, (\(k = 1\), 2,\dots, \(m\)) annehmen (z. B. die Ernteerträge von \(n\) Getreidearten), so kann \(K_{n}\) als ein ``Kriterium der Ähnlichkeit der Einwirkung'' aufgefaßt werden. \(K_{n} = 0\) bedeutet, daß die Faktoren \(B_k\) auf die Größen \(a_{i}\) in gleicher Weise einwirken, während aus \(K_{n}=1\) die extreme Verschiedenheit der Einflüsse in dem Sinne folgt, daß in jedem Paar \(a_{ik}\), \(a_{jk}\) (\(k=1\), 2,\dots, \(m\); \(i\neq j\)) eine der beiden Größen verschwinden muß. Sind \(x_{i}\), \(y_{i}\)\, (\(i= 1\), 2,\dots, \(n\)) die beobachteten Werte der Zufallsvariablen \(x\), \(y\), die nur positiver Werte fähig sind, so gilt für die Größe \[ r_k=\frac{\textstyle \sum x_iy_i}{(\sum x_i^k)^{\tfrac{1}{k}}(\sum y_i^{k'})^{\tfrac{1}{k'}}}\quad\Bigl(k\neq0, \neq1, k'=\dfrac{k}{k-1}\Bigr) \] nach der Hölderschen Ungleichung \(r_{k}\leqq 1\) für \(k>1\), \(r_{k}\geqq 1\) für \(0 < k < 1\). \(r_{k} = 1\) gilt in beiden Fällen nur dann, wenn \(y_i=Cx_i^{k-1}\) (\(i = 1\), 2,\dots, \(n\)) erfüllt ist. \(r_{k}\) kann demnach als ein Maß der ``potenziellen Verbundenheit'' von \(x\) und \(y\) dienen. Die \(a_{ik}\) in (1) seien wieder die beobachteten Häufigkeiten zweidimensionaler Merkmale \((x_i, y_k)\) und \(G(u_k)\) das geometrische Mittel von \(u_1\), \(u_{2}\),\dots, \(u_{m}\). Dann gilt für die Größe \[ K=\frac{G(a_{1k})+G(a_{2k})+\dots +G(a_{nk})}{G(a_{1k}+a_{2k}+\dots +a_{nk})} \] nach einer Verallgemeinerung der Hölderschen Ungleichung \(0\leqq K\leqq 1\). Nimmt man an, daß in (1) in keiner Zeile lauter Nullen stehen, so gilt \(K=1\) nur dann, wenn je zwei Zeilen (und damit je zwei Kolonnen) in (1) einander proportional sind, also bei stochastischer Unabhängigkeit von \(x\) und \(y\). Dagegen läßt der Fall \(K=0\) im allgemeinen keine eindeutige statistische Interpretation zu. Sind die \(a_{ik}\) wieder Häufigkeiten und \[ H_r=\frac{[\sum (a_{1k}+a_{2k}+\dots +a_{nk})^r]^{\tfrac{1}{r}}}{(\sum a_{1k}^r)^{\tfrac{1}{r}}+\dots +(\sum a_{nk}^r)^{\tfrac{1}{r}}}, \] so ist im Falle \(r > 1\) nach der Minkowskischen Ungleichung \(H_{r}\leqq 1\), ferner \(H_r\geqq m^{\frac{1}{r}-1}\) im Falle \(m = n\). Diese untere Grenze wird dann und nur dann erreicht, wenn in jeder Zeile und in jeder Spalte von (1) nur eine von 0 verschiedene Häufigkeit steht und alle diese Häufigkeiten einander gleich sind. Aus \(H_{r}=1\) folgt die stochastische Unabhängigkeit der Merkmale. \(H_{r}\) kann demnach als Kontingenzmaß gelten. Ähnlich wie \(K_{n}\) lassen sich auch \(K\) und \(H_{r}\) als Kriterien der Ähnlichkeit der Einwirkung auffassen, wenn die \(a_{ik}\) Werte der positiven Zufallsvariablen \(x_{1}\), \(x_{2}\),\dots , \(x_{n}\) in \(m\) Versuchen sind. Aus \(K = 1\) oder \(H_{r}=1\) folgt \(x_i=\alpha _it\)(\(i = 1\), 2,\dots, \(n\)), so daß zwischen den Größen \(x_{i}\) eine ``lineare Ähnlichkeit'' besteht. Endlich kann \(H_{r}\) mit \(n = 2\) als eine Art Korrelationskoeffizient dienen, wobei aus \(H_{r} = 1\) die lineare funktionelle Abhängigkeit der Größen \(x_{1}\) und \(x_{2}\) mit den beobachteten Werten \(a_{1k}\), \(a_{2k}\) (\(k = 1\), 2,\dots, \(m\)) folgt. Sind die Zahlen \(a_1\), \(a_2\),\dots, \(a_{n}\) positiv und \[ M_r=\Bigl(\frac{1}{n}\sum a_i^r\Bigr)^\tfrac{1}{r},\qquad L=\frac{M_r}{M_s}, \] so gilt im Falle \(0 < r < s\) stets \(0<L\leqq 1\), wobei \(L = 1\) nur bei Gleichheit aller \(a_{i}\) eintritt. Sind die \(a_{i}\) beobachtete Häufigkeiten von \(n\) Ereignissen, so kann \(L\) als Kriterium der Gleichmöglichkeit dienen. Andererseits kann man \(L\) als Kriterium der Stabilität einer Größe \(X\) benutzen, die die positiven Werte \(a_1\), \(a_{2}\),\dots, \(a_{n}\) annimmt. Die Frage der praktischen Brauchbarkeit der vorgeschlagenen Maßzahlen kann nur durch eingehendere Untersuchungen entschieden werden.

0 references

MaRDI profile type

MaRDI publication profile

0 references

Identifiers

zbMATH Open document ID

64.1216.02

0 references

zbMATH DE Number

2518663

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:2599486