On a test whether two samples are from the same population. (Q2587646)

From MaRDI portal
scientific article
Language Label Description Also known as
English
On a test whether two samples are from the same population.
scientific article

    Statements

    On a test whether two samples are from the same population. (English)
    0 references
    0 references
    0 references
    1940
    0 references
    Es mögen \(m\) Beobachtungen \(x_1,x_2,\ldots,x_m\) einer stochastischen Größe \(X\) und \(n\) Bebachtungen \(y_1, y_2,\ldots, y_n\) einer zweiten solchen Veränderlichen \(Y\) vorliegen. Geprüft wird die Richtigkeit der Vermutung, daß \(X\) und \(Y\) das gleiche Verteilungsgesetz besitzen, ohne daß dabei irgendwelche Annahmen über die Art dieses Gesetzes gemacht werden. Die Größen \(x_i\) und \(y_i\) werden zu diesem Zweck zusammengefaßt und ihre Reihe \(z_k\), \(k = 1, 2,\ldots, (m + n)\), nach steigenden Werten geordnet, wobei das Vorkommen gleicher Ziffern ausgeschlossen sein soll. Dieser Reihe wird eine weitere Folge zugeordnet, die eine Null aufweist, wenn der \(z\)-Wert aus \(X\) stammt, eine Eins dagegen, falls er von \(Y\) herrührt. Wenn die Verteilungsgesetze von \(X\) und \(Y\) die gleichen sind, werden sich die Nullen und Einsen schnell abwechseln, es treten also nur kurze, dafür aber viele Iterationen auf. Die Anzahl \(U\) der Iterationen in der \((m + n)\)-gliedrigen Folge wählen Verf. als Kennzahl zur Beurteilung der gestellten Frage. Die Theorie solcher Sequenzen hat \textit{L. v. Bortkiewicz} in seinem Buche ``Iterationen'' (Berlin 1917; F. d. M. 46, 774 (JFM 46.0774.*)) sehr ausführlich entwickelt. Verf. scheinen das nicht zu wissen; sie leiten \(E (U)\) und \(\sigma^2 (U)\) selbständig her. Ein Nachteil der geistreichen Methode liegt meines Erachtern darin, daß bei wirklich gleichen Verteilungsgesetzen in der Regel \(U_{\text{beob}}\) \textit{nicht} gleich \(E (U)\) ausfällt, sondern größer, da die Nullen und Einsen \textit{über}zufällig oft abwechseln. Der Ausdruck \(\left(U_{\text{beob}} - E (U)\right): \sigma(U)\) scheint mir darum nicht sonderlich geeignet, die Richtigkeit der ursprünglichen Vermutung zu beurteilen. Andererseits beweisen Verf., daß ihre Probe konsistent ist. Das bedeutet, daß die Wahrscheinlichkeit, die Nullhypothese zu verwerfen, wenn sie falsch ist, mit wachsendem \((m + n)\) gegen Eins geht. Diese notwendige, wenn auch nicht hinreichende Eigenschaft einer Prüffunktion besitzt ein dem gleichen Zweck dienender Ansatz von \textit{W. R. Thompson} (Ann. math. Statist., Ann Arbor, 9 (1938), 281-287; JFM 64.1222.*) nicht, weswegen ihn Verf. ablehnen.
    0 references
    0 references
    0 references
    0 references