Lectures on the general theory of observation: the calculus of probability and the method of least squares. (Q1535000)
From MaRDI portal
scientific article
Language | Label | Description | Also known as |
---|---|---|---|
English | Lectures on the general theory of observation: the calculus of probability and the method of least squares. |
scientific article |
Statements
Lectures on the general theory of observation: the calculus of probability and the method of least squares. (English)
0 references
1889
0 references
Dieses Buch enthält Herrn Thiele's Vorlesungen über die allgemeine Fehlertheorie, die Wahrscheinlichkeitsrechnung und die Ausgleichung der Fehler. Es ist zum Gebrauch seiner Schüler bestimmt und daher ohne die begleitenden Vorträge des Verfassers schwer zu verstehen. Da das Buch aber manche neuen Gesichtspunkte enthält, so soll hier versucht werden, den Gang der Entwickelung und die Hauptsätze des Buches wiederzugeben. Zuerst muss dann darauf aufmerksam gemacht werden, dass der Verfasser das ``factische Fehlergesetz'' und das ``theoretische Fehlergesetz'' unterscheidet. Das erstere giebt nur eine verkürzte und übersichtliche Darstellung der vorgelegten Beobachtungen, während das letztere, welches nicht mathematisch bewiesen werden kann, die Schlüsse zieht, die über den Ausfall künftiger Beobachtungen möglich sind. Es werden nun zuerst die factischen Fehlergesetze untersucht, was also dasselbe ist, wie die Entwickelung der Methoden, durch welche die Beobachtungen in leicht übersichtlichen Formen dargestellt werden können. Der Verfasser redet in diesem Abschnitt gar nicht von Wahrscheinlichkeit, sondern von der Häufigkeit oder relativen Häufigkeit einer gemachten Beobachtung, wenn derselbe Versuch unter denselben wesentlichen Bedingungen öfter wiederholt ist und verschiedene Resultate ergeben hat, während doch jedes Resultat mehrere Male erscheinen kann. Hier wird natürlich nur von solchen Versuchen gesprochen, deren Resultate durch Zahlen ausgedrückt werden können. Die Fehlercurve wird construirt, indem man die relative oder absolute Häufigkeit als Ordinate, die Beobachtung als Abscisse nimmt. Bisweilen construirt man jedoch auch Fehlercurven, indem man zwar dieselben Abscissen wie vorher nimmt, die Ordinaten aber mit dem Flächeninhalt der vorigen Fehlercurve (von einer willkürlichen Ordinate gerechnet) proportional macht. Analytisch kann man die Häufigkeit der Beobachtungen durch Reihenentwickelungen darstellen. Von diesen Reihen empfiehlt der Verfasser zwei: entweder, wenn die Beobachtungen als äquidistante Zahlen gegeben sind, nach den Binomialcoefficienten, oder wenn die Beobachtungen continuirlich gegeben sind, nach der Exponentialfunction \(e^{-\tfrac 12 x^2}\) und deren Differentialcoefficienten. Die factischen Fehlergesetze können aber auch auf andere Weise dargestellt werden, nämlich mittels symmetrischer Functionen. Die einfachsten symmetrischen Functionen sind, wenn die Beobachtungen \(o, o_1, o_2, \dots\) sind: \[ s_{0} = \varSigma o^{0} = n, \quad \varSigma o^1 = s_1, \quad \varSigma o^2 = s_2, \dots ; \] kennt man eben so viele solcher Functionen wie Beobachtungen, so sind diese dadurch implicite bekannt. Noch besser ist es, die symmetrischen Functionen zu bilden, welche der Verfasser die Halbinvarianten des Fehlergesetzes nennt. Diese werden immer \(\mu_{1}, \mu_{2}, \mu_{3}, \dots \), u. s. w. genannt und werden durch die folgenden Gleichungen definirt: \[ \begin{aligned} & s_{1} = s_{0} \mu_{1},\\ & s_{2} = s_1 \mu_{1} + s_0 \mu_{2},\\ & s_3 = s_2 \mu_{1} + 2s_1 \mu_{2} + s_0 \mu_{3},\\ & s_4 = s_3 \mu_{1} + 3s_2 \mu_{2} + 3s_1 \mu_{3} + s_0 \mu_{4},\\ & \hdotsfor{1}\end{aligned} \] u. s. w. In expliciter Form hat man dann \[ \mu_{1} = \frac{s_1}{s_0}, \quad \mu_{2} = \frac{1}{s_0^2}(s_0 s_2 - s_1^2), \quad \mu_{3} = \frac{1}{s_0^3}\; (s_0^2 s_3 - 3s_0 s_1 s_2 + 2s_1^3), \cdots. \] Die erste Halbinvariante ist die Mittelzahl der sämtlichen Beobachtungen, die zweite das Quadrat des Mittelfehlers. Mit Ausnahme von \(\mu_{1}\) sind die Halbinvarianten unabhängig von dem Nullwert der Beobachtungen. Die Werte \(\mu_{3} \mu_{2}^{-\tfrac 32}, \mu_{4} \mu_{2}^{-\tfrac 42}, \dots\) sind zugleich unabhängig von der gewählten Masseneinheit. Die Betrachtungen, welche über factische Fehlergesetze an gestellt sind, gelten natürlich auch von den a priori gegebenen theoretischen Fehlergesetzen. Sind die Fehlergesetze continuirlich gegeben, so werden die Summen durch Integrale ersetzt; sonst werden die \(\mu\) auf dieselbe Weise wie vorher gebildet. Für das einfache exponentielle Fehlergesetz \[ \varphi(x) = e^{-\tfrac 12 \left( \frac{xm}{n} \right)^{2}} \] ergiebt sich, dass \(\mu_{1} = m, \; \mu_{2} = n^2\), und dass alle folgenden \(\mu\) verschwinden. Hierdurch ist also ein einfaches Kriterium dafür gegeben, ob ein Fehlergesetz exponentiell ist. Infolge dessen kann gezeigt werden, dass das Fehlergesetz für die Function \(y = a + bx + cx^2\) nicht exponentiell ist, wenn das Fehlergesetz für \(x\) exponentiell ist. Wenn die Functionen von mehreren Beobachtungen abhängig sind, kann man das Fehlergesetz für die Functionen finden, wenn die Fehlergesetze der einzelnen Beobachtungen bekannt sind und ausserdem die einzelnen Beobachtungen gegenseitig frei combinirt werden können, sonst aber nicht. So braucht z. B. eine Beobachtung, die zwischen gegebenen Grenzen liegt, es nicht mit sich zu bringen, dass eine damit zu combinirende Beobachtung auch zwischen gegebenen Grenzen liegen muss. Ein wichtiges Beispiel dafür, wie man das Fehlergesetz als eine Function gegebener Grössen finden kann, wenn die Fehlergesetze der einzelnen Grössen bekannt sind, bietet die lineare Function \[ u = ao + bo' + co'' + \cdots \] von verschiedenen beobachteten Grössen, die frei combinirt werden können. Werden die Halbinvarianten für \(o, o', o'', \dots\) mit \(\mu (o), \mu (o'), \mu (o''), \dots\) bezeichnet, und werden die Halbinvarianten von \(u\) mit \(M(u)\) bezeichnet, so hat man \[ M_{n} (u) = a^n \mu_{n} (o) + b^{n} \mu_{n} (o') + c^{n} \mu_{n} (o'') + \cdots . \] Diese Fundamentaleigenschaft der Halbinvarianten hat eben den Verfasser dazu bewogen, jene Functionen zur Darstellung der Fehlergesetze zu gebrauchen. Wenn speciell \(a = b = c = \cdots = 1\), so wird \[ M_{n} (u) = \varSigma \mu_{n} (o). \] Da \(\mu_{2}\) positiv, die anderen Halbinvarianten sowohl positiv wie negativ sein können, so wächst \(M_2\) für jedes neu hinzukommende Glied; die folgenden \(M_n\) thun dies aber nicht, sie haben vielmehr eine Tendenz dazu, dass ihre Verhältnisse zu \(M_{2}^{\tfrac 12 n}\) sich der Null nähern. Eine Folge hiervon ist, dass im allgemeinen das zusammengesetzte Fehlergesetz sich mehr dem exponentiellen Fehlergesetz nähert, als das meist abweichende Fehlergesetz der einzelnen Grössen. Dieses ist ein Grund des häufigen Vorkommens des exponentiellen Fehlergesetzes. Nachdem die factischen Fehlergesetze untersucht sind, behandelt der Verfasser im nächsten Abschnitte die von ihm so genannten Methodenfehlergesetze. Wir können nicht dabei stehen bleiben, das factische Fehlergesetz als etwas rein Zufälliges zu betrachten. Vielmehr müssen wir das factische Fehlergesetz als eine Eigentümlichkeit unserer Beobachtungsmethode ansehen. Das factische Fehlergesetz ändert sich mit der Anzahl der Beobachtungen. Es lässt sich nicht beweisen, dass das factische Fehlergesetz sich einer bestimmten Grenze nähert; man hat aber doch Grund anzunehmen, dass dieses der Fall ist. Das Methodenfehlergesetz wird daher vom Verfasser definirt als die Grenze, welcher das factische Fehlergesetz sich nähert, wenn die Anzahl der Beobachtungen ins Unendliche wächst. Dass diese Grenze existirt, ist ein Axiom; es ist dasselbe wie das Gesetz der grossen Zahlen. Wenn es sich zeigt, dass das factische Fehlergesetz sich keiner Grenze nähert, so kann man dieses als ein Zeichen dafür ausehen, dass man Umstände übersehen hat, die für die Beobachtungen wesentlich sind. So wird das Gesetz der grossen Zahlen ein Kennzeichen dafür, ob die Beobachtungsmethode gut oder schlecht gewesen ist. Im allgemeinen muss man das Methodenfehlergesetz aus den gegebenen Beobachtungen herleiten; bisweilen kann man aber das Methodenfehlergesetz a priori bestimmen. Dieses ist z. B. der Fall in der directen Wahrscheinlichkeitsrechnung, wo ie Wahrscheinlichkeit einer bestimmten Verteilung von schwarzen und weissen Kugeln bei dem \(n\)-mal wiederholten Ziehen einer Kugel aus einer Urne mit gegebenem Inhalt ein gutes Beispiel von einem a priori bestimmten Fehlergesetze giebt. Der Verfasser behandelt die directe Wahrscheinlichkeitsrechnung sehr kurz und giebt nur die Hauptsätze und ein Paar Beispiele von deren Anwendung. Dagegen wird die Frage ausführlich behandelt, ob man aus der beobachteten relativen Häufigkeit etwas über die apriorische Wahrscheinlichkeit schliessen kann. Haben \(m\) Versuche ``ja'', \(l\) ``nein'' gegeben, während die apriorischen Wahrscheinlichkeiten für ``ja'' und ``nein'' beziehungsweise \(p\) und \(q\) sind, so kann man sehr wohl annehmen, dass \[ \frac{p}{p + q} = \frac{m + a + \varphi}{m + l + b + \psi} \] ist, wo \(a\) und \(b\) Constanten sind, \(\varphi\) und \(\psi\) Grössen, die sich der Null nähern, wenn \(m\) und \(l\) ins Unendliche wachsen. Man hat aber kein Mittel zu einer exacten Bestimmung der Grössen \(a, \varphi, b\) und \(\psi\). Annäherungsweise kann man \(\varphi\) und \(\psi\) der Null gleich setzen, und man muss dann \(b = 2a\) setzen, weil \[ \frac{q}{q + p} = \frac{l + a}{m + l + b} \] und also \[ \frac{m + l + 2a}{m + l + b} = 1. \] Geschichtlich hat man nur \(a = 0\) oder \(a = 1\) gesetzt. Der Verfasser zeigt nun durch Construction der Fehlercurven, dass \(a = 0\) und \(a = \tfrac 12\) eine besondere Bedeutung hat, \(a = 1\) aber keine. Hiernach wendet der Verfasser sich zur Bestimmung des Methodenfehlergesetzes, wenn die factischen Fehlergesetze gegeben sind. Zum Unterschied von den Halbinvarianten des factischen Fehlergesetzes werden die Halbinvarianten des Methodenfehlergesetzes mit \(\lambda\) bezeichnet. Wenn man meint, etwas von den Halbinvarianten des Methodenfehlergesetzes zu wissen, kann man versuchsweise diese als gegeben betrachten, und danach die Halbinvarianten der \(\mu_{i}, \lambda(\mu_{i})\) berechnen, indem man \(\mu_{i}\) als eine Function von \(m\) verschiedenen Beobachtungen betrachtet (wenn \(m\) Beobachtungen gegeben sind), deren Fehlergesetze alle dieselben sind mit den Halbinvarianten \(\lambda\). Wie man diese Halbinvarianten \(\lambda(\mu_{i})\) berechnen muss, ist vorher gezeigt. Man hat dann z. B.: \[ \lambda_1 (\mu_1) = \lambda_1, \quad \lambda_2 (\mu_1) = \frac{1}{m}\;\lambda_2, \dots, \lambda_{\nu} (\mu_1) = \frac{1}{m^{\nu - 1}}\;\lambda_{\nu}, \] \[ \lambda_{1} (\mu_2) = \frac{m - 1}{m}\;\lambda_2,\quad \lambda_2 (\mu_2) = \frac{(m - 1)^2}{m^3}\;\lambda_4 + 2\frac{m - 1}{m^2}\;\lambda_{2}^{2}, \dots \] u. s. w. Wären die \(\lambda\) wirklich bekannt, so würden diese Halbinvarianten dazu dienen können, zu bestimmen, ob die \(\mu\) als Annäherungen an die \(\lambda\) gelten könnten. Ist das Methodenfehlergesetz vollständig unbekannt, so kann man nichts anderes thun, als annehmen, dass die \(\mu\) mit ihren Mittelwerten identisch sind, so dass \(\mu_{\nu} = \lambda_1 (\mu_{\nu})\). Hiernach findet man \[ \begin{aligned} & \lambda_1 = \mu_1, \quad \lambda_2 = \frac{m}{m - 1} \mu_2, \quad \lambda_3 = \frac{m^2}{(m - 1) (m - 2)}\;\mu_3;\\ & \lambda_4 = \frac{m^3}{(m - 1)(m^2 - 6m + 6)}\;\left( \mu_4 + \frac{6}{m - 1} \;\mu_{2}^{2} \right), \dots\end{aligned} \] u. s. w. Zur Prüfung dieser Hypothese vom Methodenfehlergesetze hat man die Halbinvarianten der \(\mu\) zu bestimmen, indem man annimmt, dass die berechneten \(\lambda\) die Methodenfehlerinvarianten sind, und namentlich darauf Acht zu geben, ob der Mittelfehler \(\sqrt{\lambda_2 (\mu_{\nu})}\) klein ist. Es wird sich hierdurch zeigen, dass es sehr schwierig ist, eine gute Bestimmung der höheren Halbinvarianten des Methodenfehlergesetzes zu erhalten, so dass dieses auch ein Grund dafür ist, sich mit den ersten zwei Halbinvarianten zu begnügen und das Fehlergesetz als exponentiell zu betrachten. Der folgende Abschnitt handelt von der Ausgleichung der Fehler. Das allgemeinste Problem ist hier: Aus einer gegebenen Anzahl von Beobachtungen die sämtlichen Fehlergesetze und alle Relationen der beobachteten Grössen zu bestimmen. Dieses Problem ist im allgemeinen unlöslich und kann nur zum Teil unter sehr speciellen Voraussetzungen gelöst werden, nämlich dass alle Fehlergesetze exponentiell sind, dass man wenigstens mit Annäherung alle \(\lambda_{i}\) kennt, und dass alle vorkommenden Gleichungen linear sind. Bezeichnet man \[ u = a_1 o_1 + a_2 o_2 + \cdots + a_n o_n = [ao], \] wo \(o, o', \dots\) frei zu combinirende Grössen sind, so ist das Fehlergesetz von \(u\) durch \[ \lambda_{r}(u) = [a^r \lambda_{r} (o)] \] gegeben. Wenn \(v, w, \dots\) ähnliche Functionen wie \(u\) sind, und wenn \[ U = eu + fv + gw + \cdots, \] so kann man nicht die Halbinvarianten von dem Fehlergesetze von \(U\) auf ähnliche Weise bilden, da \(u, v, w, \dots\) nicht von einander unabhängige Beobachtungen sind. Sind aber alle Methodenfehlergesetze exponentiell, so tritt der Unterschied nur in \(\lambda_2 (U)\) hervor, und diese Halbinvariante kann auf ähnliche Weise wie \(\lambda_{\nu} (u)\) gebildet werden, wenn \[ [ab\lambda_{2} (o)] = 0, \quad [ad \lambda_2 (o)] = 0, \dots \] u. s. w. In diesem Falle können die Functionen \(u, v, w, \dots\) als unabhängige Beobachtungen behandelt werden. Der Verfasser nennt solche Functionen ``gegenseitig freie Functionen''. Der Verfasser zeigt nun, dass man immer ein System von linearen Functionen durch ein System von gegenseitig freien Functionen ersetzen kann, und dass dieses letzte System höchstens eben so viele Functionen wie gegebene Beobachtungen enthält (complettes System). Bei allen Ausgleichungen hat man zu bemerken, das ein vorgelegtes System von gegenseitig unabhängigen Beobachtungen nur durch ein äquivalentes System von gegenseitig freien Functionen ersetzt werden muss. Die Aenderungen müssen mittels orthogonaler Transformationen geschehen, und auf diese beschränkt man sich in den Eliminationen, welche die Ausgleichung fordert. Lineare Functionen, deren Werte theoretisch gegeben sind, werden von den anderen befreit, so das sowohl diese wie jene als unabhängig gegebene Beobachtungen betrachtet werden können. Für die theoretisch gegebenen Functionen müssen die beobachteten fehlerhaften Werte durch die wahren ersetzt werden; während man, was die anderen anbetrifft, sich an die beobachteten Werte halten muss. Indem man diesen Principien folgt, kommt man zu einem System von Formeln, deren Resultat das ist, welches die Summe der Fehlerquadrate zu einem Minimum macht. Während aber andere Verfasser das Minimumsprincip als Grundlage für die ganze Theorie brauchen, wird dieses Princip bei Herrn Thiele nur eine Consequenz der Freimachung der Functionen. Das Buch enthält zum Schlusse einige Hülfstafeln über die Werte von \(\int_{0}^{x} e^{-\frac 12 z^2} dz, \; \log e^{-\frac 12 x^3}\) für Argumente mit einer Differenz von 0,01, somit eine Interpolationstafel, welche eine leichte Bestimmung der zwischenliegenden Werte gestattet. Ausserdem findet man eine Auflösung der algebraischen Functionen, welche in den Differentialcoefficienten von \(e^{-\tfrac 12 x^2}\) vorkommen, in reelle Factoren zweiten Grades und eine Tafel über symmetrische Functionen.
0 references
error theory
0 references
probability theory
0 references
least squares
0 references