Pearson-Verteilung: Definition, Anwendung

Inhaltsverzeichnis:

Pearson-Verteilung: Definition, Anwendung
Pearson-Verteilung: Definition, Anwendung
Anonim

Was ist das Verteilungsgesetz von Pearson? Die Antwort auf diese umfassende Frage kann nicht einfach und prägnant sein. Das Pearson-System wurde ursprünglich entwickelt, um sichtbare verzerrte Beobachtungen zu modellieren. Zu dieser Zeit war es bekannt, ein theoretisches Modell so abzustimmen, dass es mit den ersten beiden Kumulanten oder Momenten von beobachteten Daten übereinstimmt: Jede Wahrscheinlichkeitsverteilung kann direkt erweitert werden, um eine Gruppe von Ortsskalen zu bilden.

Pearsons Hypothese über die Normalverteilung von Kriterien

Außer in pathologischen Fällen kann die Ortsskala beliebig an den beobachteten Mittelwert (erste Kumulante) und Varianz (zweite Kumulante) angepasst werden. Es war jedoch nicht bekannt, wie man Wahrscheinlichkeitsverteilungen konstruiert, bei denen Schiefe (standardisierter dritter Kumulant) und Kurtosis (standardisierter vierter Kumulant) gleichermaßen frei kontrolliert werden könnten. Diese Notwendigkeit wurde deutlich, als man versuchte, bekannte theoretische Modelle an beobachtete Daten anzupassen,der Asymmetrie zeigte.

Im Video unten sehen Sie die Analyse der Chi-Verteilung nach Pearson.

Image
Image

Verlauf

In seiner ursprünglichen Arbeit identifizierte Pearson zusätzlich zur Normalverteilung (die ursprünglich als Typ V bekannt war) vier Arten von Verteilungen (mit den Nummern I bis IV). Die Klassifizierung hängt davon ab, ob die Verteilungen über ein begrenztes Intervall, auf einer Halbachse oder auf der gesamten reellen Linie gestützt werden und ob sie potenziell schief oder notwendigerweise symmetrisch waren.

Zwei Auslassungen wurden in der zweiten Arbeit korrigiert: Er definierte die Typ-V-Verteilung neu (ursprünglich war es nur die Normalverteilung, aber jetzt mit inversem Gamma) und führte die Typ-VI-Verteilung ein. Zusammen behandeln die ersten beiden Artikel die fünf Haupttypen des Pearson-Systems (I, III, IV, V und VI). In der dritten Arbeit führte Pearson (1916) zusätzliche Subtypen ein.

Pearson-Verteilungsfunktionen
Pearson-Verteilungsfunktionen

Konzept verbessern

Rind erfand eine einfache Methode zur Visualisierung des Parameterraums des Pearson-Systems (oder der Verteilung von Kriterien), die er später übernahm. Heute verwenden viele Mathematiker und Statistiker diese Methode. Die Arten von Pearson-Verteilungen sind durch zwei Größen gekennzeichnet, die üblicherweise als β1 und β2 bezeichnet werden. Das erste ist das Quadrat der Asymmetrie. Das zweite ist die traditionelle Kurtosis oder das vierte standardisierte Moment: β2=γ2 + 3.

Moderne mathematische Methoden definieren Kurtosis γ2 als Kumulanten statt als Momente, also für eine NormaleVerteilung haben wir γ2=0 und β2=3. Hier lohnt es sich, dem historischen Präzedenzfall zu folgen und β2 zu verwenden. Das Diagramm rechts zeigt, welcher Typ eine bestimmte Pearson-Verteilung ist (gekennzeichnet durch den Punkt (β1, β2).

Pearson-Statistik
Pearson-Statistik

Viele der schiefen und/oder nicht-mesokurtischen Verteilungen, die wir heute kennen, waren in den frühen 1890er Jahren noch nicht bekannt. Was heute als Beta-Verteilung bekannt ist, wurde von Thomas Bayes als hinterer Parameter der Bernoulli-Verteilung in seiner Arbeit über die inverse Wahrscheinlichkeit von 1763 verwendet.

Die Beta-Verteilung gewann aufgrund ihrer Präsenz im Pearson-System an Bedeutung und war bis in die 1940er Jahre als Pearson-Typ-I-Verteilung bekannt. Die Verteilung vom Typ II ist ein Sonderfall von Typ I, wird aber normalerweise nicht mehr herausgegriffen.

Die Gamma-Verteilung stammt aus seiner eigenen Arbeit und war als Pearson-Typ-III-Normalverteilung bekannt, bevor sie in den 1930er und 1940er Jahren ihren heutigen Namen erhielt. Ein Artikel eines Wissenschaftlers aus dem Jahr 1895 präsentierte die Typ-IV-Verteilung, die die t-Verteilung von Student enthält, als Sonderfall, der einige Jahre vor William Seely Gossets späterer Verwendung lag. Seine Arbeit von 1901 präsentierte eine Verteilung mit inversem Gamma (Typ V) und Beta-Primzahlen (Typ VI).

Andere Meinung

Nach Ord entwickelte Pearson die Grundform der Gleichung (1) basierend auf der Formel für die Ableitung des Logarithmus der Normalverteilungsdichtefunktion (die eine lineare Division durch das Quadrat ergibtStruktur). Viele Spezialisten sind immer noch damit beschäftigt, die Hypothese über die Verteilung der Pearson-Kriterien zu testen. Und es beweist seine Wirksamkeit.

Alternative Pearson-Verteilung
Alternative Pearson-Verteilung

Wer war Karl Pearson

Karl Pearson war ein englischer Mathematiker und Biostatistiker. Ihm wird die Schaffung der Disziplin der mathematischen Statistik zugeschrieben. 1911 gründete er die weltweit erste Abteilung für Statistik am University College London und leistete bedeutende Beiträge auf den Gebieten der Biometrie und Meteorologie. Pearson war auch ein Anhänger des Sozialdarwinismus und der Eugenik. Er war Sir Francis G altons Schützling und Biograf.

Biometrie

Karl Pearson war maßgeblich an der Schaffung der Schule der Biometrie beteiligt, die eine konkurrierende Theorie zur Beschreibung der Evolution und Vererbung von Bevölkerungen um die Wende des 20. Jahrhunderts war. Seine Serie von achtzehn Artikeln „Mathematische Beiträge zur Evolutionstheorie“machte ihn zum Begründer der biometrischen Vererbungsschule. Tatsächlich widmete Pearson einen Großteil seiner Zeit zwischen 1893 und 1904 dem Entwicklung statistischer Methoden für die Biometrie. Zu diesen Methoden, die heute für statistische Analysen weit verbreitet sind, gehören der Chi-Quadrat-Test, die Standardabweichung, Korrelations- und Regressionskoeffizienten.

Korrelationskoeffizient nach Pearson
Korrelationskoeffizient nach Pearson

Die Frage der Vererbung

Das Vererbungsgesetz von Pearson besagt, dass das Keimplasma aus Elementen besteht, die sowohl von den Eltern als auch von entfernteren Vorfahren geerbt wurden, deren Anteil je nach verschiedenen Merkmalen variiert. Karl Pearson war ein Anhänger von G alton, und obwohl ihrWerke in mancher Hinsicht unterschiedlich waren, benutzte Pearson einen beträchtlichen Teil der statistischen Konzepte seines Lehrers, um eine biometrische Schule für die Vererbung zu formulieren, wie etwa das Gesetz der Regression.

Pearson-Verteilung
Pearson-Verteilung

Schulfunktionen

Die biometrische Schule konzentrierte sich im Gegensatz zu den Mendelianern nicht auf die Bereitstellung eines Mechanismus für die Vererbung, sondern auf die Bereitstellung einer mathematischen Beschreibung, die nicht kausaler Natur war. Während G alton eine diskontinuierliche Evolutionstheorie vorschlug, in der sich Arten in großen Sprüngen und nicht in kleinen Änderungen, die sich im Laufe der Zeit anhäuften, verändern würden, wies Pearson auf Mängel in diesem Argument hin und verwendete seine Ideen tatsächlich, um eine kontinuierliche Evolutionstheorie zu entwickeln. Die Mendelianer bevorzugten die diskontinuierliche Evolutionstheorie.

Während G alton sich hauptsächlich auf die Anwendung statistischer Methoden auf das Studium der Vererbung konzentrierte, erweiterten Pearson und sein Kollege Weldon ihre Argumentation in diesem Bereich, Variation, Korrelationen von natürlicher und sexueller Selektion.

Typische Verteilung
Typische Verteilung

Ein Blick auf die Evolution

Für Pearson war die Evolutionstheorie nicht dazu gedacht, den biologischen Mechanismus zu identifizieren, der die Vererbungsmuster erklärt, während der Mendelsche Ansatz das Gen zum Vererbungsmechanismus erklärte.

Pearson kritisierte Bateson und andere Biologen dafür, dass sie bei ihren Studien zur Evolution keine biometrischen Methoden anwenden. Er verurteilte Wissenschaftler, die sich nicht darauf konzentriertenstatistische Gültigkeit ihrer Theorien, die besagt:

"Bevor wir [jede Ursache fortschreitender Veränderung] als Faktor akzeptieren können, müssen wir nicht nur ihre Plausibilität zeigen, sondern, wenn möglich, ihre quantitative Fähigkeit demonstrieren."

Biologen sind "fast metaphysischen Spekulationen über die Ursachen der Vererbung" erlegen, die den Prozess des Sammelns experimenteller Daten ersetzt haben, was es Wissenschaftlern tatsächlich ermöglichen könnte, potenzielle Theorien einzugrenzen.

Statistische Brücke
Statistische Brücke

Naturgesetze

Für Pearson waren die Naturgesetze nützlich, um genaue Vorhersagen zu treffen und Trends in beobachteten Daten zusammenzufassen. Der Grund war die Erfahrung, „dass eine bestimmte Sequenz in der Vergangenheit passiert ist und sich wiederholt hat.“

Daher war die Identifizierung eines bestimmten genetischen Mechanismus kein würdiges Unterfangen für Biologen, die sich stattdessen auf mathematische Beschreibungen der empirischen Daten konzentrieren sollten. Dies führte teilweise zu einem erbitterten Streit zwischen Biometrikern und Mendelianern, einschließlich Bateson.

Nachdem letzterer eines von Pearsons Manuskripten abgelehnt hatte, das eine neue Theorie der Variation oder Homotypie der Nachkommen beschrieb, gründeten Pearson und Weldon 1902 die Firma Biometrika. Obwohl der biometrische Ansatz zur Vererbung schließlich seine Mendelsche Perspektive verlor, sind die damals entwickelten Methoden für das Studium der Biologie und Evolution heute von entscheidender Bedeutung.

Empfohlen: