Grundbegriffe der mathematischen Statistik. Anwendung der mathematischen Statistik

Inhaltsverzeichnis:

Grundbegriffe der mathematischen Statistik. Anwendung der mathematischen Statistik
Grundbegriffe der mathematischen Statistik. Anwendung der mathematischen Statistik
Anonim

Mathematische Statistik ist eine Methode, die es Ihnen ermöglicht, angesichts unsicherer Bedingungen fundierte Entscheidungen zu treffen. Das Studium von Methoden zum Sammeln und Systematisieren von Daten, das Verarbeiten der Endergebnisse von Experimenten und Experimenten mit Massenzufälligkeit und das Entdecken von Mustern ist das, was dieser Zweig der Mathematik tut. Betrachten Sie die Grundkonzepte der mathematischen Statistik.

Unterschied mit Wahrscheinlichkeitstheorie

Methoden der mathematischen Statistik haben eine enge Überschneidung mit der Wahrscheinlichkeitstheorie. Beide Zweige der Mathematik befassen sich mit der Untersuchung zahlreicher Zufallsphänomene. Die beiden Disziplinen sind durch Grenzwertsätze verbunden. Es gibt jedoch einen großen Unterschied zwischen diesen Wissenschaften. Wenn die Wahrscheinlichkeitstheorie die Eigenschaften eines Prozesses in der realen Welt auf der Grundlage eines mathematischen Modells bestimmt, dann tut die mathematische Statistik das Gegenteil – sie setzt die Eigenschaften des Modells umbasierend auf beobachteten Informationen.

Wahrscheinlichkeitstheorie und Mat. Statistiken
Wahrscheinlichkeitstheorie und Mat. Statistiken

Schritte

Die Anwendung der mathematischen Statistik kann nur in Bezug auf zufällige Ereignisse oder Prozesse durchgeführt werden, oder vielmehr auf Daten, die aus deren Beobachtung gewonnen werden. Und das geschieht in mehreren Stufen. Zunächst werden die Daten von Experimenten und Experimenten einer bestimmten Verarbeitung unterzogen. Sie sind aus Gründen der Klarheit und einfachen Analyse geordnet. Dann erfolgt eine genaue oder ungefähre Schätzung der erforderlichen Parameter des beobachteten Zufallsprozesses. Sie können sein:

  • Einschätzung der Wahrscheinlichkeit eines Ereignisses (seine Wahrscheinlichkeit ist zunächst unbekannt);
  • Untersuchung des Verh altens einer unbestimmten Verteilungsfunktion;
  • Erwartungsschätzung;
  • Varianzschätzung
  • etc.
Grundlagen der Mat. Statistiken
Grundlagen der Mat. Statistiken

Die dritte Stufe ist die Überprüfung der eventuell vor der Analyse aufgestellten Hypothesen, d. h. die Beantwortung der Frage, wie die Ergebnisse der Experimente mit den theoretischen Berechnungen übereinstimmen. Tatsächlich ist dies die Hauptstufe der mathematischen Statistik. Ein Beispiel wäre zu prüfen, ob das Verh alten eines beobachteten zufälligen Prozesses innerhalb der Normalverteilung liegt.

Bevölkerung

Die Grundkonzepte der mathematischen Statistik umfassen Grundgesamtheiten und Stichprobenpopulationen. Diese Disziplin befasst sich mit der Untersuchung einer Reihe bestimmter Objekte in Bezug auf eine Eigenschaft. Ein Beispiel ist die Arbeit eines Taxifahrers. Betrachten Sie diese Zufallsvariablen:

  • Ladung oder Kundenzahl: pro Tag, vor dem Mittagessen, nach dem Mittagessen, …;
  • durchschnittliche Reisezeit;
  • Anzahl eingehender Bewerbungen oder deren Zuordnung zu Stadtteilen und vieles mehr.

Es ist auch erwähnenswert, dass es möglich ist, eine Reihe ähnlicher zufälliger Prozesse zu untersuchen, die auch eine beobachtbare Zufallsvariable darstellen.

Bevölkerung
Bevölkerung

In den Methoden der mathematischen Statistik wird also die Gesamtheit der untersuchten Objekte oder die Ergebnisse verschiedener Beobachtungen, die unter denselben Bedingungen an einem bestimmten Objekt durchgeführt werden, als allgemeine Bevölkerung bezeichnet. Mit anderen Worten, strenger mathematisch, handelt es sich um eine Zufallsvariable, die im Raum elementarer Ereignisse definiert ist, mit einer darin bezeichneten Klasse von Teilmengen, deren Elemente eine bekannte Wahrscheinlichkeit haben.

Stichprobe

Es gibt Fälle, in denen es aus irgendeinem Grund (Kosten, Zeit) unmöglich oder unpraktisch ist, eine kontinuierliche Studie durchzuführen, um jedes Objekt zu untersuchen. Beispielsweise ist es eine zweifelhafte Entscheidung, jedes Glas versiegelter Marmelade zu öffnen, um seine Qualität zu überprüfen, und der Versuch, die Flugbahn jedes Luftmoleküls in einem Kubikmeter abzuschätzen, ist unmöglich. In solchen Fällen wird die Methode der selektiven Beobachtung angewendet: Aus der Allgemeinbevölkerung wird eine bestimmte Anzahl von Objekten (meist zufällig) ausgewählt und ihrer Analyse unterzogen.

Probe vom GeneralAggregate
Probe vom GeneralAggregate

Diese Konzepte mögen auf den ersten Blick kompliziert erscheinen. Um das Thema vollständig zu verstehen, müssen Sie daher das Lehrbuch von V. E. Gmurman "Probability Theory and Mathematical Statistics" studieren. Somit ist ein Stichprobensatz oder eine Probe eine Reihe von Objekten, die zufällig aus dem allgemeinen Satz ausgewählt werden. Streng mathematisch handelt es sich um eine Folge unabhängiger, gleichverteilter Zufallsvariablen, deren Verteilung jeweils mit der für die allgemeine Zufallsvariable angegebenen übereinstimmt.

Grundlegende Konzepte

Lassen Sie uns kurz einige andere Grundkonzepte der mathematischen Statistik betrachten. Die Anzahl der Objekte in der Grundgesamtheit oder Stichprobe wird als Volumen bezeichnet. Die Probenwerte, die während des Experiments gewonnen werden, werden als Probenrealisierung bezeichnet. Damit eine Schätzung der Allgemeinbevölkerung anhand einer Stichprobe zuverlässig ist, ist es wichtig, eine sogenannte repräsentative oder repräsentative Stichprobe zu haben. Das bedeutet, dass die Stichprobe die Grundgesamtheit vollständig repräsentieren muss. Dies kann nur erreicht werden, wenn alle Elemente der Grundgesamtheit mit gleicher Wahrscheinlichkeit in der Stichprobe enth alten sind.

Grundlegendes Konzept
Grundlegendes Konzept

Muster unterscheiden zwischen Retoure und Nichtretoure. Im ersten Fall wird das wiederholte Element im Inh alt des Samples an die allgemeine Menge zurückgegeben, im zweiten Fall nicht. Üblicherweise wird in der Praxis eine ersatzlose Probenahme verwendet. Zu beachten ist auch, dass die Größe der Allgemeinbevölkerung die Stichprobengröße immer deutlich übersteigt. Existierenviele Optionen für den Bemusterungsprozess:

  • einfach - Elemente werden nach dem Zufallsprinzip einzeln ausgewählt;
  • typisiert - die allgemeine Bevölkerung wird in Typen eingeteilt und aus jedem wird eine Auswahl getroffen; ein Beispiel ist eine Einwohnerbefragung: Männer und Frauen getrennt;
  • mechanisch - zum Beispiel jedes 10. Element auswählen;
  • seriell - Auswahl erfolgt in Reihe von Elementen.

Statistische Verteilung

Gmurman zufolge sind Wahrscheinlichkeitstheorie und mathematische Statistik äußerst wichtige Disziplinen in der Welt der Wissenschaft, insbesondere in ihrem praktischen Teil. Betrachten Sie die statistische Verteilung der Stichprobe.

Angenommen, wir haben eine Gruppe von Schülern, die in Mathematik getestet wurden. Als Ergebnis haben wir eine Reihe von Schätzungen: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 – das ist unser primäres statistisches Material.

Zunächst müssen wir es sortieren oder eine Rangfolgeoperation durchführen: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - und so eine Variationsreihe erh alten. Die Anzahl der Wiederholungen der einzelnen Tests wird als Bewertungshäufigkeit bezeichnet, und ihr Verhältnis zur Stichprobengröße wird als relative Häufigkeit bezeichnet. Lassen Sie uns eine Tabelle der statistischen Verteilung der Stichprobe oder einfach eine statistische Reihe erstellen:

ai 1 2 3 4 5
pi 1 1 2 4 3

oder

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Lassen Sie uns eine Zufallsvariable haben, mit der wir eine Reihe von Experimenten durchführen und sehen, welchen Wert diese Variable annimmt. Angenommen, sie hat den Wert a1 - m1 mal genommen; a2 - m2 mal usw. Die Größe dieser Stichprobe ist m1 + … + mk=m. Die Menge ai, wobei i von 1 bis k variiert, ist eine statistische Reihe.

Intervallverteilung

Im Buch von VE Gmurman "Probability Theory and Mathematical Statistics" wird auch eine intervallstatistische Reihe vorgestellt. Seine Zusammenstellung ist möglich, wenn der Wert des untersuchten Merkmals in einem bestimmten Intervall kontinuierlich ist und die Anzahl der Werte groß ist. Stellen Sie sich eine Gruppe von Schülern vor, oder besser gesagt, ihre Größe: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - insgesamt 30 Studenten. Offensichtlich ist die Körpergröße eines Menschen ein kontinuierlicher Wert. Wir müssen den Intervallschritt definieren. Dazu wird die Sturges-Formel verwendet.

h= max - min = 190 - 156 = 33 = 5, 59
1+log2m 1+log230 5, 9

Daher kann der Wert 6 als Größe des Intervalls genommen werden, wobei noch zu sagen ist, dass der Wert 1+log2m die Formel für istBestimmen der Anzahl der Intervalle (natürlich mit Rundung). Somit werden gemäß den Formeln 6 Intervalle erh alten, von denen jedes eine Größe von 6 hat. Und der erste Wert des Anfangsintervalls ist die Zahl, die durch die Formel bestimmt wird: min - h / 2=156 - 6/2=153. Lassen Sie uns eine Tabelle erstellen, die Intervalle und die Anzahl der Schüler enthält, deren Wachstum in ein bestimmtes Intervall fiel.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Das ist natürlich noch nicht alles, denn in der mathematischen Statistik gibt es noch viel mehr Formeln. Wir haben nur einige grundlegende Konzepte berücksichtigt.

Verteilplan

Verteilungsdiagramme
Verteilungsdiagramme

Zu den Grundbegriffen der mathematischen Statistik gehört auch eine grafische Darstellung der Verteilung, die sich durch Übersichtlichkeit auszeichnet. Es gibt zwei Arten von Diagrammen: Polygon und Histogramm. Die erste wird für eine diskrete statistische Reihe verwendet. Und für die kontinuierliche Verteilung jeweils die zweite.

Empfohlen: