Kriterien und Methoden zum Testen statistischer Hypothesen, Beispiele

Inhaltsverzeichnis:

Kriterien und Methoden zum Testen statistischer Hypothesen, Beispiele
Kriterien und Methoden zum Testen statistischer Hypothesen, Beispiele
Anonim

Das Testen von Hypothesen ist ein notwendiges Verfahren in der Statistik. Ein Hypothesentest wertet zwei sich gegenseitig ausschließende Aussagen aus, um zu bestimmen, welche Aussage am besten durch die Stichprobendaten gestützt wird. Wenn ein Befund als statistisch signifikant bezeichnet wird, ist er auf einen Hypothesentest zurückzuführen.

Verifizierungsmethoden

Methoden zum Testen statistischer Hypothesen sind Methoden der statistischen Analyse. Typischerweise werden zwei Sätze von Statistiken verglichen, oder ein abgetasteter Datensatz wird mit einem synthetischen Datensatz aus einem idealisierten Modell verglichen. Die Daten müssen so interpretiert werden, dass neue Bedeutungen hinzugefügt werden. Sie können sie interpretieren, indem Sie eine bestimmte Struktur des Endergebnisses annehmen und mit statistischen Methoden die Annahme bestätigen oder widerlegen. Die Annahme wird als Hypothese bezeichnet, und die zu diesem Zweck verwendeten statistischen Tests werden als statistische Hypothesen bezeichnet.

H0- und H1-Hypothesen

Es gibt zwei Hauptpunktedie Konzepte des statistischen Testens von Hypothesen - die sogenannte "Haupt- oder Nullhypothese" und "Alternativhypothese". Sie werden auch als Neyman-Pearson-Hypothesen bezeichnet. Die statistische Testannahme wird als Nullhypothese, Haupthypothese oder kurz H0 bezeichnet. Sie wird oft als Standardannahme oder Annahme, dass sich nichts geändert hat, bezeichnet. Eine Verletzung der Testannahme wird oft als erste Hypothese, Alternativhypothese oder H1 bezeichnet. H1 ist eine Kurzform für eine andere Hypothese, weil alles, was wir darüber wissen, ist, dass die H0-Daten verworfen werden können.

Nullhypothesentest
Nullhypothesentest

Bevor die Nullhypothese verworfen oder nicht verworfen wird, muss das Testergebnis interpretiert werden. Ein Vergleich gilt als statistisch signifikant, wenn die Beziehung zwischen den Datensätzen gemäß der Schwellenwahrscheinlichkeit – dem Signifikanzniveau – wahrscheinlich nicht die Umsetzung der Nullhypothese ist. Es gibt auch Gütekriterien für statistische Hypothesentests. Dies ist der Name des Hypothesenprüfkriteriums, das mit dem vermeintlichen Gesetz der unbekannten Verteilung verbunden ist. Dies ist ein numerisches Maß für die Diskrepanz zwischen der empirischen und der theoretischen Verteilung.

Verfahren und Kriterien zum Testen statistischer Hypothesen

Die gebräuchlichsten Methoden zur Auswahl von Hypothesen basieren entweder auf dem Akaike-Informationskriterium oder dem Bayes'schen Koeffizienten. Das Testen statistischer Hypothesen ist eine Schlüsseltechnik sowohl bei der Inferenz als auch bei der Bayes'schen Inferenz, obwohl die beiden Arten bemerkenswerte Unterschiede aufweisen. Statistische HypothesentestsDefinieren Sie ein Verfahren, das die Wahrscheinlichkeit einer irrtümlichen Entscheidung für eine falsche Standard- oder Nullhypothese kontrolliert. Das Verfahren richtet sich danach, wie wahrscheinlich es ist, dass es funktioniert. Diese Wahrscheinlichkeit einer Fehlentscheidung ist die Unwahrscheinlichkeit, dass die Nullhypothese wahr ist und keine bestimmte Alternativhypothese existiert. Der Test kann nicht zeigen, ob es wahr oder falsch ist.

Methoden zum Testen statistischer Hypothesen
Methoden zum Testen statistischer Hypothesen

Alternative Methoden der Entscheidungstheorie

Es gibt alternative Methoden der Entscheidungstheorie, bei denen die Null- und die erste Hypothese gleichberechtigter betrachtet werden. Andere Ansätze zur Entscheidungsfindung, wie die Bayes'sche Theorie, versuchen, die Folgen schlechter Entscheidungen über alle Möglichkeiten hinweg auszugleichen, anstatt sich auf eine einzige Nullhypothese zu konzentrieren. Eine Reihe anderer Ansätze zur Entscheidung, welche der Hypothesen richtig ist, basiert auf den Daten, welche von ihnen die gewünschten Eigenschaften haben. Das Testen von Hypothesen ist jedoch der vorherrschende Ansatz zur Datenanalyse in vielen Bereichen der Wissenschaft.

Testen der statistischen Hypothese

Wann immer sich eine Reihe von Ergebnissen von einer anderen Gruppe unterscheidet, muss man sich auf statistische Hypothesentests oder statistische Hypothesentests verlassen. Ihre Interpretation erfordert ein angemessenes Verständnis von p-Werten und kritischen Werten. Es ist auch wichtig zu verstehen, dass Tests unabhängig vom Signifikanzniveau immer noch Fehler enth alten können. Daher ist die Schlussfolgerung möglicherweise nicht korrekt.

Der Testprozess besteht ausmehrere Schritte:

  1. Für die Forschung wird eine erste Hypothese erstellt.
  2. Relevante Null- und Alternativhypothesen sind angegeben.
  3. Erklärt statistische Annahmen über die Stichprobe im Test.
  4. Feststellen, welcher Test angemessen ist.
  5. Wählen Sie das Signifikanzniveau und die Wahrscheinlichkeitsschwelle, unterhalb derer die Nullhypothese abgelehnt wird.
  6. Die Verteilung der Nullhypothesen-Teststatistik zeigt die möglichen Werte, bei denen die Nullhypothese verworfen wird.
  7. Berechnung läuft.
  8. Es wird entschieden, die Nullhypothese zugunsten einer Alternative zu verwerfen oder zu akzeptieren.

Es gibt eine Alternative, die einen p-Wert verwendet.

Beispiele für das Testen statistischer Hypothesen
Beispiele für das Testen statistischer Hypothesen

Signifikanztests

Reine Daten haben ohne Interpretation keinen praktischen Nutzen. Wenn es in der Statistik darum geht, Fragen zu Daten zu stellen und Ergebnisse zu interpretieren, werden statistische Methoden verwendet, um die Genauigkeit oder Wahrscheinlichkeit von Antworten sicherzustellen. Beim Testen statistischer Hypothesen wird diese Methodenklasse als statistisches Testen oder Signifikanztest bezeichnet. Der Begriff „Hypothese“erinnert an wissenschaftliche Methoden, bei denen Hypothesen und Theorien untersucht werden. In der Statistik führt ein Hypothesentest zu einer Menge bei gegebener Annahme. Es erlaubt Ihnen zu interpretieren, ob eine Annahme wahr ist oder ob ein Verstoß vorliegt.

Statistische Interpretation von Tests

Hypothesetestswerden verwendet, um zu bestimmen, welche Forschungsergebnisse für ein vorgegebenes Signifikanzniveau zur Ablehnung der Nullhypothese führen. Die Ergebnisse eines statistischen Hypothesentests müssen interpretiert werden, damit weiter daran gearbeitet werden kann. Es gibt zwei gängige Formen statistischer Hypothesentestkriterien. Dies sind p-Wert und kritische Werte. Je nach gewähltem Kriterium müssen die erh altenen Ergebnisse unterschiedlich interpretiert werden.

Was ist ein p-Wert

Output wird bei der Interpretation des p-Werts als statistisch signifikant beschrieben. Tatsächlich bedeutet dieser Indikator die Irrtumswahrscheinlichkeit, wenn die Nullhypothese abgelehnt wird. Mit anderen Worten, es kann verwendet werden, um einen Wert zu benennen, mit dem ein Testergebnis interpretiert oder quantifiziert werden kann, und um die Irrtumswahrscheinlichkeit beim Zurückweisen der Nullhypothese zu bestimmen. Sie können beispielsweise einen Normalitätstest an einer Stichprobe von Daten durchführen und feststellen, dass die Wahrscheinlichkeit von Ausreißern gering ist. Die Nullhypothese muss jedoch nicht verworfen werden. Ein statistischer Hypothesentest kann einen p-Wert zurückgeben. Dazu wird der Wert von p mit einem vorgegebenen Schwellenwert verglichen, der als Signifikanzniveau bezeichnet wird.

Statistische Prüfung von Nullhypothesen
Statistische Prüfung von Nullhypothesen

Signifikanzniveau

Das Signifikanzniveau wird oft mit dem griechischen Kleinbuchstaben "alpha" geschrieben. Der für Alpha verwendete allgemeine Wert beträgt 5 % oder 0,05. Ein kleinerer Alpha-Wert weist auf eine zuverlässigere Interpretation der Nullhypothese hin. Der p-Wert wird verglichen mitvorgewählter Alpha-Wert. Das Ergebnis ist statistisch signifikant, wenn der p-Wert kleiner als Alpha ist. Das Signifikanzniveau kann invertiert werden, indem es von Eins subtrahiert wird. Dies geschieht, um das Konfidenzniveau der Hypothese anhand der beobachteten Stichprobendaten zu bestimmen. Bei dieser Methode zum Testen statistischer Hypothesen ist der P-Wert probabilistisch. Das bedeutet, dass man bei der Interpretation des Ergebnisses eines statistischen Tests nicht weiß, was richtig oder falsch ist.

Testtheorie für statistische Hypothesen

Die Ablehnung der Nullhypothese bedeutet, dass es genügend statistische Beweise dafür gibt, dass sie wahrscheinlich erscheint. Andernfalls bedeutet dies, dass es nicht genügend Statistiken gibt, um es abzulehnen. Man kann sich statistische Tests im Sinne der Dichotomie des Verwerfens und Akzeptierens der Nullhypothese vorstellen. Die Gefahr des statistischen Testens der Nullhypothese besteht darin, dass sie, wenn sie akzeptiert wird, als wahr erscheinen könnte. Stattdessen wäre es richtiger zu sagen, dass die Nullhypothese nicht abgelehnt wird, weil es nicht genügend statistische Beweise gibt, um sie abzulehnen.

Statistische Hypothese, die Kriterien für die Güte der Anpassung testet
Statistische Hypothese, die Kriterien für die Güte der Anpassung testet

Dieser Moment verwirrt unerfahrene Komparsen oft. In einem solchen Fall ist es wichtig, sich daran zu erinnern, dass das Ergebnis probabilistisch ist und dass sogar das Akzeptieren der Nullhypothese immer noch eine kleine Fehlerwahrscheinlichkeit hat.

Wahre oder falsche Nullhypothese

Interpretation des Werts von p bedeutet nicht, dass Nulldie Hypothese ist wahr oder falsch. Dies bedeutet, dass auf der Grundlage der empirischen Daten und des gewählten statistischen Tests eine Entscheidung getroffen wurde, die Nullhypothese bei einem bestimmten Grad an statistischer Signifikanz abzulehnen oder nicht abzulehnen. Daher kann der p-Wert als die Wahrscheinlichkeit der Daten betrachtet werden, die unter einer vorbestimmten Annahme gegeben werden, die in die statistischen Tests eingebettet ist. Der p-Wert ist ein Maß dafür, wie wahrscheinlich es ist, dass die Datenprobe beobachtet wird, wenn die Nullhypothese wahr ist.

Interpretation kritischer Werte

Einige Tests geben p nicht zurück. Stattdessen können sie eine Liste kritischer Werte zurückgeben. Die Ergebnisse einer solchen Studie werden ähnlich interpretiert. Anstatt einen einzelnen p-Wert mit einem vorgegebenen Signifikanzniveau zu vergleichen, wird die Teststatistik mit einem kritischen Wert verglichen. Fällt sie geringer aus, bedeutet dies, dass die Nullhypothese nicht verworfen werden konnte. Wenn größer oder gleich, sollte die Nullhypothese verworfen werden. Die Bedeutung des statistischen Hypothesentestalgorithmus und die Interpretation seines Ergebnisses ist ähnlich wie beim p-Wert. Das gewählte Signifikanzniveau ist eine probabilistische Entscheidung, die Basistestannahme angesichts der Daten abzulehnen oder nicht abzulehnen.

Fehler in statistischen Tests

Die Interpretation eines statistischen Hypothesentests ist probabilistisch. Die Aufgabe beim Testen statistischer Hypothesen besteht nicht darin, eine wahre oder falsche Aussage zu finden. Testbeweise können fehlerhaft sein. Wenn das Alpha beispielsweise 5 % betrug, bedeutet dies zum größten Teil 1 von 20die Nullhypothese wird irrtümlich verworfen. Oder aufgrund des statistischen Rauschens in der Datenprobe nicht. An diesem Punkt kann ein kleiner p-Wert, bei dem die Nullhypothese abgelehnt werden soll, bedeuten, dass sie falsch ist oder dass ein Fehler gemacht wurde. Wenn diese Art von Fehler gemacht wird, wird das Ergebnis als falsch positiv bezeichnet. Und ein solcher Fehler ist ein Fehler erster Art beim Testen statistischer Hypothesen. Wenn andererseits der p-Wert groß genug ist, um eine Ablehnung der Nullhypothese zu bedeuten, kann dies bedeuten, dass sie wahr ist. Oder ist nicht korrekt, und ein unwahrscheinliches Ereignis ist aufgetreten, aufgrund dessen der Fehler gemacht wurde. Diese Art von Fehler wird falsch negativ genannt.

Statistische Prüfung von Nullhypothesen
Statistische Prüfung von Nullhypothesen

Fehlerwahrscheinlichkeit

Beim Testen statistischer Hypothesen besteht immer noch die Möglichkeit, diese Art von Fehlern zu machen. Falsche Daten oder falsche Schlussfolgerungen sind sehr wahrscheinlich. Idealerweise sollte ein Signifikanzniveau gewählt werden, das die Wahrscheinlichkeit eines dieser Fehler minimiert. Beispielsweise kann das statistische Testen von Nullhypothesen ein sehr niedriges Signifikanzniveau haben. Obwohl Signifikanzniveaus wie 0,05 und 0,01 in vielen Bereichen der Wissenschaft üblich sind, ist das am häufigsten verwendete Signifikanzniveau 310^-7 oder 0,0000003. Es wird oft als „5-Sigma“bezeichnet. Dies bedeutet, dass die Schlussfolgerung zufällig mit einer Wahrscheinlichkeit von 1 zu 3,5 Millionen unabhängigen Wiederholungen der Experimente war. Beispiele für das Testen statistischer Hypothesen sind oft mit solchen Fehlern behaftet. Das ist auch der Grund, warum es wichtig ist, unabhängige Ergebnisse zu haben. Bestätigung.

Beispiele für die Verwendung statistischer Überprüfung

Es gibt mehrere gängige Beispiele für Hypothesentests in der Praxis. Eines der beliebtesten ist das sogenannte „Tea Tasting“. Dr. Muriel Bristol, eine Kollegin des Biometrie-Gründers Robert Fisher, behauptete, mit Sicherheit sagen zu können, ob es zuerst in eine Tasse Tee oder Milch gegeben wurde. Fisher bot an, ihr acht Becher (vier von jeder Sorte) nach dem Zufallsprinzip zu geben. Die Teststatistik war einfach: Zählen der Erfolge bei der Auswahl eines Bechers. Die kritische Region war der einzige Erfolg von 4, möglicherweise basierend auf dem üblichen Wahrscheinlichkeitskriterium (< 5 %; 1 in 70 ≈ 1,4 %). Fisher argumentierte, dass eine Alternativhypothese nicht erforderlich sei. Die Dame identifizierte jede Tasse korrekt, was als statistisch signifikantes Ergebnis angesehen wurde. Diese Erfahrung führte zu Fishers Buch Statistical Methods for Researchers.

Angeklagtes Beispiel

Das statistische Verfahren ist vergleichbar mit einem Strafgericht, bei dem der Angeklagte bis zum Beweis seiner Schuld als unschuldig gilt. Der Staatsanw alt versucht, die Schuld des Angeklagten zu beweisen. Nur wenn ausreichende Beweise für eine Anklage vorliegen, kann der Angeklagte für schuldig befunden werden. Zu Beginn des Verfahrens stehen zwei Hypothesen: „Der Angeklagte ist nicht schuldig“und „Der Angeklagte ist schuldig“. Die Unschuldshypothese kann nur verworfen werden, wenn ein Irrtum sehr unwahrscheinlich ist, weil man keinen unschuldigen Angeklagten verurteilen will. Ein solcher Fehler wird als Typ-I-Fehler und sein Auftreten bezeichnetkaum kontrolliert. Als Folge dieses asymmetrischen Verh altens kommt es häufiger zu Irrtümern 2. Art, d.h. zum Freispruch des Täters.

Statistische Validierungsbeispiele
Statistische Validierungsbeispiele

Statistiken sind hilfreich bei der Analyse großer Datenmengen. Dies gilt gleichermaßen für das Testen von Hypothesen, die die Schlussfolgerungen begründen können, auch wenn keine wissenschaftliche Theorie existiert. Im Beispiel der Teeverkostung war es "offensichtlich", dass es keinen Unterschied zwischen dem Eingießen von Milch in Tee oder dem Eingießen von Tee in Milch gab.

Echte praktische Anwendung von Hypothesentests beinh altet:

  • Testen, ob Männer mehr Alpträume haben als Frauen;
  • Dokumentenzuordnung;
  • Beurteilung des Einflusses des Vollmonds auf das Verh alten;
  • Bestimmung der Reichweite, in der eine Fledermaus ein Insekt mit einem Echo erkennen kann;
  • Wahl der besten Mittel, um mit dem Rauchen aufzuhören;
  • Überprüfen, ob Autoaufkleber das Verh alten des Autobesitzers widerspiegeln.

Statistische Hypothesentests spielen eine wichtige Rolle in der Statistik im Allgemeinen und in der statistischen Inferenz. Werttests werden als Ersatz für den traditionellen Vergleich von vorhergesagtem Wert und experimentellem Ergebnis im Kern der wissenschaftlichen Methode verwendet. Wenn eine Theorie nur das Vorzeichen eines Zusammenhangs vorhersagen kann, können gerichtete Hypothesentests so konfiguriert werden, dass nur ein statistisch signifikantes Ergebnis die Theorie stützt. Diese Form der Evaluationstheorie ist die starrsteKritik am Einsatz von Hypothesentests.

Empfohlen: