Beim Testen von Hypothesen, geht es darum aufgrund einer Stichprobe zu entscheiden, ob eine Behautpung (Hypothese) angenommen oder abgelehnt wird.

Beispiel Münzwurf

Eine Münze wird n-mal geworfen.
Die Hypothese lautet, dass Kopf zu werfen eine 50%ige Wahrscheinlichkeit hat (sonst ist die Münze manipuliert und auf einer Seite schwerer, also „gezinkt“).

Parameter

Wie überprüft man nun die Hypothese und wie wirken sich Parameter und Werte auf die Schlussfolgerung/Beurteilung aus, ob die Hypothese stimmt oder nicht?

  • Je kleiner n ist , umso schwerer ist die Beurteilung
    n=1: Beurteilung mit 50% unmöglich, da ja der Anteil nur 0% oder 100% sein kann (Kopf geworfen = 100%, nicht Kopf (=Zahl) geworfen = 0%).
    Wirft man 1000 mal, kann man eher eine Aussage machen!
  • Ist der %-Anteil genau so, wie die Hypothesenwahrscheinlichkeit, kann man die Hypothese sicher nicht ablehnen!
    Wirft man 1000x und es kommt 500x Kopf (=50%), so kann man sicher nicht sagen, dass die Münze fehlerhaft/gezinkt ist.
  • Ist der %-Anteil von der Wahrscheinlichkeit möglichst weit entfernt, so wird man die Hypothese meistens verwerfen (außer das n ist zu klein – siehe oben)

    Wirft man bei 1000 Würfen NIE Kopf (oder IMMER), so wird man die Hypothese verwerfen (man wir die Münze als gezinkt ansehen)

    Beim Würfeln wäre das z.B. der Fall, wenn bei 10x Würfeln IMMER ein 6er kommen würde (gar kein 6er wäre aber noch eher OK, da die Hypothese 1/6 wäre und die Verteilung somit linkslastig)

  • Das Problem ist, wenn Ergebnisse zwischen den Extremen liegen, was ja normal ist.

    Dazu einige Überlegungen zum Reflektieren:

    Wenn bei n=1000 Kopf 400x kommt, ist die Münze dann gezinkt, oder ist das einfach Zufall?
    Wo ziehe ich die Grenze? Bei 400? bei 450? oder erst bei 300?

    Wie kritisch teste ich? Bin ich vorsichtig und behaupte erst bei 300x Kopf dass die Münze gezinkt ist, oder bin ich misstrauisch und behaupte das schon bei 450x?
    Kann ich das überhaupt mathematisch festlegen?

    Kann es sein, dass die Münze gezinkt ist und man es trotzdem zufällig bei einer Stichprobe nicht erkennt?
    Angenommen Kopf hat die Wahrscheinlichkeit 35% und bei 10x Werfen kommt trotzdem 5x Kopf und 5x Zahl – möglich ist es ja.

Man erkennt, dass es gar nicht immer so einfach ist, Hypothesen abzulehnen oder anzunehmen – jeder ist schon einmal überrascht worden, weil er sich auf seine persönliche Einschätzung verlassen hat:

  • „der hat mir schon öfters meinen Stift stibitzt, der war es sicher diesmal auch“
  • „ich werde nie was gewinnen, hab ich ja noch nie“
  • „der hat noch nie gelogen, ich glaub ihm alles“
  • „mir ist noch nie was dabei passiert, wieso jetzt“
  • „nur einer von 100 wird krank, wieso sollte ich vorsichtig sein?“

Zusammenfassend kann man sagen, dass es Parameter gibt die logisch sind, wie zum Beispiel n und p.
Aber dann kommen noch Parameter wie „Misstrauen“, „Zufall“, „Irrtum“, „Einschätzung“.
Einige dieser Parameter haben keine mathematische Berechtigung und sind subjektiv bzw. widersprechen sich (z.B. etwas ist unwahrscheinlich und daher kann es mir nie passieren“) – andere können und müssen sogar in das Testen von Hypothesen einfließen.

Der mathematische Parameter, der den Grad des Misstrauens/Vertrauens, der Sicherheit/Unsicherheit beim Ablehnen oder Verwerfen von Hypothesen misst, ist die sogenannte Irrtumswahrscheinlichkeit.

Diese sagt aus, mit welcher Wahrscheinlichkeit ich mich irre, wenn ich eine Hypothese verwerfe – oder ich die Hypothese nicht verwerfe.

Bei Hypothesentesten gilt daher:
Bei meiner Entscheidung (Hypothese akzeptieren oder ablehen) kann ich mir nie 100% sicher sein richtig entschieden zu haben, aber ich kann mir zumindest zu 95% (oder 99%) sicher sein!