Logo

Barbara Bredner


Statistische Beratung und Lösungen

Start » Tutorial » Grundlagen » Das wichtigste Kriterium: GMV

Das wichtigste Kriterium in der Statistik: GMV

Unabhängig davon, welches statistische Verfahren Sie verwenden wollen oder wie die Ergebnisse aus einer Analyse lauten, das wichtigste und entscheidende Kriterium in der Statistik ist
GMV, der Gesunde MenschenVerstand.

Nur dann, wenn Ergebnisse logisch erklärbar sind, können sie auch in der Praxis verwendet werden. Ein Ergebnis wie "rote Autos fahren schneller als blaue Autos" ist auf den ersten Blick völliger Blödsinn. Wenn Sie so ein scheinbar nicht-erklärbares Ergebnis in einer Auswertung sehen, fragen Sie nach dem Warum. Es muss für ein solches Ergebnis eine Erklärung geben (immer vorausgesetzt, da hat niemand einfach Daten gefälscht).

Wieso rote Autos schneller fahren als blaue Autos

Der GMV sagt, dass die Farbe eines Autos keinen signifikanten Effekt auf die Geschwindigkeit haben kann. Wieso sind dann rote Autos trotzdem schneller? Die Antwort darauf lässt sich finden, wenn man etwas genauer hinschaut: Getestet wurden "rote Autos" (Ferrari Testarossa) gegen "blaue Autos" (Citroën Enten / 2CV). Natürlich ist ein Testarossa deutlich schneller als eine Ente!

Jedes Ergebnis wird immer davon beeinflusst, was wann womit und von wem gemessen wurde. Daher ist es notwendig, genau diese Informationen bei der Aufnahme der Messdaten aufzuschreiben und bei der Auswertung zu berücksichtigen. Die meisten seltsamen oder unlogischen Ergebnisse lassen sich durch den konsequenten und gezielten Einsatz von GMV erklären.

Die Enigma-Maschine

Es gibt so viele verschiedene Verfahren und Möglichkeiten, dass sich viele Anwender eine Art "Enigma-Maschine" wünschen, in die die Messdaten hineingeschoben werden und aus der die fertige Analyse herauspurzelt. Einige Software-Anbieter behaupten, genau so etwas liefern zu können. Das ist schon deshalb falsch, weil keine Maschine oder Software über GMV verfügt. Dies ist und bleibt Expertenwissen!

Ein einfaches Beispiel für ein Merkmal, das keine Maschine ohne weitere Angaben durch den Anwender korrekt auswerten kann, ist eine ja/nein-Angaben mit ja=1, vielleicht=2 und nein=3.

Für eine Software sind Zahlen numerische Angaben, mit denen Kennzahlen berechnet werden können. Der Mittelwert des Merkmals könnte zum Beispiel 1,45 sein. Diese Angabe ist unsinnig, weil das Merkmal gar keine echten Zahlen enthält, sondern Kategorien in kodierter Form (Kategorie "ja" hat Kodierung "1", Kategorie "vielleicht" hat Kodierung "2", usw.)

Die Maschine kann natürlich den Mittelwert berechnen, aber erst der GMV des Anwenders stellt fest, dass das Unsinn ist.

Drucker Druckansicht

© 2003 - 2016 Barbara Bredner - Statistische Beratung und Lösungen