Logo

Barbara Bredner


Statistische Beratung und Lösungen

Start » Tutorial » SPM » Von den Messwerten zum SPM

Von den Messwerten zum SPM

Unabhängig davon, welche Art von SPM verwendet werden soll (Ausgleichsgerade / Regressions-Modell, Gruppen-Vergleich / ANOVA-Modell, Kovarianz-Modell, logistisches SPM oder DoE-Modell), läuft der Weg von den Messwerten zum SPM und den Ergebnissen gleich ab.

Wie viele Messwerte braucht ein SPM?

Ganz einfache Antwort: Es kommt darauf an. Je komplexer ein Modell ist, d. h. je mehr Einflussgrößen und Wechselwirkungen es gibt, desto mehr Messwerte werden gebraucht, um ein SPM zu bestimmen. Als grobe Orientierung gilt, dass für jeden zu schätzenden Parameter β mindestens eine vollständige Beobachtung vorliegen muss. Dazu sollten noch einige (mindestens 3, besser 5 oder mehr) doppelte Beobachtungen vorhanden sein, um Aussagen über die Wichtigkeit von Einflussgrößen und die Reststreuung des SPMs treffen zu können.

Eine vollständige Beobachtung ist eine Messwertaufnahme von Y, für die alle Einstellungen aller einzelnen Einflussgrößen Xi vorliegt:

Y
z. B. Länge [mm]
X1
z. B. Zeit [sek]
X2
z. B. Art des Materials
...Xp
z. B. Druck [bar]
12,0360,32Material C...3,9

Beispiel Anzahl benötigte Messwerte

In einem SPM soll das Prozessergebnis Y durch fünf Einflussgrößen und eine Wechselwirkung zwischen der ersten und vierten Einflussgröße erklärt werden. In diesem Modell gibt es also insgesamt 6 Parameter: 5 Parameter für jede einzelne Einflussgröße und 1 Parameter für die Wechselwirkung. Zusammen mit 3 zusätzlichen doppelten Beobachtungen ergibt sich:

Beispiel: Mindest-Anzahl vollständige Beobachtungen ( 5 + 1 ) + 3 = 9

Schritt 1: Aufstellen des SPMs mit GMV

Im ersten Schritt der Modellbildung wird überlegt, welche Einflussgrößen Xi möglicherweise wichtig für die Erklärung der Zielgröße Y sind und ob es Wechselwirkungen zwischen diesen Einflussgrößen geben könnte. Das Aufstellen ist nichts anderes, als das Aufschreiben des Modells mit allen zu prüfenden Einflussgrößen.

Beispiel Aufstellen des SPMs

Bei der Herstellung von Kunststoff-Spritzgussteilen werden drei Einflussgrößen (Druck, Temperatur, Granulatsorte), alle Wechselwirkungen sowie ein quadratischer Effekt durch den Druck als möglicherweise wichtig für die Maßhaltigkeit eines bestimmten Bauteils angesehen. Damit ergibt sich als SPM ein lineares Kovarianzmodell:

Y =
+
+
+
+
+
+

Das ist immer noch ein lineares SPM, da die Parameter β linear in der Modellgleichung auftauchen! Die Mindestanzahl vollständiger Beobachtungen für dieses Modell ist: ( 3 + 3 + 1) + 3 = 10 (s. o.)

Schritt 2: Berechnung der Modellparameter (β)

Ein SPM wird durch die Werte des Parametervektors bzw. der Modellparameter β festgelegt. Für eine Ausgleichsgerade (d. h. ein Regressionsmodell mit einer variablen Einflussgröße) können β0 und β1 noch mit etwas Aufwand per Hand oder mit dem Taschenrechner oder mit Excel bestimmt werden.

Bei mehr als einer Einflussgröße wird das Berechnen per Hand / Taschenrechner / Excel sehr mühselig, weil dafür invertierte Matrizen der Normalengleichung bestimmt werden müssen. Zum Glück kann jede Statistik-Software solche SPMs auf Knopfdruck! Spätestens im nächsten Schritt (Prüfung der Modell-Parameter auf Signifikanz) ist eine Statistik-Software Gold wert (und muss nicht mal etwas kosten, s. R).

Schritt 3: Prüfung der Modellparameter (β) auf Signifikanz

Für jeden Modellbestandteil (Einflussgrößen, Wechselwirkungen, quadratische Effekte, usw.) wird im Modell geprüft, ob der Modellbestandteil einen wichtigen (signifikanten) Beitrag zur Erklärung der Zielgröße leistet oder nicht.

Verwendet werden hierfür statistische Testverfahren (vgl. Wie funktioniert ein statistischer Test?). Die Annahme H0 ist in jedem Modell, dass der geprüfte Modellbestandteil keinen Einfluss auf die Zielgröße hat:

H0
H1

Wird das Modell mit einem Taschenrechner oder Excel gerechnet, erfolgt die Prüfung der Hypothesen an Hand einer Teststatistik. Bei der Mehrheit der SPMs ist diese Teststatistik F-verteilt, so dass für jeden einzelnen Modellbestandteil ein kritischer Wert bestimmt werden muss, um die Testentscheidung zu treffen.

Eine Statistik-Software gibt direkt neben den Werten der Teststatistik den p-Wert für jeden Modellbestandteil aus. Der p-Wert ist in einem SPM die Wahrscheinlichkeit dafür, dass der geprüfte Modellbestandteil keinen Einfluss auf Y hat (Annahme bzw. Nullhypothese H0). D. h.: Wenn der p-Wert klein ist, wird die Annahme verworfen. Der Modellbestandteil hat also bei einem kleinen p-Wert einen signifikant wichtigen Effekt auf die Zielgröße Y.

Wieso wird etwas angenommen und dann verworfen?

Auf den ersten Blick ist es etwas widersinnig, erst ein Modell mit vermutlich wichtigen Modellbestandteile wie Einflussgrößen, Wechselwirkungen und anderen aufzustellen und im nächsten Schritt in der Nullhypothese H0 anzunehmen, dass der Modellbestandteil unwichtig zur Erklärung der Zielgröße ist. Seine eigenen Vermutungen widerlegen zu wollen, ist ein bisschen von hinten durch die Brust ins Auge.

Vergleichbar ist dieser Ansatz mit einem Gerichtsverfahren. Auch hier gibt es einen Angeklagten, der bis zum Beweis seiner Schuld unschuldig ist! Es gibt Beweise und Indizien dafür, dass der Angeklagte eine Straftat begangen hat, sonst gäbe es keine Anklage. (Das entspricht im SPM der "Anklage" eines Modellparameters, also der Aufnahme in das Modell.) Im nächsten Schritt werden die Beweise vorgetragen und auf Stichhaltigkeit geprüft. Die Unschuldsvermutung (Nullhypothese H0) wird erst dann verworfen, wenn ein Richter am Ende des Prozesses (der Modellbildung) das Urteil verkündet und den Angeklagten bei Vorliegen ausreichend vieler Beweise und Indizien (kleiner p-Wert) schuldig spricht.

Im ProzessIm SPM
AnklageAufnahme eines "verdächtigen" Modellbestandteils
BeweisaufnahmeMessdatenaufnahme
Prüfung, ob Angeklagter schuldig istPrüfung ob ein Modellbestandteil "schuld" daran ist, dass die Zielgrößenwerte Y so sind, wie sie aufgenommen wurden
UrteilTestentscheidung über Modellbestandteil

Dass in einem Modell die Prüfung der Modellbestandteile auf Signifikanz so ähnlich abläuft wie ein Gerichtsverfahren hat allerdings nichts damit zu tun, dass Statistiker so gerne Richter spielen. Dennoch ist das Prinzip das gleiche:

Wenn ein Modellbestandteil (Einflussgrößen, Wechselwirkungen, quadratische Effekte, usw.) keinen wichtigen Effekt auf Y hat, wird Y nicht durch ihn beeinflusst, d. h. Y streut zufällig um einen mittleren Wert und ist damit normalverteilt. Da dieses Verhalten unter der Annahme H0 bekannt ist, wird geprüft ob genügend Beweise dagegen vorliegen - und das erinnert an einen Gerichtsprozess.

Schritt 4: Modell-Validierung / Drum prüfe wer sich ewig bindet...

Die Modell-Validierung besteht aus zwei Schritten. Zum einen wird geprüft, wie viel das SPM von den Werten der Zielgröße erklärt (Erklärungsgrad, Anpassungsgüte). Andererseits wird geschaut, wie der nicht erklärte Rest des Modells aussieht.

Ein Modell ist dann valide, wenn es

  1. die Zielgröße gut erklärt
  2. der nicht-erklärte Rest bzw. Fehler ε klein ist und nur Zufallsstreuung enthält (in diesem Fall ist der Fehlerterm ε normalverteilt)

Je nach Art des SPMs gibt es verschiedene Maße für die Anpassungsgüte. Bei SPMs mit variabler Zielgröße wird häufig die Anpassungsgüte über die Kennzahl R2 angegeben. Für andere Arten von SPMs gibt es andere Kennzahlen, um den Erklärungsgrad eines Modells zu erfassen.

Ob die Fehler ε nur zufälliges Rest-Rauschen enthalten, wird grafisch (z. B. Residuendiagramme, Residual-Plot) und rechnerisch (Prüfung auf Normalverteilung) geprüft.

Erklärt das SPM das Prozessergebnis Y ausreichend gut und ist der Rest ε normalverteilt, ist das SPM validiert. Erst dann können aus den Ergebnissen des SPMs Maßnahmen abgeleitet oder ein Prozess umgestellt werden.

Schritt 5: Umsetzung der Ergebnisse in die Praxis

Nach einer erfolgreichen Modell-Validierung (und nur dann!) können Maßnahmen aus dem SPM abgeleitet werden.

Beispielsweise kann das Ergebnis eines SPMs sein, dass eine Einflussgröße für die Zielgröße unwichtig ist. Die daraus abgeleitete Maßnahme heißt dann: Einstellung der Einflussgröße auf einen ökonomisch sinnvollen Wert.

Es kann auch gegenläufige Zusammenhänge geben, wenn z. B. eine hohe Einstellung von X1 den Wert der Zielgröße Y erhöht und eine hohe Einstellung von X2 zu einem niedrigen Y-Wert führt. Soll ein mittlerer Wert von Y möglichst gut erreicht werden, kann durch die Kombination von Einstellungen X1 und X2 über das validierte Modell bereits im Vorfeld geprüft werden, wie dieses Ziel mit dem geringsten Einsatz von Ressourcen erreicht werden kann.

Für die Ableitung von Maßnahmen muss keine einzige Stellgröße im Prozess verändert werden, denn mit dem validierten SPM lässt sich schon im Vorfeld klären, wie welche Einstellung der Einflussgrößen X die Zielgröße Y verändern.

Drucker Druckansicht

© 2003 - 2017 Barbara Bredner - Statistische Beratung und Lösungen