Unabhängig davon, welche Art von SPM verwendet werden soll (Ausgleichsgerade / Regressions-Modell, Gruppen-Vergleich / ANOVA-Modell, Kovarianz-Modell, logistisches SPM oder DoE-Modell), läuft der Weg von den Messwerten zum SPM und den Ergebnissen gleich ab.
Ganz einfache Antwort: Es kommt darauf an. Je komplexer ein Modell ist, d. h. je mehr Einflussgrößen und Wechselwirkungen es gibt, desto mehr Messwerte werden gebraucht, um ein SPM zu bestimmen. Als grobe Orientierung gilt, dass für jeden zu schätzenden Parameter β mindestens eine vollständige Beobachtung vorliegen muss. Dazu sollten noch einige (mindestens 3, besser 5 oder mehr) doppelte Beobachtungen vorhanden sein, um Aussagen über die Wichtigkeit von Einflussgrößen und die Reststreuung des SPMs treffen zu können.
Eine vollständige Beobachtung ist eine Messwertaufnahme von Y, für die alle Einstellungen aller einzelnen Einflussgrößen Xi vorliegt:
| Y z. B. Länge [mm] | X1 z. B. Zeit [sek] | X2 z. B. Art des Materials | ... | Xp z. B. Druck [bar] |
| 12,036 | 0,32 | Material C | ... | 3,9 |
In einem SPM soll das Prozessergebnis Y durch fünf Einflussgrößen und eine Wechselwirkung zwischen der ersten und vierten Einflussgröße erklärt werden. In diesem Modell gibt es also insgesamt 6 Parameter: 5 Parameter für jede einzelne Einflussgröße und 1 Parameter für die Wechselwirkung. Zusammen mit 3 zusätzlichen doppelten Beobachtungen ergibt sich:
| Beispiel: Mindest-Anzahl vollständige Beobachtungen | ( 5 + 1 ) + 3 = 9 |
Im ersten Schritt der Modellbildung wird überlegt, welche Einflussgrößen Xi möglicherweise wichtig für die Erklärung der Zielgröße Y sind und ob es Wechselwirkungen zwischen diesen Einflussgrößen geben könnte. Das Aufstellen ist nichts anderes, als das Aufschreiben des Modells mit allen zu prüfenden Einflussgrößen.
Bei der Herstellung von Kunststoff-Spritzgussteilen werden drei Einflussgrößen (Druck, Temperatur, Granulatsorte), alle Wechselwirkungen sowie ein quadratischer Effekt durch den Druck als möglicherweise wichtig für die Maßhaltigkeit eines bestimmten Bauteils angesehen. Damit ergibt sich als SPM ein lineares Kovarianzmodell:
| Y = | β0 | |
| + | β1*Druck + β2*Temperatur + β3*Granulatsorte | |
| + | β12*(Druck*Temperatur) | |
| + | β13*(Druck*Granulatsorte) | |
| + | β23*(Temperatur*Granulatsorte) | |
| + | β4*(Druck2) | |
| + | ε |
Das ist immer noch ein lineares SPM, da die Parameter β linear in der Modellgleichung auftauchen! Die Mindestanzahl vollständiger Beobachtungen für dieses Modell ist: ( 3 + 3 + 1) + 3 = 10 (s. o.)
Ein SPM wird durch die Werte des Parametervektors bzw. der Modellparameter β festgelegt. Für eine Ausgleichsgerade (d. h. ein Regressionsmodell mit einer variablen Einflussgröße) können β0 und β1 noch mit etwas Aufwand per Hand oder mit dem Taschenrechner oder mit Excel bestimmt werden.
Bei mehr als einer Einflussgröße wird das Berechnen per Hand / Taschenrechner / Excel sehr mühselig, weil dafür invertierte Matrizen der Normalengleichung bestimmt werden müssen. Zum Glück kann jede Statistik-Software solche SPMs auf Knopfdruck! Spätestens im nächsten Schritt (Prüfung der Modell-Parameter auf Signifikanz) ist eine Statistik-Software Gold wert (und muss nicht mal etwas kosten, s. R).
Für jeden Modellbestandteil (Einflussgrößen, Wechselwirkungen, quadratische Effekte, usw.) wird im Modell geprüft, ob der Modellbestandteil einen wichtigen (signifikanten) Beitrag zur Erklärung der Zielgröße leistet oder nicht.
Verwendet werden hierfür statistische Testverfahren (vgl. Wie funktioniert ein statistischer Test?). Die Annahme H0 ist in jedem Modell, dass der geprüfte Modellbestandteil keinen Einfluss auf die Zielgröße hat:
| H0 | Modellbestandteil hat keinen (wichtigen) Einfluss auf Y |
| H1 | Es gibt einen wichtigen Einfluss auf Y durch den Modellbestandteil |
Wird das Modell mit einem Taschenrechner oder Excel gerechnet, erfolgt die Prüfung der Hypothesen an Hand einer Teststatistik. Bei der Mehrheit der SPMs ist diese Teststatistik F-verteilt, so dass für jeden einzelnen Modellbestandteil ein kritischer Wert bestimmt werden muss, um die Testentscheidung zu treffen.
Eine Statistik-Software gibt direkt neben den Werten der Teststatistik den p-Wert für jeden Modellbestandteil aus. Der p-Wert ist in einem SPM die Wahrscheinlichkeit dafür, dass der geprüfte Modellbestandteil keinen Einfluss auf Y hat (Annahme bzw. Nullhypothese H0). D. h.: Wenn der p-Wert klein ist, wird die Annahme verworfen. Der Modellbestandteil hat also bei einem kleinen p-Wert einen signifikant wichtigen Effekt auf die Zielgröße Y.
Auf den ersten Blick ist es etwas widersinnig, erst ein Modell mit vermutlich wichtigen Modellbestandteile wie Einflussgrößen, Wechselwirkungen und anderen aufzustellen und im nächsten Schritt in der Nullhypothese H0 anzunehmen, dass der Modellbestandteil unwichtig zur Erklärung der Zielgröße ist. Seine eigenen Vermutungen widerlegen zu wollen, ist ein bisschen von hinten durch die Brust ins Auge.
Vergleichbar ist dieser Ansatz mit einem Gerichtsverfahren. Auch hier gibt es einen Angeklagten, der bis zum Beweis seiner Schuld unschuldig ist! Es gibt Beweise und Indizien dafür, dass der Angeklagte eine Straftat begangen hat, sonst gäbe es keine Anklage. (Das entspricht im SPM der "Anklage" eines Modellparameters, also der Aufnahme in das Modell.) Im nächsten Schritt werden die Beweise vorgetragen und auf Stichhaltigkeit geprüft. Die Unschuldsvermutung (Nullhypothese H0) wird erst dann verworfen, wenn ein Richter am Ende des Prozesses (der Modellbildung) das Urteil verkündet und den Angeklagten bei Vorliegen ausreichend vieler Beweise und Indizien (kleiner p-Wert) schuldig spricht.
| Im Prozess | Im SPM |
|---|---|
| Anklage | Aufnahme eines "verdächtigen" Modellbestandteils |
| Beweisaufnahme | Messdatenaufnahme |
| Prüfung, ob Angeklagter schuldig ist | Prüfung ob ein Modellbestandteil "schuld" daran ist, dass die Zielgrößenwerte Y so sind, wie sie aufgenommen wurden |
| Urteil | Testentscheidung über Modellbestandteil |
Dass in einem Modell die Prüfung der Modellbestandteile auf Signifikanz so ähnlich abläuft wie ein Gerichtsverfahren hat allerdings nichts damit zu tun, dass Statistiker so gerne Richter spielen. Dennoch ist das Prinzip das gleiche:
Wenn ein Modellbestandteil (Einflussgrößen, Wechselwirkungen, quadratische Effekte, usw.) keinen wichtigen Effekt auf Y hat, wird Y nicht durch ihn beeinflusst, d. h. Y streut zufällig um einen mittleren Wert und ist damit normalverteilt. Da dieses Verhalten unter der Annahme H0 bekannt ist, wird geprüft ob genügend Beweise dagegen vorliegen - und das erinnert an einen Gerichtsprozess.
Die Modell-Validierung besteht aus zwei Schritten. Zum einen wird geprüft, wie viel das SPM von den Werten der Zielgröße erklärt (Erklärungsgrad, Anpassungsgüte). Andererseits wird geschaut, wie der nicht erklärte Rest des Modells aussieht.
Ein Modell ist dann valide, wenn es
Je nach Art des SPMs gibt es verschiedene Maße für die Anpassungsgüte. Bei SPMs mit variabler Zielgröße wird häufig die Anpassungsgüte über die Kennzahl R2 angegeben. Für andere Arten von SPMs gibt es andere Kennzahlen, um den Erklärungsgrad eines Modells zu erfassen.
Ob die Fehler ε nur zufälliges Rest-Rauschen enthalten, wird grafisch (z. B. Residuendiagramme, Residual-Plot) und rechnerisch (Prüfung auf Normalverteilung) geprüft.
Erklärt das SPM das Prozessergebnis Y ausreichend gut und ist der Rest ε normalverteilt, ist das SPM validiert. Erst dann können aus den Ergebnissen des SPMs Maßnahmen abgeleitet oder ein Prozess umgestellt werden.
Nach einer erfolgreichen Modell-Validierung (und nur dann!) können Maßnahmen aus dem SPM abgeleitet werden.
Beispielsweise kann das Ergebnis eines SPMs sein, dass eine Einflussgröße für die Zielgröße unwichtig ist. Die daraus abgeleitete Maßnahme heißt dann: Einstellung der Einflussgröße auf einen ökonomisch sinnvollen Wert.
Es kann auch gegenläufige Zusammenhänge geben, wenn z. B. eine hohe Einstellung von X1 den Wert der Zielgröße Y erhöht und eine hohe Einstellung von X2 zu einem niedrigen Y-Wert führt. Soll ein mittlerer Wert von Y möglichst gut erreicht werden, kann durch die Kombination von Einstellungen X1 und X2 über das validierte Modell bereits im Vorfeld geprüft werden, wie dieses Ziel mit dem geringsten Einsatz von Ressourcen erreicht werden kann.
Für die Ableitung von Maßnahmen muss keine einzige Stellgröße im Prozess verändert werden, denn mit dem validierten SPM lässt sich schon im Vorfeld klären, wie welche Einstellung der Einflussgrößen X die Zielgröße Y verändern.
© 2003 - 2012 Barbara Bredner - Statistische Beratung und Lösungen