Variance Estimator (VarEst) |
Startseite |
Die Software VarEst wurde neu entwickelt mit dem Zweck die Varianzen von zufälligen und systematischen Messfehlern zu schätzen.
Egal mit welcher Methode wir ein Merkmal eines Postens messen, die Messungen sind immer mit zufälligen und systematischen
Fehlern behaftet. Der einzige Unterschied zwischen zufälligen und systematischen Messfehlern der zählt, ist die Art der
Fehlerfortpflanzung. Um eine Fehlerfortpflanzung korrekt durchführen zu können, müssen wir die Gesamt-Messfehlervarianz
einer Methode in die folgenden zwei Komponenten aufteilen: Varianz der zufälligen Messfehler und Varianz der systematischen
Messfehler. Wir nehmen an, dass wir N = 2 Messmethoden haben und dass jede Methode den gleichen Posten einmal ohne
Messwiederholung misst. Somit haben zwei Messresultate für einen Posten vorliegen, die wir als paarweise Daten bezeichnen.
Genau daran knüpft VarEst an. ANOVA (ANalysis Of VAriance) Modell II mit zufälligen Effekten formt die statistische Basis
der Software VarEst. Für das ANOVA Model II ergeben sich die zwei typischen Fragen:
(1) | Existiert eine Standardabweichung σs der Effekte Sg, wobei der Zusatz g die Identifikation einer Gruppe benennt? |
(2) | Kann die Variation der Messdaten ausschließlich durch die Standardabweichung σR der zufälligen Messfehler erklärt werden, wobei der Zusatz j die Identifikation eines Postens benennt? |
Falls die Standardabweichung σs nicht Null ist, dann müssen wir Schätzer für σs finden.
In einer realen Welt treten immer zufällige Fehler Rgj und systematische Fehler Sg auf und seien sie
noch so klein,
sowohl Rgj als auch Sg sind nicht direkt beobachtbare Zufallsvariablen.
Das bedeutet aber, dass die Standardabweichung
σs immer größer als Null ist. Somit streuen auch die systematischen Abweichungen Sg
über einen längeren Zeitraum in Betrag und Vorzeichen. Deshalb ist die Wahrscheinlichkeit für einen Fehler 2. Art des Tests
H0 : σs = 0 und H1 : σs > 0 immer genau Null.
In VarEst wird das folgende Messfehler-Modell zu Grunde gelegt:
Xg,ij = μg,j + Sg,i + Rg,ij
Xg,ij ist ein Messergebnis der Methode (Labor) i = 1,2, und μg,j ist der unbekannte wahre Wert
des Merkmals des Postens j.
Sg,i ∼ N(0, σ2S,i) ist ein systematischer Fehler, der bewirkt, dass sich die
Umgebungsbedingungen kurzzeitig ändern. Er ist innerhalb einer Gruppe konstant, aber er bewirkt Änderungen zwischen
den Gruppen.
Rg,ij ∼ N(0, σ2R,i) ist ein zufälliger Fehler dessen Betrag und Vorzeichen nur für
diese eine Messung gilt.
Es ist nicht notwendig anzunehmen, dass Rg,ij und Sg,i einer Normalverteilung folgen,
obwohl diese Annahme häufig gemacht wird.
σ2μ ist die Varianz der wahren Werte μg,j
des Merkmals und ist somit ein Maß für die Prozess-Variabilität (Produktvariabilität). Folglich können wir die Gesamtheit dieser Einzelmessungen an
den betrachteten Posten nicht mit wahren Messwiederholungen gleich setzen.
Weiterhin müssen wir beachten, dass die Zufallsvariable
Rg,ij einen 'postenspezifischen' Bias enthält. Deshalb hat Rg,ij auch eine größere Standardabweichung als ein
purer zufälliger Fehler weil σ2R,i sowohl die Wiederholpräzision als auch die Varianz der
'postenspezifischen' Faktoren einschließt. Ein 'postenspezifischer' Bias entsteht weil physikalische Effekte der zu messenden
Posten von den Standards des Kalibrierungsprozesses abweichen (z.B. die Geometrie der Posten und der Standards ist verschieden).
Wenn wir anstelle von Xg,ij die Logarithmen log Xg,ij wählen, dann sind die obigen Messfehler relative
Messfehler.
In einem ersten Schritt betrachten wir dgj = Xg,1j - Xg,2j und schätzen basierend
auf 'ANOVA-Model II' die zufälligen und systematischen Fehler-Varianzen für dgj,
die wir mit σ̃2R und σ̃2S bezeichnen.
Dann in einem zweiten Schritt basierend auf bekannten Algorithmen, spalten wir
σ̃2Ri und σ̃2Si auf die beiden Messmethoden 1 und 2 auf,
so dass gilt σ̃2R = σ̃2R1 + σ̃2R2
und σ̃2S = σ̃2S1 + σ̃2S2.
Falls σ̃2S negativ wird, dann ersetzen wir ihn
durch einen positiven aber verzerrten Schätzer σ̂2S.
Basierend auf dem zweiten Schritt führen wir einen statistischen Test wie folgt durch:
H0 : E(d̄) = 0 und H1 : E(d̄) ≠ 0.
Falls wir die Hypothese H0 verwerfen, dann gibt es Anlass zu glauben, dass ein langzeitiger systematischer Fehler
(Bias) existieren könnte.
Ein typisches Beispiel für zwei Messmethoden ist:
Konzentration in g/Kg
Year | Group | Method 1 | Method 2 | Difference | File Position |
Xg,1j | Xg,2j | dg j | |||
1999 | 1 | 46,320 | 46,387 | -0,145 % | 1 |
1999 | 1 | 15,469 | 15,238 | 1,505 % | 2 |
1999 | 1 | 48,983 | 48,777 | 0,421 % | 3 |
1999 | 1 | 57,300 | 57,032 | 0,469 % | 4 |
1999 | 1 | 57,500 | 57,399 | 0,176 % | 5 |
1998 | 2 | 48,540 | 49,099 | -1,145 % | 6 |
1998 | 2 | 49,660 | 49,929 | -0,540 % | 7 |
1998 | 2 | 72,070 | 72,139 | -0,096 % | 8 |
1998 | 2 | 18,553 | 18,543 | 0,054 % | 9 |
1998 | 2 | 31,200 | 30,910 | 0,934 % | 10 |
1997 | 3 | 45,070 | 45,683 | -1,351 % | 11 |
1997 | 3 | 62,070 | 61,830 | 0,387 % | 12 |
1997 | 3 | 45,733 | 45,005 | 1,605 % | 13 |
VarEst funktioniert auch für drei Messmethoden.
Dipl.-Ing. Dipl.-Ök. Klaus-Peter Martin |