Variance Estimator (VarEst)

Startseite

Die Software VarEst wurde neu entwickelt mit dem Zweck die Varianzen von zufälligen und systematischen Messfehlern zu schätzen. Egal mit welcher Methode wir ein Merkmal eines Postens messen, die Messungen sind immer mit zufälligen und systematischen Fehlern behaftet. Der einzige Unterschied zwischen zufälligen und systematischen Messfehlern der zählt, ist die Art der Fehlerfortpflanzung. Um eine Fehlerfortpflanzung korrekt durchführen zu können, müssen wir die Gesamt-Messfehlervarianz einer Methode in die folgenden zwei Komponenten aufteilen: Varianz der zufälligen Messfehler und Varianz der systematischen Messfehler. Wir nehmen an, dass wir N = 2 Messmethoden haben und dass jede Methode den gleichen Posten einmal ohne Messwiederholung misst. Somit haben zwei Messresultate für einen Posten vorliegen, die wir als paarweise Daten bezeichnen. Genau daran knüpft VarEst an. ANOVA (ANalysis Of VAriance) Modell II mit zufälligen Effekten formt die statistische Basis der Software VarEst. Für das ANOVA Model II ergeben sich die zwei typischen Fragen:

(1) Existiert eine Standardabweichung σs der Effekte Sg, wobei der Zusatz g die Identifikation einer Gruppe benennt?
(2) Kann die Variation der Messdaten ausschließlich durch die Standardabweichung σR der zufälligen Messfehler erklärt werden, wobei der Zusatz j die Identifikation eines Postens benennt?


Falls die Standardabweichung σs nicht Null ist, dann müssen wir Schätzer für σs finden.

In einer realen Welt treten immer zufällige Fehler Rgj und systematische Fehler Sg auf und seien sie noch so klein, sowohl Rgj als auch Sg sind nicht direkt beobachtbare Zufallsvariablen. Das bedeutet aber, dass die Standardabweichung σs immer größer als Null ist. Somit streuen auch die systematischen Abweichungen Sg über einen längeren Zeitraum in Betrag und Vorzeichen. Deshalb ist die Wahrscheinlichkeit für einen Fehler 2. Art des Tests H0 : σs = 0 und H1 : σs > 0 immer genau Null.
In VarEst wird das folgende Messfehler-Modell zu Grunde gelegt:

Xg,ij = μg,j + Sg,i + Rg,ij

Xg,ij ist ein Messergebnis der Methode (Labor) i = 1,2, und μg,j ist der unbekannte wahre Wert des Merkmals des Postens j.

Sg,i ∼ N(0, σ2S,i) ist ein systematischer Fehler, der bewirkt, dass sich die Umgebungsbedingungen kurzzeitig ändern. Er ist innerhalb einer Gruppe konstant, aber er bewirkt Änderungen zwischen den Gruppen.

Rg,ij ∼ N(0, σ2R,i) ist ein zufälliger Fehler dessen Betrag und Vorzeichen nur für diese eine Messung gilt.

Es ist nicht notwendig anzunehmen, dass Rg,ij und Sg,i einer Normalverteilung folgen, obwohl diese Annahme häufig gemacht wird.

σ2μ ist die Varianz der wahren Werte μg,j des Merkmals und ist somit ein Maß für die Prozess-Variabilität (Produktvariabilität). Folglich können wir die Gesamtheit dieser Einzelmessungen an den betrachteten Posten nicht mit wahren Messwiederholungen gleich setzen.

Weiterhin müssen wir beachten, dass die Zufallsvariable Rg,ij einen 'postenspezifischen' Bias enthält. Deshalb hat Rg,ij auch eine größere Standardabweichung als ein purer zufälliger Fehler weil σ2R,i sowohl die Wiederholpräzision als auch die Varianz der 'postenspezifischen' Faktoren einschließt. Ein 'postenspezifischer' Bias entsteht weil physikalische Effekte der zu messenden Posten von den Standards des Kalibrierungsprozesses abweichen (z.B. die Geometrie der Posten und der Standards ist verschieden).

Wenn wir anstelle von Xg,ij die Logarithmen log Xg,ij wählen, dann sind die obigen Messfehler relative Messfehler.

In einem ersten Schritt betrachten wir dgj = Xg,1j - Xg,2j und schätzen basierend auf 'ANOVA-Model II' die zufälligen und systematischen Fehler-Varianzen für dgj, die wir mit σ̃2R und σ̃2S bezeichnen.

Dann in einem zweiten Schritt basierend auf bekannten Algorithmen, spalten wir σ̃2Ri und σ̃2Si auf die beiden Messmethoden 1 und 2 auf, so dass gilt σ̃2R = σ̃2R1 + σ̃2R2 und σ̃2S = σ̃2S1 + σ̃2S2.

Falls σ̃2S negativ wird, dann ersetzen wir ihn durch einen positiven aber verzerrten Schätzer σ̂2S.
Basierend auf dem zweiten Schritt führen wir einen statistischen Test wie folgt durch: H0 : E(d̄) = 0 und H1 : E(d̄) ≠ 0.

Falls wir die Hypothese H0 verwerfen, dann gibt es Anlass zu glauben, dass ein langzeitiger systematischer Fehler (Bias) existieren könnte.



Ein typisches Beispiel für zwei Messmethoden ist:



Konzentration in g/Kg



Year Group Method 1 Method 2 Difference File
Position
Xg,1j Xg,2j dg j
1999146,32046,387-0,145 %1
1999115,46915,2381,505 %2
1999148,98348,7770,421 %3
1999157,30057,0320,469 %4
1999157,50057,3990,176 %5
1998248,54049,099-1,145 %6
1998249,66049,929-0,540 %7
1998272,07072,139-0,096 %8
1998218,55318,5430,054 %9
1998231,20030,9100,934 %10
1997345,07045,683-1,351 %11
1997362,07061,8300,387 %12
1997345,73345,0051,605 %13


VarEst funktioniert auch für drei Messmethoden.

Dipl.-Ing. Dipl.-Ök. Klaus-Peter Martin