VarEst

Die Software VarEst wurde neu entwickelt mit dem Zweck die Varianzen von zufälligen und systematischen Messfehlern zu schätzen. Egal mit welcher Methode wir ein Merkmal eines Postens messen, die Messungen sind immer mit zufälligen und systematischen Fehlern behaftet. Der einzige Unterschied zwischen zufälligen und systematischen Messfehlern der zählt, ist die Art der Fehlerfortpflanzung. Um eine Fehlerfortpflanzung korrekt durchführen zu können, müssen wir die Gesamt-Messfehlervarianz einer Methode in die folgenden zwei Komponenten aufteilen: Varianz der zufälligen Messfehler und Varianz der systematischen Messfehler. Wir nehmen an, dass wir N = 2 Messmethoden haben und dass jede Methode den gleichen Posten einmal ohne Messwiederholung misst. Somit haben zwei Messresultate für einen Posten vorliegen, die wir als paarweise Daten bezeichnen. Genau daran knüpft VarEst an. ANOVA (ANalysis Of VAriance) Modell II mit zufälligen Effekten formt die statistische Basis der Software VarEst. Für das ANOVA Model II ergeben sich die zwei typischen Fragen:

(1)	Existiert eine Standardabweichung σ_s der Effekte S_g, wobei der Zusatz g die Identifikation einer Gruppe benennt?
(2)	Kann die Variation der Messdaten ausschließlich durch die Standardabweichung σ_R der zufälligen Messfehler erklärt werden, wobei der Zusatz j die Identifikation eines Postens benennt?

Falls die Standardabweichung σ_s nicht Null ist, dann müssen wir Schätzer für σ_s finden.

In einer realen Welt treten immer zufällige Fehler R_gj und systematische Fehler S_g auf und seien sie noch so klein, sowohl R_gj als auch S_g sind nicht direkt beobachtbare Zufallsvariablen. Das bedeutet aber, dass die Standardabweichung σ_s immer größer als Null ist. Somit streuen auch die systematischen Abweichungen S_g über einen längeren Zeitraum in Betrag und Vorzeichen. Deshalb ist die Wahrscheinlichkeit für einen Fehler 2. Art des Tests H₀ : σ_s = 0 und H₁ : σ_s > 0 immer genau Null.
In VarEst wird das folgende Messfehler-Modell zu Grunde gelegt:

X_g,ij = μ_g,j + S_g,i + R_g,ij

X_g,ij ist ein Messergebnis der Methode (Labor) i = 1,2, und μ_g,j ist der unbekannte wahre Wert des Merkmals des Postens j.

S_g,i ∼ N(0, σ²_S,i) ist ein systematischer Fehler, der bewirkt, dass sich die Umgebungsbedingungen kurzzeitig ändern. Er ist innerhalb einer Gruppe konstant, aber er bewirkt Änderungen zwischen den Gruppen.

R_g,ij ∼ N(0, σ²_R,i) ist ein zufälliger Fehler dessen Betrag und Vorzeichen nur für diese eine Messung gilt.

Es ist nicht notwendig anzunehmen, dass R_g,ij und S_g,i einer Normalverteilung folgen, obwohl diese Annahme häufig gemacht wird.

σ²_μ ist die Varianz der wahren Werte μ_g,j des Merkmals und ist somit ein Maß für die Prozess-Variabilität (Produktvariabilität). Folglich können wir die Gesamtheit dieser Einzelmessungen an den betrachteten Posten nicht mit wahren Messwiederholungen gleich setzen.

Weiterhin müssen wir beachten, dass die Zufallsvariable R_g,ij einen 'postenspezifischen' Bias enthält. Deshalb hat R_g,ij auch eine größere Standardabweichung als ein purer zufälliger Fehler weil σ²_R,i sowohl die Wiederholpräzision als auch die Varianz der 'postenspezifischen' Faktoren einschließt. Ein 'postenspezifischer' Bias entsteht weil physikalische Effekte der zu messenden Posten von den Standards des Kalibrierungsprozesses abweichen (z.B. die Geometrie der Posten und der Standards ist verschieden).

Wenn wir anstelle von X_g,ij die Logarithmen log X_g,ij wählen, dann sind die obigen Messfehler relative Messfehler.

In einem ersten Schritt betrachten wir d_gj = X_g,1j - X_g,2j und schätzen basierend auf 'ANOVA-Model II' die zufälligen und systematischen Fehler-Varianzen für d_gj, die wir mit σ̃²_R und σ̃²_S bezeichnen.

Dann in einem zweiten Schritt basierend auf bekannten Algorithmen, spalten wir σ̃²_Ri und σ̃²_Si auf die beiden Messmethoden 1 und 2 auf, so dass gilt σ̃²_R = σ̃²_R1 + σ̃²_R2 und σ̃²_S = σ̃²_S1 + σ̃²_S2.

Falls σ̃²_S negativ wird, dann ersetzen wir ihn durch einen positiven aber verzerrten Schätzer σ̂²_S.
Basierend auf dem zweiten Schritt führen wir einen statistischen Test wie folgt durch: H₀ : E(d̄) = 0 und H₁ : E(d̄) ≠ 0.

Falls wir die Hypothese H₀ verwerfen, dann gibt es Anlass zu glauben, dass ein langzeitiger systematischer Fehler (Bias) existieren könnte.

Ein typisches Beispiel für zwei Messmethoden ist:

Konzentration in g/Kg

Year	Group	Method 1	Method 2	Difference	File Position
Year	Group	X_g,1j	X_g,2j	d_{g j}	File Position
1999	1	46,320	46,387	-0,145 %	1
1999	1	15,469	15,238	1,505 %	2
1999	1	48,983	48,777	0,421 %	3
1999	1	57,300	57,032	0,469 %	4
1999	1	57,500	57,399	0,176 %	5
1998	2	48,540	49,099	-1,145 %	6
1998	2	49,660	49,929	-0,540 %	7
1998	2	72,070	72,139	-0,096 %	8
1998	2	18,553	18,543	0,054 %	9
1998	2	31,200	30,910	0,934 %	10
1997	3	45,070	45,683	-1,351 %	11
1997	3	62,070	61,830	0,387 %	12
1997	3	45,733	45,005	1,605 %	13

VarEst funktioniert auch für drei Messmethoden.

Variance Estimator (VarEst)

Startseite