Joachim Adolphi

Struktur als Protokoll des Werdens


Mittelwerte

Frage:

Sind Mittewerte vernünftig und wenn ja, warum und unter welchen Umständen?

Der praktische Menschenverstand ersetzt gern die individuellen Eigenschaften der Mitglieder einer Gruppe durch ihren Mittelwert, wenn er Pauschalaussagen machen will.

Beispiel: Könnten statt 100 Erwachsenen 200 Kinder mit dem Schiff fahren? Also schätzen wir ab, ob die Kinder im Mittel halb so schwer wie die Erwachsenen sind und stellen in Abhängigkeit vom Alter fest, dass das hinhauen könnte.

Betrachten wir die Mittelwertbildung etwas genauer, stellen wir fest, dass es da Fallen gibt, weil viele Größen, die wir mitteln wollen, unterschiedliche Bezüge haben können.

Wie immer lässt sich das am Beispiel der räumlichen Bewegung am besten demonstrieren. Stelle deinem Bekanntenkreis folgende Frage:

Bei einer Berg-Radelei seid ihr zum Pass hinauf mit 15 km/h unterwegs gewesen. Wie schnell müsst ihr die gleiche Strecke zurück bergab fahren, damit ihr auf einen Gesamt-Schnitt von 30 km/h kommt?

Die „normale“ Antwort ist schnell er-„mittelt“: 45 km/h!

Die Probe am gewählten mathematisch einfachsten Kopfrechen-Beispiel der Streckenlänge vom Anstieg (gleich Abfahrt) von 15 km ergibt, dass das nicht stimmt, ja gar nicht stimmen kann. Bei einem Gesamtschnitt von 30 km/h brauche ich für Auf- und Abfahrt zusammen (30 km) eine Stunde, die ich aber schon im Anstieg (15 km/h für 15 km) vollständig verbraucht habe. Nun müsste ich in Nullkommanichts (also Überlichtgeschwindigkeit) hinabrasen, um noch das Limit zu schaffen.

Was ist falsch an der Rechnung?

Die Mittelung der Geschwindigkeiten kann sich grundsätzlich auf Zeiten ODER auf Strecken beziehen. Da die Geschwindigkeit per definitionem aber ein ZEIT-bezogener Weg ist, funktioniert die „normale“ arithemtische Mittelung nur bei gleichen Zeiten (bei ungleichen Zeiten eben die „gewichtete arithmetische Mittelung“), aber nicht bei gleichen Strecken (und schon gar nicht bei ungleichen).

Wie hilft man sich da?

Man stellt die Formel geschickt nach der gesuchten Geschwindigkeit um und nutzt in unserem Fall, dass Hinweg und Rückweg gleich s sind:

v(gesamt) = vg = s(gesamt)/t(gesamt) = (s1+s2)/(t1+t2)

= (s1+s2)/(s1/v1+s2/v2)    (und mit s1=s2=s ergibt sich)

= 2s/(s/v1+s/v2) = 2/(1/v1+1/v2)    (und weiter)

2/vg = 1/v1 + 1/v2

1/v2 = 2/vg – 1/v1

v2 = 1/(2/vg – 1/v1) = vg/(2-vg/v1)

(Das Ergebnis ist jetzt, wie man es erwarten sollte, unabhängig von der konkreten Streckenlänge, wenn man nur „halbe Strecke“ vorgibt.)

Am letzten Ausdruck erkennt man, dass der Nenner Null wird, wenn v1 halb so groß wie vg ist. Ist es noch kleiner, müssten wir mit negativer Geschwindigkeit bergab rasen, was immer das auch bedeuten soll (weiter bergauf oder in die Vergangenheit??).

Diese Mittelwertbildung nennt man „harmonisch“ und kennt sie eigentlich aus der Elektrotechnik, wenn man den Gesamtwiderstand einer Parallelschaltung aus den Einzelwiderständen berechnen soll. Würde man auf die „mittlere“ Widerstandswirkung der einzelnen Bauelemente zurückschließen wollen, müsste man den Gesamtwiderstand mit der Anzahl multiplizieren (denn es addieren sich ja in Wirklichkeit die Leitwerte…).

Die allgemeine Formel für das gewichteten harmonische Mittel wäre dann

xm(harm) = (w1 + … + wn)/(w1/x1+   +wn/xn)

Dieses Beispiel sollte demonstrieren, dass man vorsichtiger sein muss, als man in der Schule gelernt hat.

Systematisch geht das so mit den Mittelwerten:

Zu den Ersatzwerten für Gruppen von Objekten gehören neben den Mittelwerten auch die Streuwerte, um die Gruppen charakterisieren zu können (entweder um die Gruppen einzeln einfacher berechnen zu können oder um sie voneinander unterscheiden zu können).

Spezifizierung der Mittelwerte

Wichtige Frage: Um welche Skalierung handelt es sich bei den betrachteten Werten und also Ersatzwerten?

Die Mittelwerte sind entsprechend unterschiedlich zu bestimmen und haben unterschiedliche Tragweiten:

(Da die arithmetischen Mittel auch als Differenzen geschrieben werden können, unterscheiden sich die beiden ersten Skalen darin nicht.)

Das arithmetische Mittel darf nicht auf ordinale Werte wie Schulnoten angewendet werden, um Schüler oder Klassen zu vergleichen, was aber selbst Mathelehrer oft nicht wissen. (Grund: Die „Punkt-Spannen“ für jede Note sind unterschiedlich groß, weshalb die Durchschnittspunktzahl NICHT auf die Durchschnittsnote fallen MUSS.)

Einschränkung der Streuwerte

„Im Mittel ist der Teich einen halben Meter tief, und trotzdem ist die Kuh darin ertrunken!“

Die Streuwerte sollen einen Eindruck davon machen können, wie sehr alle Werte um den Mittelwert schwanken. Das hilft zum Beispiel bei der Einschätzung der Qualität bei der Einhaltung von Maßen und bei der Bestimmung von Wahrscheinlichkeiten bestimmter Vorfälle.

Hier sind verschiedene Werte üblich, die unterschiedliche Vorzüge und Nachteile aufweisen. In naturwissenschaftlich-technischen Zusammenhängen bevorzugt man Werte, die die gleiche Dimension wie die betrachtete Größe haben, zum Beispiel die Standardabweichung. (In der Soziologie und besonders der Volkswirtschaft werden auch „Ungleichverteilungen“ betrachtet, wie der „Gini-Ungleichverteilungs-Koeffizient“, der die relative Abweichung von der Gleichverteilung beschreibt. In der Mathematik ist die „Varianz“ beliebt. Die statistischen Verteilungen werden nach ihren Erfindern benannt wie Poisson, Lorentz, Cauchy, Gauss o.a.m. oder einfach „Normal-V.“ u.a.

Solche Streuwerte und Verteilungen sind auf die beiden numerischen Skalierungen beschränkt. Sie spielen für die Strukturen eine untergeordnete Rolle und müssen deshalb hier nicht weiter behandelt werden.

Erweiterung der numerischen Mittelwerte auf stetige Gebilde

Wenn man einen Mittelwert einer stetigen Funktion bilden will, so teilt man deren bestimmtes Integral über einen betrachteten Bereich durch die Größe desselben.

Weitere Erweiterung der Mittelwerte um „gleitende Mittelwerte“

Im Unterschied zu historischen Betrachtungen an der Börse, wo gleitende Mittel über den vergangenen Zeitraum gebildet werden, sind in der Technik „glättende“ Mittelwerte durch „gleitende“ Integral-Bereiche üblich. Damit kann man stark im symmetrischen Fall der „Faltungsfunktion“ (unterm Integral multipliziert) schwankende Messwerte „glätten“ oder im antisymmetrischen Fall sanfte Kanten „schärfen“ (siehe auch Bildbearbeitung!).

Das ist für Struktur-Untersuchungen schon interessanter!

Eine weit verbreitete weitere FALLE beim Mitteln von Werten:

Die betrachteten Werte sind in einer Funktion versteckt. Dann muss man scharf zwischen den unabhängigen und abhängigen Variablen unterscheiden.

Erstes Beispiel ist die Übertragung eines Masse-Schwerpunktes auf einen Gravitations-„Schwerpunkt“: Der Masse-Schwerpunkt wird unter der Voraussetzung einer masseproportionalen Kraft aus den abstandsproportionalen Drehmomenten gebildet ist ist somit rein linear (verhältnis-skaliert, Ratio-Skala), während der Gravitations-Schwerpunkt dem reziproken Abstandsquadrat proprotional ist. Als Zahlenbeispiel:

Zwei gleich große Massen in den Abständen 5 und 15 vom angezogenen Objekt haben eine andere Anziehungskraft als die gemeinsame Masse im „mittleren“ Abstand 10, nämlich eine größere:

1/5² + 1/15² = 1/25 + 1/225 = (9+1)/225 = 10/225 = 2/45 > 2/100

(vgl. Abschnitt 2.8 zu den Schwerkraft-Trajektorien)

Zweites Beispiel ist die „Mittelung“ von Massen anhand einer Abmessung ähnlicher Körper gleichen Materials: Das Elefanten-Baby ist nur 1/3 so hoch wie die Mutter. Wie groß sind Elefanten-Kinder-Zwillinge, die zusammen so viel wiegen wie Mutter und Baby? (Mutterhöhe=1, Muttermasse=1)

Die mittlere Höhe von Baby und Mutter ist (1/3 + 1)/2 = 2/3 = 0,67.

Die mittlere Masse von Mutter und Baby ist aber (1/27+1)/2 = 14/27, woraus eine Zwillings-Höhe von 0,80 = 4/5 folgt, was doch deutlich größer als 2/3 ist.

Drittes Beispiel ist die parallele zeitliche Mittelung und gleichzeitige Darstellung zweier nicht linear verknüpfter Größen, wie zum Beispiel Pegelhöhe und Durchfluss eines Fließgewässers. Es entsteht ein Wertepaar, das nicht zusammenpasst. Das kann auch gar nicht zusammenpassen, weil der Durchfluss etwa (stark vereinfacht aus dem Modell eines flachen Kastenquerschnitts abgeleitet) quadratisch mit der Pegelhöhe zusammenhängt. Wenn also im Augenblick entweder der Pegel oder der Durchfluss mit dem Jahresmittel übereinstimmt, wundert man sich auf den ersten Blick, dass es die jeweils andere Größe nicht tut. Nun also wissen wir, warum: Das Zeit-Mittel von x(t) passt nicht zum Zeit-Mittel von y(t)=c*(x(t))². Mit der einfachen Funktion

y = x²

lässt sich das leicht darstellen:

Der Punkt für das rote Wertepaar der Mittelwerte von Abszisse und Ordinate liegt NICHT auf der quadratischen Funktion selbst!

Und trotzdem können beide Werte (und mit Vorsicht auch beide Mittelwerte) für sich gesehen in völlig unterschiedlichen Zusammenhängen sinnvoll sein:

Der Durchfluss (also Volumen oder Masse pro Zeit, integriert also eine Bilanzgröße) ist beispielsweise für angepasste landwirtschaftliche Entnahmen oder Trinkwasseraufbereitung von Bedeutung, der Pegel (also Wasserstand, also eine augenblickliche Zustandsgröße) für Schifffahrt und Hochwasserschutz.

Fazit:

Selbst bei so harmlosen Begriffen wie „Mittelwert“ sollte man also genau hinsehen, worauf er sich bezieht und ob er sinnvoll eingesetzt werden kann.

Kommentar abgeben

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert