Heim

Mittelwert

Dieser Artikel befasst sich allgemein mit Mittelwerten in der Mathematik und in der Statistik; zur speziellen Bedeutung Mittelwert einer Zufallsvariablen siehe Erwartungswert.

Mittelwerte treten in der Mathematik und insbesondere in der Statistik in inhaltlich unterschiedlichen Kontexten auf. In der Statistik ist ein Mittelwert ein sog. Lageparameter, also ein aggregierender Parameter einer Verteilung, einer Stichprobe oder Grundgesamtheit. Ziel solcher aggregierender Parameter ist es, die wesentliche Information in einer längeren Reihe von (z. B.) Messdaten in wenigen Daten zu konzentrieren. In der Mathematik treten Mittelwerte, insbesondere die drei klassischen Mittelwerte (Arithmetisches, Geometrisches und Harmonisches Mittel) bereits in der Antike auf. Pappos von Alexandria kennzeichnet 10 verschiedene Mittelwerte m von 2 Zahlen a und b (a < b) durch spezielle Werte des Streckenverhältnisses (b - m):(m - a). Auch die Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel ist in der Antike bereits bekannt und geometrisch interpretiert. Im 19. und 20. Jahrhundert spielen Mittelwerte in der Analysis eine spezielle Rolle, dort im wesentlichen im Zusammenhang mit berühmten Ungleichungen und wichtigen Funktionseigenschaften wie Konvexität (Hölder-Ungleichung, Minkowski-Ungleichung, Jensensche Ungleichung usw.). Dabei wurden die klassischen Mittelwerte in mehreren Schritten verallgemeinert, zunächst zu den Potenzmittelwerten und diese wiederum zu den quasi-arithmetischen Mittelwerten. Die klassische Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel geht dabei über in allgemeinere Ungleichungen zwischen Potenzmittelwerten bzw. quasi-arithmetischen Mittelwerten.

Im Folgenden seien gegebene reelle Zahlen, in der Statistik etwa Messwerte, deren Mittelwert berechnet werden soll.

Inhaltsverzeichnis

Arithmetisches Mittel

Das arithmetische Mittel (auch Durchschnitt) ist ein rechnerisch bestimmter Mittelwert. Es ist so definiert:

Beispiel für das arithmetische Mittel von 50 und 100:

Mittelwert in der Wahrscheinlichkeitsrechnung: Sind Zufallsvariablen, die unabhängig und identisch verteilt mit Mittelwert bzw. Erwartungswert μ und Varianz σ2 sind, so hat der Stichprobenmittelwert ebenfalls Mittelwert μ, aber die kleinere Varianz σ2 / n. Hat also eine Zufallsvariable endlichen Mittelwert und endliche Varianz, so folgt aus der Tschebyschow-Ungleichung, dass das arithmetische Mittel einer Stichprobe gegen den Erwartungswert der Zufallsvariablen stochastisch konvergiert. Das arithmetische Mittel ist daher nach vielen Kriterien eine geeignete Schätzung für den Erwartungswert der Verteilung, aus der die Stichprobe stammt. Es ist allerdings sehr empfindlich gegenüber Ausreißern (siehe Median und Sonstige Mittelwerte).

Anwendungsbeispiel

Ein Auto fährt eine Stunde lang 100 km/h und die darauf folgende Stunde 200 km/h. Mit welcher konstanten Geschwindigkeit muss ein anderes Auto fahren, um denselben Weg ebenfalls in 2 Stunden zurückzulegen?

Der Weg s1, den das erste Auto insgesamt zurückgelegt hat, beträgt

und der des zweiten Autos

wobei v2 die Geschwindigkeit des zweiten Autos ist. Aus s1 = s2 ergibt sich

und damit

Für die Bedeutung des arithmetischen Mittelwert in der Elektrotechnik siehe Arithmetischer Mittelwert (Elektrotechnik)

Gewichtetes arithmetisches Mittel

Statistik

Das gewichtete Mittel wird beispielsweise verwendet, wenn man Mittelwerte xi, aus n Stichproben der gleichen Grundgesamtheit mit verschiedenen Stichprobenumfängen wi miteinander kombinieren will:

.

Wahrscheinlichkeitsrechnung

Sind die Xi unabhängig verteilte Zufallsgrößen (d. h. X1 ist eine Zufallsgröße mit den Zufallsvariablen X11,...,X1n und X2 ist eine Zufallsgröße mit den Zufallsvariablen X21,...,X2m …) mit gemeinsamem Erwartungswert μ aber unterschiedlichen Varianzen , so hat der gewichtete Mittelwert ebenfalls Erwartungswert μ und seine Varianz beträgt

.

Wählt man

,

so vereinfacht sich die Varianz zu

.

Aus der Cauchy-Schwarzschen Ungleichung folgt

,

die Wahl oder eine Wahl proportional dazu minimiert also die Varianz des gewichteten Mittels. Mit dieser Formel lassen sich die Gewichte wi abhängig von der Varianz des jeweiligen Wertes, der dementsprechend den Mittelwert mehr oder weniger stark beeinflusst, zweckmäßig wählen.

Sind die Xi speziell Stichprobenmittelwerte vom Umfang ni aus der selben Grundgesamtheit, so hat Xi die Varianz σ2 / ni, also ist die Wahl wi = ni optimal.

Beispiele zum gewichteten arithmetischen Mittel

Das arithmetische Mittel der n1 = 3 Zahlen 1, 2 und 3 beträgt 2, das arithmetische Mittel der n2 = 2 Zahlen 4 und 5 beträgt 4,5. Das arithmetische Mittel aller 5 Zahlen ergibt sich als mit dem Stichprobenumfang gewichteter Mittelwert der Teilmittelwerte:

Liegen die Beobachtungen als klassierte Häufigkeit vor, kann man das arithmetische Mittel näherungsweise als gewichtetes Mittel bestimmen, wobei die Klassenmitten als Wert und der Klassenumfang als Gewicht zu wählen sind. Sind beispielsweise in einer Schulklasse ein Kind in der Gewichtsklasse 20 bis 25 kg, 7 Kinder in der Gewichtsklasse 25 bis 30 kg, 8 Kinder in der Gewichtsklasse 30 bis 35 kg und 4 Kinder in der Gewichtsklasse 35 bis 40 kg, so lässt sich das Durchschnittsgewicht als

abschätzen.

Weiteres Beispiel: Ein Bauer stellt im Nebenerwerb 100 kg Butter her. 10 kg kann er für 10 €/kg verkaufen, weitere 10 kg für 6 €/kg und den Rest muss er für 3 €/kg verschleudern. Zu welchem (gewichtetem) Durchschnittspreis hat er seine Butter verkauft? Lösung: (10 kg · 10 €/kg + 10 kg · 6 €/kg + 80 kg · 3 €/kg) / (10 kg + 10 kg + 80 kg) = 400 € / 100 kg = 4 €/kg. Der mit der jeweils verkauften Menge gewichtete Durchschnittspreis entspricht also dem fixen Preis, zu dem die Gesamtmenge verkauft werden müsste, um den gleichen Erlös zu erzielen wie beim Verkauf von Teilmengen zu wechselnden Preisen.

Der Mittelwert einer Funktion

Als Mittelwert der Riemann-integrierbaren Funktion wird die Zahl

definiert.

Die Bezeichnung Mittelwert ist insofern gerechtfertigt, als für eine äquidistante Zerlegung des Intervalls mit der Schrittweite das arithmetische Mittel

gegen konvergiert, vgl. [1].

Ist stetig, so besagt der Mittelwertsatz der Integralrechnung, dass es ein gibt mit , die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.

Der Mittelwert der Funktion f(x) mit dem Gewicht (wobei für alle ) ist

.

Für Lebesgue-Integrale im Maßraum mit einem endlichen Maß lässt sich der Mittelwert einer Lebesgue-integrierbaren Funktion als

definieren. Handelt es sich um einen Wahrscheinlichkeitsraum, gilt also , so nimmt der Mittelwert die Form

an; das entspricht genau dem Erwartungswert von .

Geometrisches Mittel

Das geometrische Mittel ist die n-te Wurzel aus dem Produkt der Zahlen . :

Es ist in der Statistik ein geeignetes Lagemaß für Größen, von denen das Produkt anstelle der Summe interpretierbar ist, z. B. von Verhältnissen oder Wachstumsraten.

Äquivalent dazu gilt

,

der Logarithmus des geometrischen Mittels ist also das arithmetische Mittel der Logarithmen, wobei die Basis des Logarithmus beliebig gewählt werden darf, aber auf beiden Seiten natürlich die gleiche sein muss.

Beispiel für das geometrische Mittel von 3 und 300:

Im Gegensatz zum arithmetischen Mittel ist das geometrische Mittel offensichtlich nur für nichtnegative Zahlen definiert und meist nur für echt positive Zahlen sinnvoll.

Beispiel: Das Mittel aus einer Verdopplung und nachfolgender Verachtfachung einer Bakterienkultur ist eine Vervierfachung (nicht eine Vermehrung um den Faktor 5).

Analog zum gewichteten arithmetischen Mittel lässt sich ein mit den Gewichten wi > 0 gewichtetes geometrisches Mittel definieren:

wobei

Anwendungsbeispiel

Ein Guthaben G wird im ersten Jahr mit zwei Prozent, im zweiten Jahr mit sieben und im dritten Jahr mit fünf Prozent verzinst. Welcher über die drei Jahre konstante Zinssatz p hätte zum Schluss das gleiche Kapital ergeben?

Guthaben GEnde am Ende des dritten Jahres:

oder mit Zinsfaktoren geschrieben

Mit konstantem Zinsatz p und zugehörigen Zinsfaktor 1 + p ergibt sich am Ende ein Guthaben von

Mit Gkonst = GEnde ergibt sich

und damit berechnet sich der durchschnittliche Zinsfaktor 1+p zu

Der durchschnittliche Zinsatz beträgt also ca 4,646 %. Allgemein berechnet sich der durchschnittliche Zinsfaktor also aus dem geometrischen Mittel der Zinsfaktoren der einzelnen Jahre. Wegen der Ungleichung vom arithmetischen und geometrischen Mittel ist der durchschnittliche Zinssatz kleiner oder bestenfalls gleich dem arithmetischen Mittel der Zinssätze, welches in diesem Beispiel beträgt.

Harmonisches Mittel

Das harmonische Mittel ist definiert als

Durch Bildung des Kehrwertes erhält man

,

der Kehrwert des harmonischen Mittels ist also das arithmetische Mittel der Kehrwerte.


Für zwei Werte a und b ergibt sich

Beispiel für das harmonische Mittel von 5 und 20:

oder


Mit dieser Formel ist das harmonische Mittel zunächst nur für von Null verschiedene Zahlen xi definiert. Geht aber einer der Werte xi gegen Null, so existiert der Grenzwert des harmonischen Mittels und ist ebenfalls gleich Null. Daher ist es sinnvoll, das harmonische Mittel als Null zu definieren, wenn mindestens eine der zu mittelnden Größen gleich Null ist.

Auch hier lässt sich ein mit den Gewichten wi > 0 gewichtetes harmonisches Mittel definieren:

Beispiel

Fährt man eine Stunde mit 50 km/h und dann eine Stunde mit 100 km/h, so legt man insgesamt 150 km in 2 Stunden zurück; die Durchschnittsgeschwindigkeit ist 75 km/h, also das arithmetische Mittel von 50 und 100. Bezieht man sich hingegen nicht auf die benötigte Zeit, sondern auf die durchfahrene Strecke, so wird die Durchschnittsgeschwindigkeit durch das harmonische Mittel beschrieben: fährt man 100 km mit 50 km/h und dann 100 km mit 100 km/h, so legt man 200 km in 3 Stunden zurück, die Durchschnittsgeschwindigkeit ist 66 2/3 km/h, also das harmonische Mittel von 50 und 100.

Allgemein gilt: Benötigt man für die Teilstrecke s1 die Zeit t1 (also Durchschnittsgeschwindigkeit v1 = s1 / t1) und für die Teilstrecke s2 die Zeit t2 (also Durchschnittsgeschwindigkeit v2 = s2 / t2, so gilt für die Durchschnittsgeschwindigeit über die gesamte Strecke

Die Durchschnittsgeschwindigkeit ist also das mit den Wegstrecken gewichtete harmonische Mittel der Teilgeschwindigkeiten oder das mit der benötigten Zeit gewichtete arithmetische Mittel der Teilgeschwindigkeiten.

Gemeinsame Definition der klassischen Mittelwerte

Die Idee, die den drei klassischen Mittelwerten zugrunde liegt, lässt sich auf folgende Weise allgemein formulieren:

Beim arithmetischen Mittel sucht man die Zahl m, für die gilt:

,

wobei sich die Summe links über n Summanden erstreckt. Das arithmetische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Summe“. Anschaulich bestimmt man mit dem arithmetischen Mittel aus Stäben verschiedener Länge einen mit einer durchschnittlichen oder mittleren Länge.

Beim geometrischen Mittel sucht man die Zahl m, für die gilt:

,

wobei sich das Produkt links über n Faktoren erstreckt. Das geometrische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Produkt“.

Das harmonische Mittel m löst die Gleichung

.

Logarithmischer Mittelwert

Der logarithmische Mittelwert zwischen xa und xb ist definiert als:

Der logarithmische Mittelwert wird beispielsweise bei der verfahrenstechnischen Auslegung von Packungskolonnen genutzt. Er dient dort zur Mittelung der molaren Zusammensetzungen an Kopf und Boden der Kolonne .

Für liegt der logarithmische Mittelwert zwischen dem geometrischen und dem arithmetischen Mittelwert:

Eine Verallgemeinerung des logarithmischen Mittelwerts auf mehr als zwei Variablen findet sich beispielsweise in [2].

Potenzmittelwert

Für positive Zahlen xi definiert man den k-Potenzmittelwert (engl.: k-th power mean) als

Die Notation ist nicht einheitlich, alternativ sind auch Schreibweisen wie Mk(x), mk(x) oder μk(x) üblich. Genauso wie die Schreibweise ist auch die Bezeichnungsweise uneinheitlich; möglich sind Varianten wie k-tes Mittel, Mittel der Ordnung oder vom Grad k oder Mittel mit Exponent k.

Mittels geeigneter Wahl des Parameters k können unter anderem die drei obigen Mittelwerte erzeugt werden:

Die Potenzmittelwerte stehen über die einfache Formel

mit den Stichprobenmomenten mk um Null in Beziehung. Außerdem wird in der Stochastik die Konvergenz im p-ten Mittel über diese Potenzmittelwerte definiert.

Ungleichung der Mittelwerte

In der Mathematik spielen Potenzmittelwerte vor allem wegen der Ungleichung der verallgemeinerten Mittelwerte eine Rolle: Für -∞ ≤ st ≤ ∞ gilt die Ungleichung:

Diese Ungleichung lässt sich z. B. beweisen, indem man setzt und ui und vi in die Hölder-Ungleichung mit p = t / s einsetzt.

Für die Spezialwerte −1, 0, 1, 2 des Potenzmittelwertes gilt:

.

Dieser Spezialfall lässt sich auch mit der Cauchy-Schwarzschen Ungleichung, die ein Spezialfall der Hölder-Ungleichung ist, beweisen.

Für zwei Variable gibt es auch eine grafische Veranschaulichung:

Das geometrische Mittel folgt direkt aus dem euklidischen Höhensatz und das harmonische Mittel aus dem euklidischen Kathetensatz mit der Beziehung

.

Quasi-arithmetischer Mittelwert (f-Mittel)

Sei f eine auf einem reellen Intervall I streng monotone stetige (und daher invertierbare) Funktion und seien

Gewichtsfaktoren. Dann ist für das mit den Gewichten wi gewichtete quasi-arithmetische Mittel definiert als

.

Offensichtlich gilt

Für f(x) = x erhält man das arithmetische, für f(x) = log(x) das geometrische Mittel, und für f(x) = xk das k-Potenzmittel.

Dieser Mittelwert lässt sich auf das gewichtete quasi-arithmetische Mittel einer Funktion verallgemeinern, wobei in einem die Bildmenge von x umfassenden Intervall streng monoton und stetig sei, verallgemeinern:

Winsorisiertes oder gestutztes Mittel

Kann man davon ausgehen, dass die Daten durch „Ausreißer“, d. h. einige wenige zu hohe oder zu niedrige Werte kontaminiert sind, so sortiert man die Beobachtungswerte nach aufsteigender Größe, schneidet eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrig bleibenden Werten den Mittelwert. Ein 10 % winsorisiertes Mittel erhält man, wenn man 5 % der Gesamtzahl aller Werte am unteren und 5 % am oberen Ende auslässt.

Das „a-Mittel“

Für einen gegebenen reellen Vektor mit wird der Ausdruck

wobei über alle Permutationen σ von { 1, …, n } summiert wird, als „a-Mittel“ [a] der nichtnegativen reellen Zahlen x1, …, xn bezeichnet.

Für den Fall , ergibt das genau das arithmetische Mittel der Zahlen x1, …, xn; für den Fall ergibt sich genau das geometrische Mittel.

Für die a-Mittel gilt die Muirhead-Ungleichung.

Gleitende Durchschnitte

Gleitende Durchschnitte werden in der dynamischen Analyse von Messwerten angewandt. Sie sind außerdem ein gängiges Mittel der technischen Analyse in der Finanzmathematik. Mit gleitenden Durchschnitten kann das stochastische Rauschen aus zeitlich voranschreitenden Signalen herausgefiltert werden. Häufig handelt es sich dabei um FIR-Filter. Jedoch muss beachtet werden, dass die meisten gleitenden Durchschnitte dem echten Signal hinterherlaufen. Für vorausschauende Filter siehe z. B. Kalman-Filter.

Gleitende Durchschnitte benötigen normalerweise eine unabhängige Variable, die die Größe der nachlaufenden Stichprobe bezeichnet, bzw. das Gewicht des vorangehenden Wertes für die exponentiellen gleitenden Durchschnitte.

Gängige gleitende Durchschnitte sind:

In der Finanzliteratur können außerdem sogenannte adaptive gleitende Durchschnitte gefunden werden, die sich automatisch einer sich ändernden Umgebung (andere Volatilität/Streuung etc.) anpassen:

Für die Anwendung von gleitenden Durchschnitten siehe auch Chartanalyse#Gleitende_Durchschnitte und ARMA-Modell#MA-Modell.

Siehe auch: Gleitender Mittelwert

Sonstige Mittelwerte

Sonstige Mittelwerte, die in einem eigenen Artikel beschrieben werden sind der Modus (eigentlich kein Mittelwert, sondern der häufigste Wert) und der Median, der robust gegenüber extremen Abweichungen, sogenannten Ausreißern, ist.

Ein anderer Mittelwert ist das arithmetisch-geometrische Mittel, das zwischen dem arithmetischen und geometrischen Mittel liegt.

Weiterführende Literatur

Die wohl umfassendste Diskussion von Mittelwerten und der mit ihnen verbundenen Ungleichungen findet man in [3]. Wichtige ältere Texte zu Mittelwerten und ihren Ungleichungen sind: [4], [5].

Siehe auch

Quellen

  1. H. Heuser: Lehrbuch der Analysis, Teil 1, 8. Auflage, Teubner, Stuttgart 1990. ISBN 3-519-12231-6
  2. A.O.Pittenger: The logarithmic mean in n variables. In: Amer. Math. Monthly, 92 (1985), S. 99–104.
  3. P.S.Bullen: Handbook of Means and Their Inequalities, Kluwer Acad. Pub. 2003, ISBN 1-4020-1522-4.
  4. G.H.Hardy, J.E.Littlewood, G.Polya: Inequalities, Cambridge Univ. Press 1964.
  5. E.Beckenbach, R.Bellman: Inequalities, Springer, Berlin 1961.