Zielscheibe

Wie du die Streuung von Verbrauchswerten kontrollierst.

Die Streuung der Kraftstoffverbrauchswerte ist wirklich lästig.

Sie macht alles kompliziert und unübersichtlich.

Wegen der Streuung erkennen wir nicht auf einen Blick, wie hoch der Kraftstoffverbrauch wirklich ist.

Auch die Wirkung von Verbrauchsverbesserungsmaßnahmen verschwimmt in der Streuung.

  • Wird der Verbrauch besser?
  • Wird der Verbrauch schlechter?
  • Tut sich vielleicht gar nichts?

Die Werte sind immer wieder andere, mal geht es hoch, mal geht es runter. Wie will man da zu einer Erkenntnis kommen?

Zu allem Unglück ist der Effekt von verbrauchsverbessernden Maßnahmen häufig auch noch kleiner als die Streuung.

Du siehst zwar, dass die Werte sich verändern, weißt aber nicht, ob wirklich die Maßnahme der Grund für die Veränderung ist. Vielleicht ist es ja einfach nur die Streuung.

In diesem Artikel werde ich im Detail auf die Streuung der Kraftstoffverbrauchswerte eingehen. Ich werde erklären, wie man Licht ins Dunkel der Streuung bringen kann.

Ein besonderer Schwerpunkt wird dabei auf der Gaußschen Normalverteilung liegen. Sie ist die Theorie, die es uns erlaubt beim Flottenmonitoring die zufälligen Einflussfaktoren zu neutralisieren.

Ich werde die Theorie sehr praxisnah erklären, so dass es wirklich einfach zu verstehen ist.

Nachdem du alles gelesen hast, kannst du mir ja im Kommentar schreiben, wie gut es gelungen ist. Ich würde mich wirklich über eine Rückmeldung freuen.

Am Ende von diesem Artikel weißt du:

  • Wie du die Streuung einschätzen und beeinflussen kannst.
  • Wie der Zufall funktioniert und warum er seinen eigenen Einfluss ausschaltet.

Warum streut der Kraftstoffverbrauch?

Wovon hängt es ab, wann wieviel Diesel aus dem Tank entnommen wird?

Die Antwort auf diese Fragen ist definitiv einen eigenen Artikel wert, den ich noch schreiben und hier verlinken werde.

Ich will hier aber schon mal einen kurzen Ausblick geben. Gerade so viel, wie für das Verständnis der Streuung gebraucht wird.

Energiezufluss und Energieabfluss sind im Gleichgewicht.

Stell dir bitte eine Waage vor, die im Gleichgewicht ist.

Auf der einen Waagschale liegt die ins Fahrzeug einfüllte Energie. Das ist die Energie, die im Diesel im Tank drinsteckt.

Auf der anderen Waagschale liegt die Energie, die aus dem Fahrzeug abfließt. Das ist die Abwärme (rot) und die Fahrwiderstandsarbeit fürs Fahren (blau).

Du siehst in jedem Block drei Farbschattierungen:

  • Dunkel bedeutet: Dieser Teil der Energie ist physikalisch unvermeidbar, solange das Fahrzeug ein typischer LKW mit Verbrennungsmotor ist. Sozusagen die Grundlast.
  • Mittel bedeutet: Dieser Teil der Energie hängt von Faktoren ab, die veränderbar sind, aber immer gleichmäßig wirken.
  • Hell bedeutet: Dieser Teil der Energie hängt von Faktoren ab, die sich nach dem Zufallsprinzip verändern.

Ich werde gleich auf jeden einzelnen Block eingehen.

Die Energiemenge auf der rechten Seite verändert sich ständig, besonders der helle Anteil ist mal größer und mal kleiner. In der Folge verändert sich auch die Dieselmenge auf der linken Seite.

Du stellst bei jedem Tankvorgang dieses Gleichgewicht wieder her, indem du die verbrauchte Dieselenergie wieder ins Fahrzeug nachfüllst.

Der Dieselverbrauch streut genau im gleichen Maße, wie die Abwärme und die Fahrwiderstände (Arbeit) streuen. Sie sind die eigentlichen Ursachen für die Streuung im Kraftstoffverbrauch.

Was immer gleich ist, hat keine Streuung.

Hier rede ich jetzt über den dunkle Anteil an den Blöcken.

Der Kraftstoffverbrauch beinhaltet den minimalen Energiebedarf, der durch das technische Grundkonzept des Fahrzeuges und die grundsätzlichen Einsatzbedingungen festgelegt ist.

Dieser Teil vom Verbrauch kann nicht unterschritten werden, ohne das Fahrzeugkonzept grundlegend zu verändern. Zum Beispiel statt einem LKW ein Pferdefuhrwerk zu verwenden.

Solange du im vorgegebenen Konzept bleibst, ist dieser Teil des Verbrauches festgeschrieben. Da kommen wir nicht ran, keine Chance.

Ein LKW wird nie den Energieverbrauch eines Fahrrades haben. Nicht mal, wenn er leer ist und nur den Fahrer transportiert. Dafür ist er eben nicht gemacht.

  • Solange ein LKW 4m hoch und 2,5m breit ist und sich auf der Erdoberfläche bewegt, wird er immer einen gewissen Luftwiderstand erfahren, egal wie windschlüpfrig er gebaut ist.
  • Solange ein LKW mit Luftreifen auf einer Straße rollt, wird er nie den Rollwiderstand eines Eisenbahnrades auf einer Eisenschiene erreichen.

Das ist logisch und entspricht unseren Erfahrungen. Stimmt also.

Der Anteil des minimalen Energieverbrauches hat keine Streuung. Daran ändert auch die Tatsache nichts, dass dieser Anteil nur sehr schwierig genau abgrenzt werden kann.

Die Fahrzeughersteller sind sich ausnahmsweise einig:

Die CO2 Limits der europäischen Union für das Jahr 2030 sind nur durch den Einsatz von Elektroantrieben realisierbar.

Der Grund liegt genau an diesem Anteil des Kraftstoffverbrauches.

Eine Verbrauchsreduzierung um 30% auf der Basis des Flottendurchschnittes von 2019/20 drückt den Kraftstoffverbrauchswert in den Bereich des physikalischen Minimums von Diesel-LKW’s.

Der einzige Ausweg besteht darin, das physikalische Prinzip grundlegend zu verändern.

Mit Optimierung des Dieselantriebes allein ist die Aufgabe nicht zu lösen.

Übrigens gibt es bei E-LKW’s auch diesen Anteil im Energieverbrauch. Deshalb werden Elektro LKW’s immer deutlich größere Batterien als E-Bike’s benötigen.

Eingriffe in die Verbrauchsfaktoren verändern den Kraftstoffverbrauchswert vorhersehbar.

Hier geht es jetzt um den mittleren Anteil an den Blöcken.

Der Kraftstoffverbrauch beinhaltet einen Anteil, der ohne Veränderung des technischen Grundkonzeptes oder der grundsätzlichen Einsatzbedingungen veränderbar ist.

Um es an einigen Beispielen zu verdeutlichen:

  • Der Einsatz von Aeroverkleidungen verringert den Luftwiderstand und damit die Menge an Kraftstoff, die zu seiner Überwindung erforderlich ist.
  • Montierst du Reifen mit Fernverkehrsprofil anstatt Regionalprofil, sinkt der Rollwiderstand und damit wird weniger Diesel verbraucht.
Die beeinflussbaren Faktoren haben nur dann einen Effekt auf die Streuung, wenn sie verändert werden. Wenn sie gleich bleiben, verursachen sie keine Streuung. Ihr Einfuss ist reproduzierbar. 

Nach diesen Sachen suchen wir.

Ich werde in meinem Blog noch viele, viele Artikel schreiben, die sich genau mit diesem Thema beschäftigen werden.

Wir müssen herausfinden, wie groß der Einfluss dieser Faktoren ist. Dann können wir richtige Entscheidungen treffen.

Dafür müssen wir genau diesen Anteil des Kraftstoffverbrauches isolieren. Das bedeutet, alle anderen Einflüsse müssen ausgeschaltet werden, so dass nur noch die Veränderung übrig bleibt, die wir sehen wollen.

Leider ist das aber sehr schwierig, weil der Einfluss der zufälligen Faktoren den Einfluss der beeinflussbaren Faktoren überlagert. Wir müssen das aufteilen und wie das geht, erkläre ich gleich.

Das trickreiche an diesen Faktoren besteht darin, dass wir sie auch unbewußt verändern.

Dann erscheint uns die dadurch verursachte Verbrauchsveränderung als Streuung.

Im schlechtesten Falle verfälschen sie sogar das Ergebnis, ohne sich in einer auffälligen Streuung zu zeigen. Diese Faktoren streuen ja selber nicht, deshalb können sie den Verbrauchswert verschieben, ohne die Streuung zu verändern.

Wir nennen das dann einen systematischen Fehler, der zu falschen Schlussfolgerungen führen kann.

Die Suche nach systematischen Fehlern und nach Verbrauchsverbesserungsmaßnahmen läuft ähnlich ab. Ich werde das im nächsten Artikel genau untersuchen.

Woher kommt die zufällige Streuung?

Jetzt sind wir beim eigentlichen Schwerpunkt von diesem Artikel, dem hellen Anteil an den Blöcken.

Der Kraftstoffverbrauch beinhaltet einen Anteil, der sich ohne bewußte Einflussnahme permanent verändert. Die Ursache sind volatile Einflüsse aus dem Umfeld des Fahrzeuges.

Die Streuung des Kraftstoffverbrauchswertes wird zum überwiegenden Anteil durch zufällig wirkende Faktoren verursacht. 

Die Auswirkungen dieser Faktoren auf den Kraftstoffverbrauch sind reproduzierbar. Allerdings ist es das Eintreten dieser Faktoren nicht.

Deshalb sind sie leider nicht vorhersehbar und auch im Nachhinein schwer zu kontrollieren.

Nehmen wir als Beispiel den Wind.

Es ist sehr genau auszurechnen, wie sich Wind von einer bestimmten Windstärke und -richtung auf den Luftwiderstand des LKW und damit auf seinen Verbrauch auswirkt. Allerdings ist es praktisch nicht vorhersehbar, wann dieser Wind wie auf das Fahrzeug trifft.

Weil diese Faktoren eh nicht beeinflussbar sind, müssen sie ausgeglichen werden, sodass nur die interessanten, systematischen Faktoren übrig bleiben.

Dafür gibt es zwei Möglichkeiten.

  • Du kannst genau messen und dokumentieren, wann welche Faktoren in welcher Stärke während der Fahrt gewirkt haben. Danach wird der Einfluss rechnerisch normiert.
  • Du kannst die Methoden der Statistik benutzt, um die zufälligen Faktoren auszugleichen.

Die Erste der beiden Möglichkeiten ist im tagtäglichen Einsatz nicht realisierbar. Sie würde zu sehr vom eigentlichen Geschäft ablenken.

Sie wird bei der Verbrauchsmessfahrt benutzt. Wie das gemacht wird, darauf gehe ich im betreffenden Artikel im Detail ein.

Die zweite Möglichkeit nutzen wir beim Flottenmonitoring, deshalb erkläre ich sie jetzt hier im Detail.

Was ist Zufall?

Zufall ist etwas, was man nicht vorausgesehen hat, was nicht beabsichtigt war, was unerwartet geschah.

Quelle: Duden.de

Wenn du die Definition von „Zufall“ googelst, dann wirst du unterschiedliche Definitionen finden und du wirst sehen, dass Zufall in unterschiedlichem Kontext stattfindet.

Nicht nur in Physik und Mathematik, sondern zum Beispiel auch in der Philosophie, in der Psychologie und sogar in der Rechtswissenschaft.

Mir gefällt die Definition aus dem Duden am Besten. Sie erklärt die Herkunft des Wortes „Zufall“:

„zufallen, mittelhochdeutsch zuoval = das, was jemandem zufällt, zuteilwird, zustößt.“ (Quelle: Duden.de)

Zufällig bedeutet also, dass es sich unserer Kontrolle entzieht.

Im physikalischen Kontext ist das dann der Fall, wenn ein bestimmtes Systemverhalten so kompliziert oder unerforscht ist, dass wir es nicht verstehen und keine Möglichkeit haben Einfluss zu nehmen.

Ich will einige Beispiele geben:

Straße mit Schnee

Es ist nicht genau vorherzusagen, wie die Temperatur und der Wind in dem Augenblick sind, an dem du an einer bestimmten Stelle der Straße ankommst.

Schaust du den Wetterbericht, dann kannst du so ungefähr erfahren, wie das Wetter sein wird. Die ganz genaue Situation bleibt dem Zufall überlassen.

Ganz unmöglich ist es, das Wetter zu beeinflussen. Du bist nicht in der Lage zu einer genau vorgegebenen Zeit, an einem genau vorgegebenen Ort, eine Temperatur und eine Windstärke oder -richtung bewußt einzustellen!

Straße mit LKW

Warum fährt gerade jetzt an dieser Steigung vor dir ein anderer LKW mit höherem Zuggewicht oder geringerer Leistung, der dir eine Fahrgeschwindigkeit aufzwingt, die du eigentlich gar nicht fahren willst?

Das ist nicht vorhersehbar gewesen, sondern geschah unbeabsichtigt und unerwartet.

Naja, auf bestimmten Autobahnen ist es inzwischen doch vorhersehbar, die Geschwindigkeit ist immer noch zufällig.

Du konntest es weder genau vorhersagen, noch kannst du etwas daran ändern. Es ist ja wie üblich Überholverbot.

Warum ist die Topografie genau so wie sie ist?

Warum hat die Straßenbaufirma die Straße nicht topfeben und schnurgerade gebaut?

Dafür gibt es sicherlich gute Gründe.

Du hast wohl eher sehr selten die Möglichkeit darauf Einfluss zu nehmen und einen Straßenverlauf nach deinen Wünschen herstellen zu lassen.

Straße mit Kurve

Alle diese Faktoren und noch viele weitere zufällige Faktoren, haben einen Einfluss auf den Kraftstoffverbrauch.

Und diese Faktoren folgen einer Normalverteilung …

Was ist eine Normalverteilung?

Verteilungsfunktionen beschreiben die mathematischen Gesetzmäßigkeiten, nach denen die Häufigkeit von zufälligen Werte auftritt.

Die Normalverteilung ist eine Verteilungsfunktion, die in sehr vielen Fällen zutrifft.

Die Normalverteilung findest du zum Beispiel bei der Streuung von Messfehlern oder bei Maßabweichungen in der Produktion von Bauteilen. Selbst die Größe der Äpfel an einem Apfelbaum folgt der Normalverteilung.

Ich habe mit Absicht das Bild von der Zielscheibe für diesen Artikel ausgewählt.

Ein guter Schütze schafft es, die Streuung seiner Treffer klein zu halten. Ein schlechter Schütze schafft es nicht.

Das macht den Unterschied zwischen einem schlechten und einem guten Schützen.

Ein Schießwettkampf ist ein Kampf um die Normalverteilung mit der kleinsten Streuung.

Die Statistiker haben mit dem zentralen Grenzwertsatz herausgefunden, dass Sachverhalte, die von vielen zufällig streuenden Einflussfaktoren beeinflusst werden, mit hoher Wahrscheinlichkeit einer Normalverteilung folgen. Egal wie die Verteilung der einzelnen Faktoren ist.

Das trifft für den Kraftstoffverbrauch zu und ist super für uns.

Wir können annehmen, dass die Verteilung von Kraftstoffverbrauchswerten einer Normalverteilung folgt. 

Die Normalverteilung hat einige Eigenschaften, die uns sehr helfen werden.

Wer hat die Normalverteilung herausgefunden?

Der deutsche Mathematiker Carl Friedrich Gauß aus Göttingen hat die Normalverteilung und ihre charakteristischen Kenngrößen erforscht.

DM Schein mit Bild von Gauss
Carl Friedrich Gauss und seine Glockenkurve waren auf dem deutschen 10 Markschein abgebildet.

Seine Entdeckung war bahnbrechend für die Mathematik und hilft bei der Beantwortung von sehr, sehr vielen praktisch relevanten Fragestellungen.

Da sie so häufig zutrifft, hat diese Verteilung den Namen „Normalverteilung“ bekommen. (So nach dem Motto: Normalerweise kannste diese Funktion nehmen.)

Der Verdienst von Gauß ist so groß, dass man die Normalverteilung nach ihm „Gaussverteilung“ nennt.

Wie sieht die Normalverteilung aus?

Gauß hat erkannt: Der Zufall hält sich an Regeln!

Die Auftretenswahrscheinlichkeit der einzelnen zufallsbeeinflussten Wert ist vorhersehbar. Nur der Zeitpunkt bzw. die Reihenfolge des Auftretens ist es nicht.

Das bedeutet, dass sich die Verteilung der Werte mit Funktionskurven und wenigen charakteristischen Parametern beschreiben und beurteilen lassen.

Die Normalverteilung kann durch zwei mathematische Funktionen und deren Funktionskurven beschrieben werden:

  • Die Verteilungsfunktion
  • Die Dichtefunktion

Auf der x-Achse beider Funktionskurven befindet sich immer der eigentliche Wert. In unserem Fall also der Kraftstoffverbrauch.

Mit der Y-Achse ist es etwas komplizierter.

In der Verteilungsfunktion finden wir hier die Auftretenswahrscheinlichkeit jedes Einzelwertes in Prozent. Diese Information hilft uns nicht weiter und die Kurve selbst ist auch nicht wirklich hilfreich. Deshalb lassen wir diese beiseite.

Uns interessiert die Dichtefunktion.

Bei ihr ist die Fläche unter der Kurve immer 1. Das ergibt einen nicht wirklich aussagefähigen Wert auf der y-Achse.

Für uns ist die Form der Kurve interessant, nicht der y-Wert.

  • Hohe Streuung sorgt für einen niedrigen y-Wert des Durchschnittsverbrauches und damit für eine flache Kurve.
  • Niedrige Streuung sorgt für einen hohen y-Wert des Durchschnittsverbrauches und damit für eine steile Kurve.

Ich konzentriere mich also in der Folge auf die Dichtefunktion der Normalverteilung.

Die Formeln kannst du dir auf der Webseite ansehen, die ich hier verlinke. Da findest du auch noch mehr Theorie. https://de.serlo.org/mathe/2133/normalverteilung

Auf Grund ihrer charakteristischen Eigenschaften, sieht die Dichtefunktion der Gaußverteilung wie eine Glocke aus. Sie wird deshalb "Glockenkurve" genannt. 

Die Dichtefunktion der Normalverteilung hat charakteristische Merkmale, die wir nutzen werden.

  • Sie hat einen Erwartungswert
  • Sie hat eine Standardabweichung
  • Sie ist symmetrisch zum Erwartungswert
  • Sie ist nie null.

So sieht die Glockenkurve aus:

Normalverteilung mit Erwartungswert und Standardabweichung
Die kleinen Kreise symbolisieren die Einzelwerte, der häufigste Wert ist in der Mitte.

Was sagen uns die Parameter der Normalverteilung?

Der Erwartungswert

Er ist sowohl der arithmetische Mittelwert, als auch der Median der Grundgesamtheit aller Werte einer Normalverteilung.

Der Erwartungswert ist der Wert, der mit der größten Häufigkeit auftritt. Er repräsentiert den Durchschnitt aller Werte.

Weil die Kurve symmetrisch zum Erwartungswert ist, treten genauso viele kleinere Werte, wie größere Wert auf. Darum mitteln sich die Werte aus und was übrig bleibt ist der Erwartungswert selber.

Das ist sehr praktisch. Der Zufall neutralisiert sich vollautomatisch, wir müssen gar nichts tun.

Wir können den Erwartungswert verwenden, er steht für den puren, nichtstreuenden Verbrauch.

Ungeschickt ist nur, dass wir diesen Erwartungswert nie genau herausfinden werden, weil wir nie alle Werte der Grundgesamtheit unserer Normalverteilung haben.

Aber wie wir damit umgehen, erkläre ich gleich. Hab noch ein kleines bisschen Geduld.

Der repräsentative Kraftstoffverbrauchswert, den wir uns die ganze Zeit wünschen, ist der Erwartungswert der Dichtefunktion der Kraftstoffverbrauchswerte.

Die Standardabweichung

Die Standardabweichung kennzeichnet die Bauchigkeit der Kurve. Sie stellt die Wendepunkte der Kurve dar. Innerhalb der Standardabweichung (nach oben und nach unten) liegen 68% der Werte, also mehr als die Hälfte aller Werte.

Die Standardabweichung gibt uns ein Gefühl, wie weit die Einzelwerte auseinander liegen. Damit können wir abschätzen, wie häufig Werte im Bereich des Erwartungswertes auftreten.
  • Ist die Standardabweichung klein, dann treten Werte in der Nähe des Erwartungswertes mit einer großen Häufigkeit und damit auch sehr wahrscheinlich auf.
  • Ist die Standardabweichung groß, also die Kurve flach, dann haben auch weit vom Erwartungswert liegende Werte eine hohe Auftretenswahrscheinlichkeit.

Die Standardabweichung ist ein Maß für die Streuung der Werte.

Die Berechnung der Normalfunktion.

Um die Dichtefunktion der konkreten Normalverteilung deiner Kraftstoffverbrauchswerte zu erhalten, musst du die beiden Parameter der Normalverteilung ausrechnen.

Damit kannst du dann die Formel hinschreiben, die Kurve aufzeichnen, dir die Kurve vorstellen oder verschiedene Funktionskurven miteinander vergleichen.

Leider fehlt uns zum Berechnen der Parameter eine entscheidende Information:

Die Auftretenswahrscheinlichkeit der Einzelwerte.

Aber keine Sorge, wir wenden jetzt einen Trick an:

  • Wir berechnen den artithmetischen Mittelwert unserer Werte und verwenden ihn als Erwartungswert.
  • Wir berechnen die Streuung unserer Werte und verwenden sie als Standardabweichung.

Das heißt, wir arbeiten einfach mit den Werten, die wir haben.

Im Artikel über die Berechnung des Durchschnittsverbrauches erkläre ich die Berechnung der beiden Wert. Da kannst du nachschauen.

Hast du die Werte berechnet, dann kannst du dir deine Glockenkurven zeichnen lassen.

Hier habe ich dir eine Webseite rausgesucht, wo du die Werte eintragen kannst und dann deine Verteilung angezeigt bekommst.

Wenn du mir eine E-Mail schreibst, kannst du von mir ein Excel Datei zum berechnen und zeichnen der Verteilungen bekommen. Du gibst deine Einzelwerte ein und die Tabelle berechnet Mittelwert, Gesamtverbrauch und Streuung aus.

Was sagt uns die Normalfunktion über den Kraftstoffverbrauch?

Mit Hilfe der Wahrscheinlichkeitsrechnung haben wir also die zufälligen Verbrauchseinflüsse ausgemittelt und können mit dem Erwartungswert arbeiten.

Da dieser Wert alle Werte der jeweiligen Verteilung repräsentiert, können wir also zum Beispiel solche Werte auch miteinander vergleichen.

Im Idealfall könnte das dann so aussehen:

zwei Normalverteilungen

Hier hast du also 2 Gruppen (z.B. Fahrzeuge oder Fahrer) bei denen der Verbrauchsunterschied 3 l/100km beträgt.

Wo ist der Pferdefuß?

Weil der echte, wahre Erwartungswert nicht bekannt ist, besteht Unsicherheit, wie groß die Abweichung zwischen den wahren und dem berechneten Wert ist. Je nach Größe diese Abweichung, kann die Schlussfolgerung deshalb fehlerhaft sein.

Wir haben einen Kompromiss gemacht, als wir den Durchschnittswert und die Standardabweichung mit unseren vorhandenen Daten berechnet haben.

Der Preis, den wir bezahlen müssen, ist die Unsicherheit, wie weit der echte, genaue Wert von unserem berechneten Wert abweicht.

Diese Abweichung wird besonders dann relevant, wenn du Durchschnittswerte miteinander vergleichst, deren Unterschied im Bereich der Streuung der Verteilungen liegt.

Wäre im obigen Beispiel der Verbrauchsunterschied nicht 3 l/100 km, sondern kleiner als 2 l/100km, dann hätten wir so eine Situation.

Um die Abweichung zwischen dem berechneten und dem wahren Durchschnittswert einschätzen zu können, müssen wir wissen, wie gut unsere vorhandenen Werte die Grundgesamtheit aller Werte abbilden.

Den Ausgriff der Verbrauchswerte nennen die Statistiker „Stichprobe“. Also schauen wir uns jetzt an, was man über Stichproben weiß.

Was ist eine Stichprobe?

Eine Stichprobe ist:

1. Teil einer Gesamtheit, der nach einem bestimmten Auswahlverfahren zustande gekommen ist,

2. Untersuchung, Kontrolle einer Stichprobe, um daraus auf das Ganze zu schließen.

Duden

Die Einzelverbrauchswerte, die wir im Flottenmonitoring sammeln, stellen eine Teilmenge aller Verbrauchsdaten dar. Deshalb sind sie eine Stichprobe aus der Grundgesamtheit der Verteilungsfunktion.

Um genau zu sein, ist es eine Zufallsstichprobe. Weil das Auswahlverfahren eine zufällige Auswahl ist.

Das ist ein gute Nachricht, denn Zufallsstichproben sind in der Regel weniger von systematischen Fehlern betroffen. Der Zufall mag halt den Zufall.

Was ist der Grund für die Ungenauigkeit unseres Durchschnittsverbrauches?

In einer Normalverteilung ist zwar die Wahrscheinlichkeit des Auftretens jedes Wertes bestimmt, die Reihenfolge des Auftretens aber nicht.

Aus diesem Grund weiß man nicht, in welcher Reihenfolge der Zufall die Werte in die Stichprobe einspielt.

Meint er es gut mit uns, dann sind die häufigsten Werte der Normalverteilung auch am häufigsten in unseren Daten enthalten.

Die Abweichung zwischen unserem Mittelwert und dem Erwartungswert ist dann gering und wir können unbekümmert mit dem Wert arbeiten.

Es kann aber auch sein, dass uns der Zufall zuerst die exotischen Werte auf den Tisch legt.

Dann gibt es eine deutliche Abweichung zwischen den beiden Durchschnittswerten und unser Wert ist der Falsche von den beiden.

Das sowas passieren kann, wissen wir vom Lotto spielen. Auch da kommt es vor, dass jemand gleich mit den ersten Tippschein einen Gewinn abräumt.

Wir müssen jetzt nicht die Flinte ins Korn werfen, die Statistiker haben da noch einiges in petto, was uns weiterhilft.

Wie genau ist der Durchschnittsverbrauch?

Wir müssen herausbekommen, wie groß die Abweichung zwischen deinem Mittelwert und dem wahren Wert wahrscheinlich ist. Dafür haben die Statistiker Formeln, die wir gleich benutzen werden.

Wenn wir das wissen, dann können wir die Gefahr von Fehlinterpretationen einschätzen.

Falls uns die Gefahr zu groß ist, können wir die Stichprobe genauer machen.

Welche Parameter beeinflussen die Genauigkeit?

Die Streuung der Grundgesamtheit

Die Streuung der Grundgesamtheit hat einen Einfluss auf die Abweichung des Mittelwertes der Stichprobe.

Diese Streuung kommt aus dem Einsatzprofil und hat erstmal nichts mit der Stichprobe selber zu tun.

Es ist aber logisch. Wenn aus dem Einsatz der Fahrzeuge schon eine große Streuung kommt, dann muss natürlich auch die Streuung unserer Stichprobe groß sein.

Der Zufall hat dann die Auswahl aus vielen Werten mit ähnlicher Auftretenswahrscheinlichkeit.

Normalerweise werden wir uns damit abfinden.

In einigen Fällen kann es aber sinnvoll sein, aus einer Verteilung mehrere zu machen. Also die Einsatzprofile aufzuteilen.

Die Anzahl der Einzelwerte.

Um so mehr Werte wir in der Stichprobe haben, um größer ist die Wahrscheinlichkeit, dass die Werte mit einer hohen Auftretenswahrscheinlichkeit auftreten.

Das ist auch wieder logisch. Der Zufall hält sich an seine eigenen Regeln.

Die Mathematiker sagen, dass die Stichprobe mindestens 30 Einzelwerte haben muss, dann funktioniert die Berechnung, die ich gleich zeigen werde.

Wie wird die Abweichung des Durchschnittswertes vom wahren Wert berechnet?

Es ist möglich den Bereich um den Stichprobenmittelwert zu berechnen, in dem der wahre Erwartungswert mit einer gewissen Wahrscheinlichkeit liegt.

Vertrauensbereich um den Durchschnittsverbrauch

Du nimmst die Standardabweichung deiner Werte und teilst sie durch die Wurzel aus der Anzahl der Werte, aus denen die Stichprobe besteht.

Dann multiplizierst du mit 1,96 und bekommst einen Bereich um den Mittelwert, in dem sich wahre Wert mit einer Wahrscheinlichkeit von 95% befindet.

Hier eine kurze Erklärung der Hintergründe dieser Formel:

Man kann sich vorstellen, dass es unendlich viele Stichproben gibt, die aus ein- und derselben Grundgesamtheit der Verteilung gezogen werden können.

Die Mittelwerte aller dieser Stichproben sind auch wieder normalverteilt.

Das bedeutet, man kann eine Streuung dieser Mittelwerte ausrechnen.

Während die Streuung der Einzelwerte „Standardabweichung“ genannt wird, sagen die Mathematiker zur Streuung der Mittelwerte der Stichproben „Standardfehler“.

Wenn zu diesem Standardfehler noch eine Wahrscheinlichkeit dazugerechnet wird, entsteht daraus die Fehlergrenze und ein Vertrauensbereich.

Der Vertrauensbereich sagt aus, in welchem Bereich um den Mittelwert sich der wahre Erwartungswert mit einer definierten Wahrscheinlichkeit befindet.

Üblicherweise wird eine Wahrscheinlichkeit von 95% verwendet.

Rechnen wir das Beispiel aus der Durchschnittsverbrauchberechnung vom letzten Artikel.

Du siehst, auch bei dieser Betrachtung kommt heraus, dass diese Stichprobe keine Aussagekraft besitzt. Auf der Basis von 5 Werten mit so einem großen Fehlerpotential kann man keine Schlussfolgerungen ziehen.

Der wahre Durchschnittsverbrauch wird irgendwo zwischen 27,33 und 33,71 l/100 km liegen.

Diese Erkenntnis ist auch was wert. Ich kann dir sagen, ich kenne Leute, die ziehen Schlussfolgerungen sogar aus einem einzigen Wert und wissen gar nicht, auf was für dünnem Eis sie sich damit bewegen.

Eigentlich darf ich bei weniger als 30 Werten nicht mit dem Z-Wert rechnen.

Ich brauche einen t-Wert, der von der Anzahl der Einzelwerte abhängt. Hier ist eine Tabelle, in der du die t-Werte ablesen kannst.

Zur Auswahl des t-Wertes muss die Anzahl der Werte minus 1 gerechnet werden. In unserem Beispiel gehen ich also in die Zeile mit dem Wert „4“.

Ich will die Wahrscheinlichkeit 95%, also gehe ich in die Spalte „einseitig 0,025, doppelseitig 0,05“ ( 100%- 5% = 95%)

Der t-Wert ist dann 2,776.

Das Vertrauensintervall ist also eigentlich +/- 4,51.

Die Abweichung vom Erwartungswert kann also sogar größer als die Standardabweichung der Einzelwerte sein!

Wie kann die Genauigkeit verbessert werden?

Das Wundermittel zur Verbesserung der Genauigkeit ist, mehr Einzelwerte zu beschaffen.

Das ist auch wieder logisch, denn um so mehr Werte die Stichprobe enthält, um so genauer wird sich die richtige Verteilung der Werte einstellen.

Die Werte mit hoher Auftretenswahrscheinlichkeit werden stärker zunehmen, als die Werte mit einer geringen Auftretenswahrscheinlichkeit.

Schauen wir mal was passiert, wenn wir bei gleicher Streuung mehr Werte hätten.

Anzahl der Werte (n)Vertrauensbereich
5+/- 3,19 (4,51)
30+/- 1.30
100+/- 0,71
300+/- 0,41
1000+/- 0,23

Mehr Werte in der Stichprobe verkleinern den Vertrauensbereich.

Das ist gut, denn ein engerer Bereich heißt, dass die Wahrscheinlichkeit steigt, dass der Mittelwert nahe am wahren Durchschnittsverbrauch dran ist.

Ich habe zu Demonstrationszwecken nur die Anzahl der Werte erhöht. Das geht natürlich so nicht. Du musst wirklich mehr Einzelverbrauchswerte einfahren.

Das wird zusätzlich noch die Standardabweichung der Stichprobe verkleinern. Dadurch wird der Vertrauensbereich nochmal enger.

Es ist an der Tabelle schon zu erkennen, dass die Genauigkeit mit steigender Werteanzahl immer weniger zunimmt.

Das ist eine gute Nachricht!

Es bedeutet, dass die unendlich vielen Einzelwerte in der Grundgesamtheit mit einigen hundert Werten in der Stichprobe schon ganz gut erfasst werden können.

Der systematische Fehler darf nicht vergessen werden!

Systematische Fehler können mit dieser Berechnung nicht gefunden werden! Deshalb ist eine weitere inhaltliche Analyse der Messwerte und der Durchführung der Messung notwendig!

Leider bedeutet die Kenntnis vom Vertrauensbereiche des Mittelwertes nicht, dass nicht größere systematische Fehler aufgetreten sein können.

Darum musst du dir die Werte und die Einsatzbedingungen, aus denen die Werte stammen, nochmal genau anschauen.

Einige dieser möglichen Fehler habe ich schon in den Artikeln zur Durchschnittsberechnung und zur Messung von Strecke und Dieselvolumen beschrieben.

Das war also noch nicht alles. Also bleibt dran, in den nächsten Artikeln geht es weiter.

Fazit

  • Die Streuung vom Kraftstoffverbrauch resultiert aus der Streuung der Abwärme und der Fahrwiderstände.
  • Der Verbrauch setzt sich aus unterschiedlich stark streuenden Anteilen zusammen.
  • Die zufällig streuenden Anteile können mit einer Normalverteilung beschrieben werden.
  • Die vorhandenen Einzelverbrauchswerte stellen ein Stichprobe aus der Grundgesamtheit der jeweiligen Normalverteilung dar.
  • Der Vertrauensbereich um den berechneten Durchschnittsverbrauch zeigt, wo sich der wahre Durchschnittswert wahrscheinlich befindet.
  • Eine Erhöhung der Anzahl von Einzelwerten führt zu einem kleineren Vertrauensbereich und damit zu höherer Genauigkeit.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.