Lijndiagram: verschil tussen versies

Uit Systeemmodellering
Naar navigatie springen Naar zoeken springen
 
(2 tussenliggende versies door dezelfde gebruiker niet weergegeven)
Regel 2: Regel 2:
  
 
== Voorbeelden ==
 
== Voorbeelden ==
 +
 +
Voorbeelden van combinaties van ''afhankelijke'' en '''onafhankelijke''' variabelen waarbij een lijndiagram geschikt is:
 +
 +
* de ''temperatuur'' als functie van de '''tijd''' gedurende een dag
 +
* de ''bodemverontreiniging'' als functie van de '''afstand''' tot een industrieterrein
 +
* de ''dichtheid'' van lucht als functie van de '''temperatuur'''
 +
* het ''percentage'' mensen dat bereid is een energiebesparende maatregel te nemen als functie van de '''prijs''' van die maatregel
 +
 +
Strikt genomen zou bij een ''aantal'' een lijndiagram ongeschikt zijn, omdat je bijvoorbeeld niet "anderhalve bezoeker" kunt hebben. Maar als het bijvoorbeeld om gemiddelden gaat, is "anderhalve bezoeker per minuut" geheel correct. En als het om grote aantallen gaat, maakt het ook niet meer uit dat de aantallen eigenlijk in stappen van één gaan. Daarom kun je best een lijndiagram maken van:
 +
 +
* het ''gemiddeld aantal bezoekers'' van een museum als functie van de '''tijd''' gedurende een dag
 +
* het ''aantal inwoners'' van Nederland als functie van de '''tijd'''
 +
 +
== Uitgewerkte voorbeelden: windsnelheden ==
  
 
Als we ieder kwartier de temperatuur meten (zodat we een [[tijdreeks]] krijgen), kunnen we ervan uitgaan dat tussen twee metingen de temperatuur ook tussenwaarden zal hebben aangenomen. Meten we de dichtheid van water bij verschillende zoutconcentraties, dan zal de dichtheid tussen twee concentraties ook tussenwaarden aannemen. In deze gevallen heeft een lijndiagram zin.
 
Als we ieder kwartier de temperatuur meten (zodat we een [[tijdreeks]] krijgen), kunnen we ervan uitgaan dat tussen twee metingen de temperatuur ook tussenwaarden zal hebben aangenomen. Meten we de dichtheid van water bij verschillende zoutconcentraties, dan zal de dichtheid tussen twee concentraties ook tussenwaarden aannemen. In deze gevallen heeft een lijndiagram zin.

Huidige versie van 9 mrt 2021 om 14:53

Een lijndiagram kan worden gebruikt wanneer de afhankelijke variabele tussenwaarden aanneemt tussen twee waarden van de onafhankelijke variabele.

Voorbeelden

Voorbeelden van combinaties van afhankelijke en onafhankelijke variabelen waarbij een lijndiagram geschikt is:

  • de temperatuur als functie van de tijd gedurende een dag
  • de bodemverontreiniging als functie van de afstand tot een industrieterrein
  • de dichtheid van lucht als functie van de temperatuur
  • het percentage mensen dat bereid is een energiebesparende maatregel te nemen als functie van de prijs van die maatregel

Strikt genomen zou bij een aantal een lijndiagram ongeschikt zijn, omdat je bijvoorbeeld niet "anderhalve bezoeker" kunt hebben. Maar als het bijvoorbeeld om gemiddelden gaat, is "anderhalve bezoeker per minuut" geheel correct. En als het om grote aantallen gaat, maakt het ook niet meer uit dat de aantallen eigenlijk in stappen van één gaan. Daarom kun je best een lijndiagram maken van:

  • het gemiddeld aantal bezoekers van een museum als functie van de tijd gedurende een dag
  • het aantal inwoners van Nederland als functie van de tijd

Uitgewerkte voorbeelden: windsnelheden

Als we ieder kwartier de temperatuur meten (zodat we een tijdreeks krijgen), kunnen we ervan uitgaan dat tussen twee metingen de temperatuur ook tussenwaarden zal hebben aangenomen. Meten we de dichtheid van water bij verschillende zoutconcentraties, dan zal de dichtheid tussen twee concentraties ook tussenwaarden aannemen. In deze gevallen heeft een lijndiagram zin.

Als we echter het bruto binnenlands product van de EU-landen in een diagram zetten, waarbij we de landen alfabetiseren, bestaat er geen "bbp tussen België en Bulgarije". Een lijndiagram is dan niet zinvol.

Ook bij een discrete afhankelijke en/of onafhankelijke variabele kan een lijndiagram af te raden zijn (bijvoorbeeld bij de prijs van een reis met een gezelschap: de prijs "bij 3,5 deelnemer" bestaat niet). Maar wanneer de aantallen groot genoeg zijn, zoals het aantal inwoners van een land in de loop van de tijd, is een lijndiagram zinnig, want het verschil tussen twee opeenvolgende discrete waarden valt ruim binnen de dikte van de getekende lijn.

Uit een lijndiagram van een tijdreeks kunnen de volgende eigenschappen van die tijdreeks zichtbaar worden:

  • Variabiliteit: de mate waarin de waarde van de weergegeven variabele in de tijd varieert.
  • Trend: of de waarde gemiddeld genomen in de tijd toeneemt of juist afneemt.
  • Periodiciteit: of de variatie in waarde zich volgens een patroon herhaalt.

De nu volgende voorbeelden zijn gebaseerd op metingen die dagelijks door het KNMI worden verricht.

Variabiliteit

Het onderstaande lijndiagram toont de windsnelheid bij Schiphol. Langs de Y-as staat aangegeven dat de weergegeven data uurgemiddelden zijn, uitgedukt in meter per seconde. Uit de labels langs de X-as en de legenda kun je opmaken dat de grafiek gegevens over de gehele maand januari van de jaren 2011 en 2012 weergeeft.

LijndiagramWindsnelheid.png

Dit lijndiagram laat zien dat de uurgemiddelde windsnelheid van uur tot uur flink kan variëren. Omdat de data uurgemiddelden zijn, zie je geen uitschieters a.g.v. korte windstoten. Bij een kortere tijdstap zou je die wél kunnen zien, en zou de variabiliteit waarschijnlijk nog veel hoger zijn.

Trend

Bij hoge variabiliteit versluieren de zig-zaglijnen de meer trendmatige "beweging" van een tijdreeks. Om trends te ontwaren kun je tijdreeksgegevens "gladstrijken" (Engels: smoothing) door niet de datapunten zelf, maar het voortschrijdende gemiddelde ervan te plotten. Het onderstaande lijndiagram is gebaseerd op dezelfde tijdreeksgegevens als het vorige diagram, maar nu wordt voor elke tijdstap T het gemiddelde over de waarden voor T-23 t/m T geplot. Door het op deze manier "gladstrijken" kun je de meer trendmatige bewegingen van een tijdreeks beter zien. Uiteraard is de variabiliteit nu veel kleiner.

LijndiagramWindsnelheidVG24.png

Merk op: De berekenwijze van het voortschrijdend gemiddelde heeft twee consequenties:

  1. De lijn van het voortschrijdend gemiddelde over N tijdstappen begint pas bij tijdstap T=N.
  2. De trendbeweging loopt een paar tijdstappen achter t.o.v. de tijdreeks.

Door tijdreeksgegevens verder te aggregeren en vervolgens in een lijndiagram weer te geven worden langlopende trends zichtbaar. Het onderstaande lijndiagram geeft een antwoord op de vraag: "Is het op Schiphol de afgelopen 10 jaar harder gaan waaien?". Het antwoord lijkt "nee" te zijn.

LijndiagramWindsnelheid10JaarTrend.png

Merk op: Als een lijngrafiek een stijgende of dalende trend laat zien suggereert het diagram dat deze trend zich in de toekomst zal blijven voortzetten. Als je de onzekerheid daarvan wilt benadrukken, kun je de lijn in de toekomst gestippeld doortrekken.

Periodiciteit

Bij grote variabiliteit is periodiek systeemgedrag vaak moeilijk te zien. Om na te gaan of de windsnelheid een dag/nachtritme kent kun je voor elk uur van de dag (U = 1 t/m 24) de gemiddelde windsnelheid bepalen door de windsnelheid over elk tijdstip U+24*i (i=0...364) te middelen. Op die manier krijg je 24 datapunten voor één jaar. Het onderstaande diagram plot deze punten voor de jaren 2001 t/m 2010.

LijndiagramWindsnelheidDagUur.png

Dit diagram laat heel duidelijk zien dat het — gemiddeld! — overdag harder waait dan 's nachts.

Op eenzelfde manier kun je nagaan of er een seizoenspatroon in de windsnelheid valt te onderkennen:

LijndiagramWindsnelheidMaand.png

Dit diagram laat zien dat het seizoenspatroon veel minder sterk is dan het dag/nachtritme.


Zie ook