les1
STATISTIEK VOOR HISTORICI
les3

2. GRAFIEKEN

2.1. Grafische presentatie en meetniveaus
2.2. Regels bij het maken van een grafische voorstelling
2.3. Soorten grafieken
2.4. De assen van de grafiek
2.5. Logaritmische assen
2.6. Van metrische naar logaritmische schaal


 BIJ LES 2 BEHORENDE:
Excelinstructies Opdrachten
1. Grafiek met metrische schaal 3. Grafiek
2. Grafiek met logaritmische schaal 4. Grafiek



2.1. Grafische presentatie en meetniveaus

Grafische presentatie van gevonden gegevens is onlosmakelijk verbonden met de statistiek. De mogelijke presentatie van variabelen hangt nauw samen met de wijze waarop deze zijn gemeten.

We onderscheiden vier meetniveaus (= meetschalen) van variabelen:

a. Nominaal:
Gegevens die elkaar uitsluiten en waartussen geen rangorde bestaat.
Voorbeelden:
geslacht,
beroep,
staatsvorm,
nationaliteit.


b. Ordinaal:
Gegevens waartussen een bepaalde rangorde bestaat, maar waarbij de afstanden tussen de rangen niet meetbaar zijn.
Voorbeelden:
sociale status (hoog - midden - laag),
politieke voorkeur (links - centrum - rechts),
inkomensklasse (boven modaal - modaal - onder modaal),
positie in klassement (eerste, tweede, derde, etc. plaats; de afstand tussen nummer 1 en 2 is onbekend).


c. Interval:
Gegevens waartussen een rangorde bestaat en een afstand te berekenen valt maar waar een vastliggend nulpunt ontbreekt (het nulpunt is arbitrair).
Voorbeelden:
jaartal (het jaar 0 is in de Christelijke jaartelling anders dan in de Joodse of Islamitische),
temperatuur (00 Celsius is anders dan 00 Fahrenheit).


d. Ratio:
Gegevens waartussen een rangorde bestaat, waarbij de onderlinge afstand te berekenen valt en waarbij het nulpunt vast ligt.
Voorbeelden:
inkomen in geldwaarde (0 gulden is ook werkelijk niets),
productieomvang,
prijs,
leeftijd.

Variabelen die op interval en ratioschaal zijn gemeten, staan ook wel bekend als kardinale variabelen. In de statistische praktijk is het onderscheid tussen interval en ratio te verwaarlozen.

Het meetniveau bepaalt welke grafische weergave en welke statistische technieken er op (een) variabele(n) kunnen worden toegepast. Bijvoorbeeld: van een nominale variabele kun je geen spreidingsdiagram maken en geen gemiddelde berekenen.


2.2. Regels bij het maken van een grafische voorstelling

a. De inhoud moet in één oogopslag, onafhankelijk van een begeleidende tekst, duidelijk zijn:
De grafiek heeft een titel waarin onderwerp, gebied en tijd waarop de gegevens betrekking hebben staan vermeld.
De assen hebben een beschrijving die laat zien in welke eenheden de variabelen gemeten zijn.
Onderaan de grafiek staat een bronvermelding.
b.De assen hebben een overzichtelijke schaalverdeling. Weglating van een nulpunt op de X- of Y-as moet altijd duidelijk worden aangegeven.
c. De onafhankelijke variabele staat op de horizontale of X-as, de afhankelijke variabele(n) staat (staan) op de verticale of Y-as.
d. Als er verschillende (afhankelijke) variabelen in een grafiek zijn weergegeven, is een legenda vereist die aangeeft welke symbolen (kleuren, arceringen, etc.) worden gebruikt voor iedere variabele.


2.3. Soorten grafieken

Er bestaan vele soorten grafieken. De belangrijkste zijn:

1. Eendimensionale grafieken:
a. Staafdiagram:
horizontale of verticale staven geven de waarden van één of meer variabelen aan. Wanneer meer variabelen in dezelfde grafiek staan, worden deze door balkjes van verschillende kleur of arcering weergegeven. Wanneer de staven frequenties van voorkomen weergeven, spreekt men van een histogram (zie ook les 5).

Staafdiagram
Bron: Persbericht Centraal Bureau voor de Statistiek datum: 3 juli 1997ontkerkelijking stokt en milieubesef neemt af, http://statline.cbs.nl/witch/etc/static/PERS97/KPE0307.html



b. Stapeldiagram:
staafdiagram met verschillende variabelen, waarbij de balkjes bovenop elkaar zijn weergegeven. Vaak toegepast voor cumulatieve gegevens (die bijvoorbeeld samen tot 100% optellen).

Stapeldiagram
Bron: J.K.S. Moes en B.M.A. de Vries (red.), Stof uit het Leids Verleden zeven eeuwen textielnijverheid (Utrecht 1991).



c. Cirkeldiagram:
(ook wel taartdiagram of pie chart genoemd) de waarden van een variabele tellen samen op tot 100%; de grootte van de 'taartpunt' geeft het aandeel in het totaal aan.

Cirkeldiagram
Bron: Fracties Tweede Kamer, fracties zetels, http://www.dds.nl/~pdc/923000/t/fracttk.htm



d. Beeldstatistiek:
gebruik van allerlei visuele elementen om de gegevens grafisch weer te geven; kan af- of misleidend werken!

Beeldstatistiek



e. Kartogram:
weergave van statistische gegevens in kaartvorm.

Kartogram
Bron: the Uk in figures, Uk wide statistics, http://www.statistics.gov.uk/stats/regional/reg_birt.htm

2. Tweedimensionale grafieken:
a. Lijngrafiek:
de horizontale (X-as) is nominaal of ordinaal; de verticale as geeft reële waarden (kardinale variabelen) weer. De gegevens kunnen zowel als punten (spreidingsdiagram) als in de vorm van een lijn worden weergegeven (of als een combinatie).

Lijngrafiek
Bron: CBS, 1899 - 1989 Negentig jaren statistiek in tijdreeksen ('s Gravenhage 1989).



b. Voorstellingen in een assenstelsel met X- en Y-as, waarbij beide een variabele op interval of ratioschaal weergeven. De gegevens kunnen zowel als punten (spreidingsdiagram) als in de vorm van een lijn worden weergegeven (of als een combinatie).

Spreidingsdiagram
Bron: Lindblad, Statistiek voor historici (Muiderberg 1991).

3. Drie-dimensionale grafieken:

Voorstellingen in een assenstelsel met X-, Y- en Z-as.

Drie-dimensionale grafiek

*Let op* Rekenblad en statistische programma's bieden naast drie-dimensionale grafieken ook mogelijkheden van een '3D-effect'; hierdoor wordt tekentechnisch diepte in een grafiek gesuggereerd.


2.4. De assen van de grafiek

De assen van de grafiek moeten goed worden gekozen. Computerprogramma's bieden vaak 'automatische schaling', waarbij de hoogste en de laagste waarden (afgerond) van de gegevens de grenzen van de grafiek vormen. Dit is niet altijd wenselijk, bijvoorbeeld wanneer het nulpunt ten onrechte wordt weggelaten. Door zelf te manipuleren met de minimum- en maximumwaarden kan de indruk die de grafiek wekt worden beïnvloed.

Figuur 1: Als het nulpunt wordt weggelaten en de Y-as wordt 'uitgerekt' lijken de veranderingen in het Bruto Nationaal Inkomen enorm groot.

Figuur 2: Het Bruto Nationaal Inkomen.
Bron: CBS, http://staltine.cbs.nl

De assen van een grafiek kunnen metrisch of logaritmisch zijn:
a. Metrische schaal: geschikt voor absolute veranderingen.
b. Logaritmische schaal: geschikt voor relatieve veranderingen en voor gegevens die in de loop der tijd een sterke toe of afname te zien geven.

Historici maken veel gebruik van de half- of semi-logaritmische grafiek, waarin de X-as een metrische en de Y-as een logaritmische schaal heeft. Dergelijke grafieken zijn bij uitstek geschikt om de ontwikkeling van bepaalde verschijnselen op de lange termijn (bijvoorbeeld bevolkingsgroei, voedselproductie, prijsontwikkeling) weer te geven.


2.5. Logaritmische assen

a. De uitkomsten van logaritmen zijn exponenten. Bij machtsverheffen is de exponent de macht waartoe je een getal verheft. Bijvoorbeeld: bij 102 is de exponent 2 (tien tot de tweede macht = tien in het kwadraat).
b. Voorbeeld van een logaritme: 10log 100 = 2, want 102 = 10 x 10 = 100 (het grondtal van de logaritme is 10, de exponent is 2). Grondtal en exponent vormen samen een macht.
c. Algemeen: als g log n = x, dan geldt gx = n
g = grondtal
n = macht
x = exponent
d. Meestal werken we met logaritmen met het grondtal 10; daarnaast wordt ook veel gebruik gemaakt van de 'natuurlijke' logaritme met het grondtal e (het 'natuurlijke getal' e ~ 2,718). Wanneer je in een formule alleen log tegenkomt, wordt vrijwel altijd de 10log bedoeld. De natuurlijke logaritme (elog) wordt in formulevorm meestal weergegeven met ln.


2.6. Van metrische naar logaritmische schaal

Voorbeeld: zie boek p. 43
Observatie Metrisch Logaritmisch
Waarde in mln. Goudfrank Verschil met vorige waarde Waarde in mln. Goudfrank Verschil met vorige waarde
1 100,00 - 2,00 -
2 215,44 115,44 2,33 0,33
3 464,16 248,72 2,67 0,33
4 1.000,00 535,84 3,00 0,33
5 2.154,43 1.154,43 3,33 0,33
6 4.641,59 2.487,15 3,67 0,33
7 10.000,00 5.358,41 4,00 0,33

De eerste figuur heeft op de Y-as een metrische schaal (x 1000), de tweede figuur betreft dezelfde gegevens maar dan weergegeven met een logaritmische schaal op de Y-as. Daardoor vervlakt de exponentiële grafiek tot een lineaire.

Metrische grafiek

Logaritmische grafiek

*Tip* Statistische en rekenbladprogramma's bieden in hun grafische menu's de mogelijkheid om te kiezen tussen een metrische en logaritmische schaal, zonder een variabele eerst om te zetten in logaritmes.



les1
© Instituut voor Geschiedenis, Universiteit Leiden 1998
Redactie: P.K. Doorn / M.P. Rhebergen
les3