Michel Vuijlsteke's weblog

Tales of Drudgery & Boredom.

De tools maken de man (niet) ii

Ik geef het toe: ik word er een beetje kregelig van, als ik zoiets lees van “met welk programmaatje hebt gij dat gemaakt”. Dat is voor mij de andere kant van de zo mogelijk nog meer irritante vaststelling “PowerPoint zuigt”.

It’s a poor workman who blames his tools, zeggen ze, en ze hebben daar overschot van gelijk in. Een min of meer leesbare grafiek maken, heeft weinig of niets te maken met het programma waarin de grafiek gemaakt wordt.

Gegeven een lijst van gegevens in ongeveer deze vorm, die ik met een query uit de WordPress-database gegenereerd heb en dan geopend in Excel (2007, maar dat doet hier niets ter zake):

post_date posts comments postlength words length/post
02/07/2002 415 36 192918 35726 86
03/07/2002 544 100 295672 54754 101
04/07/2002 645 116 360288 66720 103
05/07/2002 428 85 209634 38821 91

Stap één, de kolommen geselecteerd waarin ik geïnteresseerd ben en insert > line chart gedaan. Dat geeft iets in deze zin (alhoewel: ik heb hier al twee van de drie lijnen op één as gezet, en één op de andere as):

Graf5a

…en dan kan een mens zich gaan uitleven in de Mogelijkheden Van Het Programma. Zoiets bijvoorbeeld:

Graf5b

Woohoo! Groots! 3D! Spectaculair! Onleesbaar! Nutteloos!

Nee, ik ben helemaal een gelover in de Tufte School of Infographics: haal alles weg dat niet absoluut noodzakelijk is, en wees zo eerlijk als mogelijk in het voorstellen van de gegevens.

En daar heb je helemaal geen speciaal tool voor nodig, gewoon wat minimale kennis van om het even welk programma waarin je werkt. In mijn geval is dat Excel 2007, maar het had even goed een oudere versie van Excel kunnen zijn, of Illustrator, of voor mijn part Openoffice.org calc.

Stap één: overbodige kleur weghalen. In het ideale geval en als het missiekritisch is, betrouw ik niet op kleur: een redelijk percentage van de volwassen mannen zijn kleurenblind, niet iedereen heeft een kleurenprinter, kleuren hebben een intrinsieke emotionele waarde, etc., etc.

Graf5c

Hier: de achtergrond weggehaald (deed niets te zake), aantal posts en lengte per post in dezelfde kleur gezet en onderscheiden door het soort lijn (discutabel, ik weet het).

Stap twee: overbodige lijnen weghalen. Al die kaders en de lijnen op de assen, brengen die eigenlijk informatie aan? Nee, niet echt. Dus ze mogen weg. De gridlines, die brengen wel informatie aan, maar ze storen omdat ze te nadrukkelijk aanwezig zijn. Dus die mogen in een lichter grijs komen te staan.

Graf5d

Zo. De grafiek is nu wel heel erg gecomprimeerd in de breedte, dus heb ik ze nog wat uitgerekt. Eens ze uitgerekt was, heb ik de data op de Y-as anders geformatteerd (jaar maand, vertikaal ipv dag/maand/jaar, schuin), en heb ik nog vertikale gridlines toegevoegd ook, dat ik gemakelijker kan zien in welke maand iets gebeurt. En om duidelijk te maken welke lijnen op welke as gevolgd moeten worden, heb ik de labels van de assen dezelfde kleur gegeven als de lijnen.

Dat geeft dan dit:

Graf2

Graf5e

…enfin ja, om maar te zeggen: het tool maakt dus écht niet uit. Koop dit en dit en dit en ge zijt vertrokken.

8 Reacties

  1. Wordt het font niet mee geïnstalleerd met 2007 trouwens? En over welk hebben we het hier dan?

  2. Calibri, in dit geval.
    Maar-het-heeft-niets-met-één-individuele-font-te-maken, aaargh!

  3. “ik word er een beetje kregelig van, als ik zoiets lees van ‘met welk programmaatje hebt gij dat gemaakt'”

    Misschien dat de mensen vooral wilden weten: “hoe hebt u dat eigenlijk gedaan, meneer Vuijlsteke?” Zodat ipv een uitleg voor “hoe maak ik een proper ende sober excel grafieksken” ze de SQL query hadden gekend waarmede gij aan die cijferkens zijt geraakt 🙂

  4. Oh, serieus? 🙂

    Dan moeten ze dat vragen hé!

    select post_date, count(id), sum(length(post_content)) from wp_posts group by year(post_date), month(post_date) en dergelijke, en mutatis mutandis hetzelfde voor comments.

    Stomgaweg niet eens bij stilgestaan dat het dat zou kunnen geweest zijn. Proper is dat.

  5. Ik vroeg mij vooral af: tot op welke hoogte zijn deze data/grafieken automatisch gegegeneerd? Of heeft Michel alle woorden van alle blogposts effectuef opgeteld?

    Om terug te komen bij mijn eeuwige vraag: wanneer slaapt die mens want hij is met zoveel bezig?

  6. Weldus: de data uit de database gehaald met bovenstaande query, en dan geknippenplakt in Excel, en de rest staat hier ook boven.

    Grotendeels huisvlijt, dus. 🙂

  7. Eindelijk…dacht dat ik de enige was die aan “pimp my graph” deed (maar dan richting leesbaarheid, ipv fx). Bovendien zien die cleane graphs er ook veel beter uit. Ik had de volgorde van de series nog geswitched (geeft een betere legende)…en ben niet wild van de stippellijn (gebruik ik eerder voor een trendlijn). Maar dat zijn mss “des gouts et des couleurs qui se discussent pas”, hein?
    Broeva! Haro! voor deze puike post!

Zeg uw gedacht

© 2016 Michel Vuijlsteke's weblog

Thema gemaakt door Anders NorenBoven ↑