Michel Vuijlsteke's weblog

Tales of Drudgery & Boredom.

Tag: logs

The Matrix

Ik voel mij altijd zo’n beetje Carrie-Anne Moss, als ik naar logfiles van een webserver aan het kijken ben.

the-matrix-reloaded-original

Dan floepen er allerlei regels voorbij, en als het een niet al te druk bezochte website is – eentje die, pakweg, net online gezet is – dan herkent men er de individuele bezoekers in.

Zo van: oh kijk, die is via die site hier terechtgekomen, en nu gaat die naar de kalender kijken… en nu klikt hij door naar dié pagina, en leest hij verder naar dié pagina, en nu is hij weer in de kalender… en nu zal hij weg zijn.

Ik heb vanmorgen een nieuwe website online gepleurd, en dan zet ik een groot terminalvenster open met een tail –f op het log.

tail –f wwwlog | grep -vE '(sites|files|misc)'

en draait dat de hele tijd in de achtergrond, en wacht ik tot de mensen binnenkomen.

log

Ik had één link geplaatst, op Librarything, om vier uur vannacht of zo. Om 5u01 kwam GoogleBot al langs

google1

…en om 6u01 was Yahoo!’s slurp er:

slurp

(Oh ja, ik weet: stom, screenshots van een tekstfile. Maar ‘t is nostalgie, ik heb van tien jaar geleden nog allemaal van die screenshots staan.)

Eens het allemaal online staat en er komt meer dan een paar bezoekers, zet ik mijn terminal op

tail –f wwwlog | grep -vE '(sites|files|misc)'

…dat ik zo ongeveer alleen nog de pagina’s zie, niet meer de css en de javascript en de beelden.

Ik zou dat eigenlijk hele dagen kunnen laten op staan. Op zo’n enorme muur, met veertig grote monitors, en allemaal logfiles en garfieken en dingen.

Mmmm.

De tools maken de man (niet) ii

Ik geef het toe: ik word er een beetje kregelig van, als ik zoiets lees van “met welk programmaatje hebt gij dat gemaakt”. Dat is voor mij de andere kant van de zo mogelijk nog meer irritante vaststelling “PowerPoint zuigt”.

It’s a poor workman who blames his tools, zeggen ze, en ze hebben daar overschot van gelijk in. Een min of meer leesbare grafiek maken, heeft weinig of niets te maken met het programma waarin de grafiek gemaakt wordt.

Gegeven een lijst van gegevens in ongeveer deze vorm, die ik met een query uit de WordPress-database gegenereerd heb en dan geopend in Excel (2007, maar dat doet hier niets ter zake):

post_date posts comments postlength words length/post
02/07/2002 415 36 192918 35726 86
03/07/2002 544 100 295672 54754 101
04/07/2002 645 116 360288 66720 103
05/07/2002 428 85 209634 38821 91

Stap één, de kolommen geselecteerd waarin ik geïnteresseerd ben en insert > line chart gedaan. Dat geeft iets in deze zin (alhoewel: ik heb hier al twee van de drie lijnen op één as gezet, en één op de andere as):

Graf5a

…en dan kan een mens zich gaan uitleven in de Mogelijkheden Van Het Programma. Zoiets bijvoorbeeld:

Graf5b

Woohoo! Groots! 3D! Spectaculair! Onleesbaar! Nutteloos!

Nee, ik ben helemaal een gelover in de Tufte School of Infographics: haal alles weg dat niet absoluut noodzakelijk is, en wees zo eerlijk als mogelijk in het voorstellen van de gegevens.

En daar heb je helemaal geen speciaal tool voor nodig, gewoon wat minimale kennis van om het even welk programma waarin je werkt. In mijn geval is dat Excel 2007, maar het had even goed een oudere versie van Excel kunnen zijn, of Illustrator, of voor mijn part Openoffice.org calc.

Stap één: overbodige kleur weghalen. In het ideale geval en als het missiekritisch is, betrouw ik niet op kleur: een redelijk percentage van de volwassen mannen zijn kleurenblind, niet iedereen heeft een kleurenprinter, kleuren hebben een intrinsieke emotionele waarde, etc., etc.

Graf5c

Hier: de achtergrond weggehaald (deed niets te zake), aantal posts en lengte per post in dezelfde kleur gezet en onderscheiden door het soort lijn (discutabel, ik weet het).

Stap twee: overbodige lijnen weghalen. Al die kaders en de lijnen op de assen, brengen die eigenlijk informatie aan? Nee, niet echt. Dus ze mogen weg. De gridlines, die brengen wel informatie aan, maar ze storen omdat ze te nadrukkelijk aanwezig zijn. Dus die mogen in een lichter grijs komen te staan.

Graf5d

Zo. De grafiek is nu wel heel erg gecomprimeerd in de breedte, dus heb ik ze nog wat uitgerekt. Eens ze uitgerekt was, heb ik de data op de Y-as anders geformatteerd (jaar maand, vertikaal ipv dag/maand/jaar, schuin), en heb ik nog vertikale gridlines toegevoegd ook, dat ik gemakelijker kan zien in welke maand iets gebeurt. En om duidelijk te maken welke lijnen op welke as gevolgd moeten worden, heb ik de labels van de assen dezelfde kleur gegeven als de lijnen.

Dat geeft dan dit:

Graf2

Graf5e

…enfin ja, om maar te zeggen: het tool maakt dus écht niet uit. Koop dit en dit en dit en ge zijt vertrokken.

© 2019 Michel Vuijlsteke's weblog

Thema gemaakt door Anders NorenBoven ↑