Ik ben stekejaloers op Stephen Wolfram’s datavisualisaties. En ik had vroeger data over vanalles (muisbewgingen! toetsaanslagen! programma’s gebruikt!), maar sinds ik op allerlei verschillende computers allerlei dingen doe, is het allemaal wat verwaterd.

Mijn mail, die heb ik in principe nog tot ergens in 1994, maar waar precies de mails van 1994 tot 2004 staan: ik zou er eens heel erg hard naar moeten zoeken.

Ik kan wél gemakkelijk dingen over dit weblog te weten komen, ‘t is toch altijd dat. En ik heb geen Mathematica bij de hand liggen, maar uiteindelijk is er met een paar databasequeries en een gewone spreadsheet ook redelijk wat te visualiseren.

Zoals wanneer ik dingen geschreven heb, de afgelopen tien jaar. Elk puntje is een post, de X-as geeft de jaren weer en de Y-as de uren (klik voor detail):

Screen Shot 2012-03-10 at 12.10.09.png

In 2002-2003 waren er heel veel korte postjes van een paar zinnen, vaak als ik voor de televisie hing. In 2004 heb ik een jaar in mijn trekzetel geleefd. Vanaf midden 2009 zat ik vaak in Zaventem te werken bij Sony, wat ‘s morgens anderhalf uur of meer trein en bus betekende, en dus geen internet. In 2010 ben ik in Gent komen werken, en werd mijn leven wat regelmatiger.

De horizontale strepen zijn automatische posts van links die ik verzamelde (eerst op delicious, daarna op pinboard).

[Om de grafiek te maken, trouwens, vooropgesteld dat het WordPress is dat achter uw weblog zit: in mysql select date(post_date), time(post_date) from wp_posts where post_status='publish'; doen, het resultaat daarvan in Excel plakken en een scatterplot maken met datum in X-as en tijd in Y-as.]

Met nog minder moeite is het mogelijk om te zien wanneer ik op uurbasis gemiddeld post:

Screen Shot 2012-03-10 at 13.51.27.png

[select time_format(post_date,'%H'), count(id) from wp_posts where post_status='publish' group by extract(hour from post_date);]

…of per minuut:

Screen Shot 2012-03-10 at 13.47.49.png

[select extract(hour_minute from post_date), count(id) from wp_posts where post_status='publish' group by extract(hour_minute from post_date)]

(Ik heb hierboven wel de waarden afgekapt wegens dat die automatische posten van delicieus/pinboard het anders vertekenden: )

Screen Shot 2012-03-10 at 13.59.30.png

Post ik meer tijdens de week of in het weekend? Euh nee, niet echt:

Screen Shot 2012-03-10 at 14.20.05.png

[select date_format(post_date,'%W'), count(id) from wp_posts group where post_status='publish' by date_format(post_date, '%W');]

Is er misschien een verschil in uren, afhankelijk van de dag in de week? Nee, ook niet echt heel erg duidelijk (rood is meer schrijven, groen is minder schrijven):

Screen Shot 2012-03-10 at 14.46.42.png

select date_format(post_date,'%W'), time_format(post_date,'%H'), count(id) from wp_posts group by date_format(post_date, '%W'), time_format(post_date, '%H'); en dan een pivot table maken, en conditional formatting op de cellen (en de cijfers in de cellen number formatting ” “, wat ze dus doet verdwijnen, ha!).

Of als ik toch bezig ben met van die heatmapachtige dingen: het aantal flickr-foto’s dat ik per week post? Waarmee het meteen duidelijk is dat ik sinds een tijd minder foto’s online zet, en ook dat de week met foto’s uit Marokko redelijk veruit de week met de meeste foto’s ooit was:

Screen Shot 2012-03-10 at 15.44.18.png

De cijfers hierboven zijn er van uitgaand dat ik voor zover ik weet praktisch nooit naar Flickr verwijs tenzij naar mijn eigen foto’s: select year(post_date), week(post_date), sum((length(post_content)-length(replace(post_content,'flickr.com','')))/length('flickr.com'))/2 from wp_posts where post_status='publish' group by year(post_date), week(post_date);.

En met dezelfde ruwe teltechniek: over welke kinderen spreek ik, opgeteld per maand?

Screen Shot 2012-03-10 at 16.52.40.png

Of: aantal woorden per post? (Ervan uitgaand dat er ruwweg evenveel woorden als spaties in een tekst staan.)

Screen Shot 2012-03-10 at 17.42.04.png

De puntjes zijn de individuele posts, de lichtste lijn is een gemiddelde per week, de donkere lijn een gemiddelde per maand, en de rode stippellijn het gemiddelde op jaarbasis bekeken.

Afijn ja. 🙂