Michel Vuijlsteke's weblog

Tales of Drudgery & Boredom.

R: maar zo wijs

Mijn Excel doet raar — consistent crashen als ik pivottables maak op basis van data met formules erin, zelfs simpele dingen als een concatenate() of een weekday().

En tegelijkertijd is het ook eigenlijk wel een beetje beu om met grafieken op pivottables te werken: als er daar ergens een filter in zit waardoor het aantal kolommen verandert, gaan grafieken daar niet zo proper mee om, bijvoorbeeld. 

En tegelijkertijd loop ik wat tegen de limieten van Excel aan, als het op data aankomt: een paar honderd items, met telkens een reeks cijfers over een periode van een paar jaar, da’s al direct in de miljoenen getallen, en gelijk ze in Holland zeggen, dat loopt niet zo lekker

Deze namiddag zag ik een collega gezwind dingen in R steken en er weer uithalen, en wegens toch niet kunnen slapen dacht ik: ook eens proberen.

Maar zo wijs.

Om te proberen wat data in een tekstfile gezet: observaties van 559 locaties over een periode van twee maand, dat zijn een paar tienduizend lijnen met telkens een paar stukken tekst en een reeksje getallen. Om dat in te lezen: 

ds <- read.csv("~/Documents/Adhese/data.csv", sep=";")

De datum stond in Excelformaat, om dat te converteren:

ds$datum <- as.Date(ds$datum, origin="1899-12-30")

En voilà, alles staat klaar om er vanalles mee te doen. Een pivottable zoals in Excel? Reshape to the rescue!

library(reshape2)
dspt <- dcast(ds, datum ~ plaats, value.var="observatie", sum)

Dat slaat de grote lijst plat in een kleinere van, in dit geval, 61 observaties voor 560 variabelen: de som van de oorspronkelijke observaties per datum en per plaats, voor de laatste twee maand. En om dat dan in een grafiekje te krijgen, bijvoorbeeld:

matplot(dspt, type="l", lty="solid", col=rgb(0,0,0,0.2))

Allemaal 20% doorschijnende zwarte lijntjes:

Screen Shot 2013 05 17 at 01 34 49

Ha! Ik kan mij al zó inbeelden wat voor leutige vragen ik ga kunnen stellen en beantwoord zien.

Ik ga nog serieus moeten loskomen van denken in rijen en kolommen, en wat kaas mogen eten van wiskunde en statistiek, maar hey: dingen bijleren is altijd leutig. 

1 Reactie

  1. Dat is de schoonste grafiek die ik ooit al gezien heb. Ik zou dat zo tegen mijn muur hangen.

Zeg uw gedacht

© 2016 Michel Vuijlsteke's weblog

Thema gemaakt door Anders NorenBoven ↑