R: maar zo wijs

Mijn Excel doet raar — consistent crashen als ik pivottables maak op basis van data met formules erin, zelfs simpele dingen als een concatenate() of een weekday().

En tegelijkertijd is het ook eigenlijk wel een beetje beu om met grafieken op pivottables te werken: als er daar ergens een filter in zit waardoor het aantal kolommen verandert, gaan grafieken daar niet zo proper mee om, bijvoorbeeld. 

En tegelijkertijd loop ik wat tegen de limieten van Excel aan, als het op data aankomt: een paar honderd items, met telkens een reeks cijfers over een periode van een paar jaar, da’s al direct in de miljoenen getallen, en gelijk ze in Holland zeggen, dat loopt niet zo lekker

Deze namiddag zag ik een collega gezwind dingen in R steken en er weer uithalen, en wegens toch niet kunnen slapen dacht ik: ook eens proberen.

Maar zo wijs.

Om te proberen wat data in een tekstfile gezet: observaties van 559 locaties over een periode van twee maand, dat zijn een paar tienduizend lijnen met telkens een paar stukken tekst en een reeksje getallen. Om dat in te lezen: 

ds <- read.csv("~/Documents/Adhese/data.csv", sep=";")

De datum stond in Excelformaat, om dat te converteren:

ds$datum <- as.Date(ds$datum, origin="1899-12-30")

En voilà, alles staat klaar om er vanalles mee te doen. Een pivottable zoals in Excel? Reshape to the rescue!

library(reshape2)
dspt <- dcast(ds, datum ~ plaats, value.var="observatie", sum)

Dat slaat de grote lijst plat in een kleinere van, in dit geval, 61 observaties voor 560 variabelen: de som van de oorspronkelijke observaties per datum en per plaats, voor de laatste twee maand. En om dat dan in een grafiekje te krijgen, bijvoorbeeld:

matplot(dspt, type="l", lty="solid", col=rgb(0,0,0,0.2))

Allemaal 20% doorschijnende zwarte lijntjes:

Screen Shot 2013 05 17 at 01 34 49

Ha! Ik kan mij al zó inbeelden wat voor leutige vragen ik ga kunnen stellen en beantwoord zien.

Ik ga nog serieus moeten loskomen van denken in rijen en kolommen, en wat kaas mogen eten van wiskunde en statistiek, maar hey: dingen bijleren is altijd leutig. 

One Comment

Zeg uw gedacht

Navigatie

Vorige entry:

Volgende entry:

» homepagina, archief

Vriendjes

<insert standard disclaimer>

Alles wat hier staat is mijn eigen opinie. Het wordt niet nagelezen of goedgekeurd door mijn werkgever voor het on-line komt, en ik bied geen enkele garantie voor kwaliteit of correctheid.

Mijn werkgever is het niet noodzakelijk eens met wat ik schrijf, en het spreekt vanzelf dat hij dan ook op geen enkele wijze aansprakelijk kan zijn voor wat ik hier publiceer.