Ik heb een tijdje geleden een Chrome-extensie geschreven om bookmarks bij te houden. Ik gebruik dat wel eens, maar eigenlijk te weinig, omdat ik op veel meer dan één computer zit, en wegens beperkingen kon het ding alleen maar lokaal opslaan en niet in mijn user account.

Vandaagt was ik op het werk en kwam ik iets tegen waarvan ik dacht, dit moet ik noteren. Uit armoe heb ik het dan maar in mijn Google Keep gestoken — maar het was wel de aanleiding om de dingen eens ten gronde te bekijken.

…en zo komt er dan toch maar eens nog een uiteindelijk nutteloos projectje bij: een boolmarkbijhoudtool. Ik had ooit lang geleden zoiets gemaakt, in het gezegende jaar 1997 of zo, een kloon van Yahoo! toen, en hoe moeilijk kan het zijn om dat nog eens te doen? Niet zeer moeilijk, dus.

Een half uur later had ik een website, maar dan begint het natuurlijk. De extensie omturnen dat ze de website gebruikt in plaats van local storage: géén werk. De website behalve gewone bookmarks in een lange lijst met tags ook een categoriesysteem geven? Hmmm. Zijn tags categorieën? Neen, daar zijn ze te vrije vorm voor. Maak ik tags categorieën? Nee, ik wil ze vrije vorm houden. Okay, dan zitten sites in een categorie, nee, in mogelijk meer dan één categorie, en zitten categorieën in andere categorieën. Oh, en mogelijk in meer dan één categorie, want ik wil dat dit mogelijk is:

  • categorie Computers (15)
  • subcategorieën:
    • AI (3)
    • Geschiedenis@
    • Microsoft (2)
    • Programmeren (5)
  • 5 links rechtstreeks onder Computers

In het voorbeeld hierboven zijn er 15 links die onder “computers” of onderliggende categorieën hangen, en is die “Geschiedenis@” een doorverwijzing naar “Geschiedenis > Computers”.

Okay, da’s ook een kwartier werk en het werkt.

En nu data. Waar vind ik data? Aha, ik heb bookmarks die overal verspreid staan, niet in het minst op dit weblog. Export van alle posts in de categorie “‘Links” (er min of meer van uitgaand dat dat posts zullen zijn met links erin, en dat ik er hopelijk niet immens veel een verkeerde of ontbrekende categorie gegeven heb), scriptje om verschillende gevallen te parsen (oude del.icio.us-links, oude pinboard-links, nieuwe links uit mijn extensie, links zomaar in lijsten of paragrafen, …). Een uur of zo later heb ik een kleine tienduizend links met een kleine 2500 tags.

En nu? Categorieën. Hoe? Algoritmisch? Op basis van tags? Manueel? Maar hoe dan?

Welcome to the rabbit hole.

Zó groeien nutteloze projecten dus. Want mijn conclusie was dat het alleen goed zou werken naar mijn goesting als ik het grotendeels manueel zou doen. En dus was het gemakkelijkste een voorlopig tooltje maken om categorieën en tags te beheren en te mergen en te verplaatsen en hier en daar ook nog eens de links aan te kunnen passen en enfin een een uur later was het dit:

…en dan is het nu zaak van die dingen allemaal te klasseren. Ruwweg.

En dan kijken welke van die links nog bestaan, en welke niet meer , en of er van die die niet meer bestaan een link naar archive.org kan gevonden worden. En dan een link checker om periodiek te checken of dingen nog bestaan. En dan zet ik het op mijn VPS en kan ik er van overal ter wereld aan.

Is dat allemaal nuttig? Bah nee! Is dat allemaal nodig? Nog minder! Beantwoordt dat mijn knagende gevoelens van “er is iets verkeerd op het internet” en “ik heb data die NIET GOED GEKLASSEERD IS”?

Ayup.