Long tail in zoekopdrachten

Ik was er nu echt heilig van overtuigd dat ik een heel artikel geschreven had over long tail-effecten in de zoekopdrachten die mensen tot dit weblog leidden, maar nee: onvindbaar in de archieven.

Het researchmateriaal heb ik nochtans min of meer teruggevonden, dus helemaal gehallucineerd is het ook niet. Het is zondag, en ik heb geen zin om er heel veel over na te denken, dus een beetje en vrac de cijfers.

De gegevens zijn afkomstig van de logfiles van woensdag 13 december tot en met woensdag 27 december 2006. Tijdens die periode kwamen 28581 mensen op mijn weblog terecht via een zoekopdracht op een search engine (Google, Yahoo!, MSN, …). Er waren 10918 unieke zoekopdrachten, van ” anne of green gables”dvd free download tot zx spectrum emulator.

De twintig meest gebruikte zoekopdrachten op die twee weken, met het aantal keer dat bezoekers ermee op mijn weblog terecht kwamen:

  1. nieuwjaarsbrief (5958)
  2. porno (624)
  3. tara reid (462)
  4. chinese tekens (303)
  5. bloot (249)
  6. japanse tekens (227)
  7. photoshop CS3 crack (189)
  8. vicky jolling (184)
  9. days of our lives (120)
  10. cs3 crack (119)
  11. tattoo (119)
  12. michel (117)
  13. blog zog (114)
  14. waar feest guy (110)
  15. photoshop CS3 serial (109)
  16. japanse namen (108)
  17. tetten (94)
  18. photoshop cs3 keygen (82)
  19. naakt (80)
  20. willys en marjetten (80)

Zelfs hier is het al duidelijk dat er veel herhaling is. De eerste honderd zoektermen voor die twee weken net voor nieuwjaar, verantwoordelijk voor 12.304 bezoekers, even op een rij gezet en gegroepeerd, geeft dit:

  1. nieuwjaarsbrief  (6493)
  2. Chinese (of Japanse) tekens (of letters) (of alfabet) (voor naam / tattoo) (1008)
  3. Adobe Photoshop CS3 crack (802)
  4. porno (624)
  5. Tara Reid (495)
  6. Michel Vuijlsteke / Vuijlsteke / blog zog / Michel (362)
  7. bloot (249)
  8. Vicky Jolling (208)
  9. Willy’s en Marjetten (158)
  10. Waar Feest Guy? (134)
  11. days of our lives (120)
  12. tattoo (119)
  13. M-Kids (naakt) (109)
  14. tetten (94)
  15. naakt (80)
  16. Natalia (78)
  17. second life (72)
  18. blog (67)
  19. naakte bv (66)
  20. hutsepot (64)
  21. Katrien Schotte (naakt) (62)
  22. foto kerstboom (56)
  23. CARPETLAND (52)
  24. kinder porno (52)
  25. kaat en co (46)
  26. Julie Taton (nue) (43)
  27. Trifle (43)
  28. Inger Nilsson (41)
  29. grappige clips (38)
  30. kerstboom foto (38)
  31. veerle dobbelaere (37)
  32. weblog (34)
  33. PS-politica wiens relatie met Rik Daems (29)
  34. hamburg mannheimer (28)
  35. powerpoint (28)
  36. kinderkutjes (27)
  37. Tetten bloot (26)
  38. tales of drudgery (24)
  39. cystofix (22)
  40. francesca vanthielen naakt (21)
  41. hoogbegaafd (21)
  42. idool 2003 (20)
  43. roos van acker naakt (20)
  44. thomas de soete (20)
  45. kerstverhaal (19)
  46. lange woorden (19)
  47. het project belspel (18)
  48. hutsepot recept (18)

Let wel: dit zijn dus enkel de eerste honderd resultaten. Als ik ze allemaal afga, dan komen er voor de zoektermen in deze lijst nog meer resultaten bij—variaties rond Hamburg Mannheimer, allerlei versies van allerlei bekende en minder bekende mensen die er telkens in voornaam/achternaam in staan of achter/voornaam of met naakt of bloot erbij, en zo verder.

Zoals vaak in dergelijke situaties, is er hier ook sprake van een long tail-effect: een klein aantal zoekopdrachten zijn verantwoordelijk voor de overgrote meerderheid van de bezoekers, en het overgrote deel van de zoekopdrachten komt heel erg weinig voor.

In de praktijk, aan de kopkant van de long tail (zie ook hierboven):

  • één zoekterm komt 5958 keer voor
  • één zoekterm komt 624 keer voor
  • één zoekterm komt 462 keer voor
  • één zoekterm komt 303 keer voor
  • één zoekterm komt 249 keer voor
  • één zoekterm komt 227 keer voor
  • één zoekterm komt 189 keer voor
  • één zoekterm komt 184 keer voor
  • één zoekterm komt 120 keer voor
  • twee zoektermen komen 119 keer voor

…en aan de staartkant van de long tail:

  • 8458 zoektermen komen precies één keer voor
  • 1391 zoektermen komen twee keer voor
  • 431 zoektermen komen drie keer voor
  • 171 zoektermen komen vier keer voor
  • 101 zoektermen komen vijf keer voor
  • 67 zoektermen komen zes keer voor
  • 43 zoektermen komen zeven keer voor
  • 28 zoektermen komen acht keer voor
  • 21 zoektermen komen negen keer voor
  • 24 zoektermen komen tien keer voor

Dat convergeert allemaal redelijk snel naar allerlei wiskundige dinges, en dat alles in een grafiekje gezet, met twee logaritmische assen:

zoekopdrachten

De as links is hoeveel zoekopdrachten er zijn, en de as onderaan is hoeveel keer zo’n zoekopdracht voorkomt. Euh. Ofzo. Ik moet nog eens nadenken over een presentabele manier van presenteren. :)

8 Comments

Zeg uw gedacht

Navigatie

Vorige entry:

Volgende entry:

» homepagina, archief

Vriendjes

<insert standard disclaimer>

Alles wat hier staat is mijn eigen opinie. Het wordt niet nagelezen of goedgekeurd door mijn werkgever voor het on-line komt, en ik bied geen enkele garantie voor kwaliteit of correctheid.

Mijn werkgever is het niet noodzakelijk eens met wat ik schrijf, en het spreekt vanzelf dat hij dan ook op geen enkele wijze aansprakelijk kan zijn voor wat ik hier publiceer.