AOL Keywords Wirbel

AOL eine Liste mit Suchanfragen der letzten 3 Monate von 500.000 Usern zum Download bereitgestellt, die Liste enthält ca. 20 Mio Keywords. Ganz nett, aber der Wirbel der darum gemacht wird ist für mich nicht ganz nachvollziehbar.

20 Mio Keys, 2,1 Gig Dateien mit Suchanfragen, Datum und Uhrzeit, welche Seite hat der User besucht, was hat er danach gesucht und welche Seite hat er dann wie lange besucht … sicher kann man da einiges draus machen … aber ich denke mal die größte „Angst“ ist doch die vor der nun kommenden Spamwelle.

Wer sich die Datei mal angeschaut hat wird feststellen das es einiges zu tun gibt um diese zu nutzen, so werden aus 20 Mio Keys und Suchphrasen mal eben nur noch knapp 7 Mio wenn man Duplikate mal rausschmeißt, wenn man sich dann die verbliebenden Keys mal genauer anschaut, wird man schnell feststellen, dass es noch einiges mehr auszusortieren gibt, so dass am Ende Netto „nicht mehr viel“ nachbleibt.

Die Nutzer/Spammer dieser Liste zu ertappen wird ein Kinderspiel werden, es gibt so viele Phrasen – die ich hier jetzt mal lieber nicht nenne -in der Liste, die diese Liste eindeutig identifizieren und anhand dessen Google dann (in diesem Fall mal wirklich) die Domains die die Liste benutzen automatisch „aussortieren“ kann.

    Mehr von unserem Blog:

    Zeige alle Beiträge