Tag Clouds sind eine hübsche Sache, die das Web 2.0 hervorgebracht hat und lassen mein Programmiererherz höher schlagen.
Der Algorithmus, der auf Visualhype zum Einsatz kommt – um die Größe und die Farbe der Tags zu berechnen ist schon recht Ok und hat mich eine Weile gefordert. Man kann mit Tags jedoch noch viel mehr Spaß haben. Zum Beispiel für die Helligkeit der Wörter könnte man den Faktor Zeit mit einbeziehen – also wann zuletzt etwas in dem Tag verändert wurde. Wenn es an die Verwandschaft von Tags geht fließt sicher noch mehr Gehirnschmalz, aber wir lieben ja die Herausforderung
Da man als Blogger meist den Fokus auf den Inhalt der Artikel legen möchte ist das Verschlagworten meist Nebensache. Ich für meinen Teil suche Schlagwörter beim Korrekturlesen und liste diese auf. Der Tagline Generator bietet einen guten Ansatz dieses auf Basis des Porter Stemming Algorithmus zu vereinfachen.
Der in PHP umgesetzte Parser durchläuft also Text und entfernt Bindewörter wie the, and oder this (kann man beliebig erweitern). Anschließend wird durch eine Zurückführung auf den Wortstamm der Tags eine weitere Aussortierung vorgenommen.
Auch wenn man durch mathematische und linguistische Regeln viel automatisieren kann, so bleibt beim Bloggen meist ein Überarbeiten nicht aus, da oft Schlagwörter gebraucht werden, die im eigentlichen Kontext nicht vorkommen.
Den Tagline Generator habe ich auf blogrolle gefunden.
