WDF*IDF für mehr Relevanz in Suchmaschinen

Mit der Formel WDF*IDF lässt sich ermitteln, in welchem Verhältnis bestimmte Wörter innerhalb eines Textes oder einer Website im Verhältnis zu allen potentiell möglichen Dokumenten gewertet werden. Diese Formel kann für die Optimierung auf der Website (Onpage Optimierung) genutzt werden, um die Relevanz einer Website für Suchmaschinen zu erhöhen, ohne dass dabei die Keyword-Dichte allein eine Rolle spielt.

Keyword Density ist tot

Früher (bei vielen leider auch heute noch) wurden Texte nach dem Motto erstellt: 300 Wörter, Keyworddichte 3%, also wurde in dem Text 9x das Keyword untergebracht und alle waren glücklich. Mittlerweile sind die Suchmaschinen aber so schlau geworden, dass sie sich von einer bestimmten Menge an Keywörtern nicht mehr beeindrucken lassen. Wer also einen Text mit 3000 Wörtern schreibt und das Keyword 90x verwendet, ist nicht automatisch die Nummer 1 im Suchmaschinenergebnis. Heute werten Suchmaschinen bestimmte Merkmale in den Texten.

Zum Hauptkeyword werden heute auch Beiworte gebraucht, die in einem Zusammenhang mit dem Keyword stehen.

WDF

WDF ist die Abkürzung für „within document frequency“. Hierbei wird festgehalten, wie relativ häufig ein Term (also ein Wort oder eine Kombination) innerhalb eines Textes vorkommt. Dieser Wert wird ins Verhältnis zum relativen Vorkommen aller übrigen Terme eines Textes bzw. Dokumentes oder einer Website gesetzt. Zur Berechnung wird schließlich ein Logarithmus verwendet.

Der Logarithmus verhindert, dass bei der Berechnung eine enorme Erhöhung des Hauptkeywords zu einem besseren Wert führt. Während die Keyword-Dichte lediglich die prozentuale Verteilung eines einzelnen Wortes in Bezug auf die Gesamtwortzahl eines Textes berechnet, bezieht WDF (die Within-Document-Frequency) auch das Verhältnis aller im Text verwendeten Wörter mit ein.

IDF

Mit IDF wird die Formel zur Berechnung der Termgewichtung komplett. IDF berechnet die „inverse document frequency“. Damit wird WDF ein Korrektiv hinzugefügt. Die Berechnung der Inverse Document Frequency ist wichtig, um die Häufigkeit an Dokumenten zu einem bestimmten Term mit einzubeziehen. Die IDF setzt die Anzahl aller bekannten Dokumente ins Verhältnis zur Zahl der Texte, welche den Term enthalten.

Somit wird mit IDF ermittelt, wie relevant ein Text oder Dokument hinsichtlich eines bestimmten Keywords ist.

Beide Formeln miteinander multipliziert ergeben die relative Termgewichtung eines Dokuments im Verhältnis zu allen potentiell möglichen Dokumenten, die das gleiche Keyword enthalten. Um ein nützliches Ergebnis zu erhalten, muss diese Formel für jedes sinntragende Wort innerhalb eines Textdokuments durchgeführt werden.

Je mehr Daten für die Berechnung von WDF*IDF herangezogen werden, desto präziser sind die Ergebnisse.

Nutzen für SEO durch WDF*IDF

Wenn von WDF*IDF bei der Suchmaschinenoptimierung gesprochen wird, zielt der User von gängigen Tools darauf ab, Texte einer Website bzw. Unterseite möglichst einzigartig zu gestalten, damit Suchmaschinen diese zu einem bestimmten Suchbegriff aufgrund dieser Einzigartigkeit weit vorn in den SERP listen. Wurde bisher vor allem die Keyworddichte als Maßstab für suchmaschinenoptimierte Texte herangezogen, stellt die Formel WDF*IDF nun eine weitaus präzisere Möglichkeit zur Optimierung von Content dar.

Da die Suchmaschine immer mehr versucht, den semantischen Zusammenhang der Begriffe zu deuten, kann es von Vorteil sein, den Content einer Webseite auch semantisch zu optimieren. Dies wird als Latent Semantic Optimization bezeichnet.

Zur Bestimmung der Keywords, die idealerweise im Website Content zur Optimierung benutzt werden sollten, kann ein WDF*IDF-Tool dienen. Denn mit Hilfe eines WDF*IDF-Tools können Texte nicht nur hinsichtlich eines bestimmten Keywords optimiert werden, sondern die Tools geben auch Hinweise darauf, welche weiteren Terme ein Text enthalten muss, um möglichst einzigartig zu sein. Dadurch kann die Webseite in Suchmaschinen ein besseres Ranking erhalten.

Nachteile der WDF*IDF Formel

Wenn Texte anhand der Termgewichtung optimiert werden sollen, muss sich der Anwender bewusst sein, dass alle Elemente seiner Website mit in die Analyse einbezogen werden. So zählen auch Überschriften für Kategorien sowie Produktbezeichnungen in Online-Shops mit in die Gewichtung. Vor allem für Online-Shops, die auf einer Seite lediglich ein Produkt beschreiben wollen, ergibt sich mit der WDF*IDF-Formel eine eher suboptimale Möglichkeit zur Verbesserung des Contents. Denn für diese Art der OnPage-Optimierung wird in der Regel viel Text benötigt. Dies ist der Tatsache geschuldet, dass die Formel viel weiter greift und den Wert jedes Terms innerhalb des Dokuments berechnet.

Darüber hinaus berücksichtigt allein die Formel WDF*IDF nicht, dass Suchbegriffe auch in einem Absatz gehäufter vorkommen können, dass Stemming-Regeln (ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm) zurückgeführt werden)gelten könnten oder dass ein Texte verstärkt mit Synonymen arbeitet.

« Back to Glossary Index