Zurück zur Blogübersicht
Wissenswertes

Bei diesen Gewichtungsverfahren wird davon ausgegangen, dass ein Verfasser ein für den Inhalt sehr wichtiges Keyword eher am Dokumentenanfang als am Ende eines Textes positioniert. Es lassen sich zwei Methoden unterscheiden. Gewichtungsverfahren die sich auf die absolute Position eines Keywords im Dokument beziehen und das sog. Proximity-Verfahren , das den Abstand der Keywords zueinander berücksichtigt. Die Position der Worte wird von den Information Retrieval Systemen durch besondere Parser bestimmt, die es ermöglichen die genaue Position eines Wortes im Dokument festzustellen.
Die Struktur von HTML-Dokumenten lässt sich grob in einen Dokumentenkopf und einen Dokumentenkörper einteilen. Der Dokumentenkopf enthält neben dem Dokumententitel auch Metaangaben in Form von Meta-Tags. Den Informationen im Dokumentenkopf kommt eine hohe Bedeutung zu, da davon auszugehen ist, dass der Verfasser eines Textes den Titel verwendet, um den Inhalt möglichst prägnant zu beschreiben. Viele Suchmaschinen gewichten Worte die sich im Dokumentkopf befinden besonders hoch. Der eigentliche Text eines HTML-Dokuments befindet sich im Dokumentenkörper und ist für die Erfassung und Auswertung eines Themas der wichtigste Bereich.

Die Bewertungssystematik kann durch die Bildung von Klassen vereinfacht werden, indem beispielsweise Keywords, die sich innerhalb der ersten 20 Worte befinden, eine höhere Bewertung erhalten, als Keywords die sich innerhalb eines Bereiches von 100 bis 200 Worten befinden.

Das Proximity-Verfahren beruht auf der Grundüberlegung, dass zwei Worte, die in einem Text näher zueinander vorkommen, einen Text inhaltlich eher repräsentieren als Worte, die weiter voneinander entfernt sind. Es kommt bei Suchanfragen zum Einsatz, die aus mindestens 2 Suchworten bestehen. In der Umsetzung bewerten Suchmaschinen Dokumente differenzierter, wenn Keywords die in Kombination gesucht werden, in den Dokumenten unterschiedlich weit von einander entfernt sind.

Die bisher vorgestellten Bewertungsverfahren können Sie selbst beeinflussen und dirigieren. Bei folgendem Ansatz ist das nicht mehr so leicht das es sich um einen äußeren Einflussfaktor handelt.