Unser Blog

Inverse Dokumenthäufigkeit - Bild
InWissenswertes

Inverse Dokument-häufigkeit

Die Inverse Dokumenthäufigkeit beschreibt die Gewichtung eines bestimmten Terms in Bezug auf alle indexierten bzw. in der Datenbank vorhandenen Dokumente. Das bedeutet, dass ein Term an Gewichtung zunimmt je seltener dieser in der Gesamtzahl der Dokumente vorkommt. Die...

Das Vektorraummodell - Bild
InWissenswertes

Das Vektorraummodell

Das Vektorraummodell stellt eines der bekanntesten Verfahren aus der Welt der Information Retrieval-Systeme dar. Es wurde ursprünglich im Rahmen der Arbeiten am SMART-Projekt entwickelt. SMART ist ein experimentelles Retrievalsystem, das von Gerard Salton und seinen...

Keyword-Dichte - Bild
InWissenswertes

Keyword-Dichte

Die Keyword-Dichte beschreibt die Bedeutung eines bestimmten Suchterms in einem Text. Vorreiter dieser Idee ist das Zipfsche Gesetz. “Das zipfsche Gesetz, nach dem Harvard-Professor für Linguistik George Kingsley Zipf (1902-1950) benannt, korreliert die empirisch...

Bewertungsverfahren - Bild
InWissenswertes

Bewertungs- verfahren

Jede Suchmaschine verwendet verschiedene Verfahren, um die Platzierung einer Seite zu bestimmen. Dabei sind die Algorithmen der großen Anbieter relativ ähnlich ausgelegt. Sie unterscheiden sich oft nur in der Bewertung der verschiedenen Verfahren. Von welchen...

Architektur von Google - Bild
InWissenswertes

Architektur von Google

Den Aufbau von Google zu analysieren gestaltet sich schwierig, da keine Veröffentlichung über Architektur und Struktur der derzeitigen Arbeitsweise von Google einzusehen ist.

Internet-Crawler - Bild
InWissenswertes

Internet-Crawler

Internet-Crawler sind auf Hochleistung optimierte Programme die laufend das Internet und andere Elemente des World Wide Web durchforsten. Der Unterschied zwischen Robot Suchmaschinen und Webkatalogen besteht darin das die Aufnahme von Dokumenten in den Datenbestand der...