Was ist ein Index?
Grundsätzlich wird als “Index” ein sortiertes Verzeichnis/Register bezeichnet. Aus dem Alltag bekannt, können dies beispielsweise Nachschlagewerke, wie ein Lexikon oder ein Telefonbuch sein. Denn hier sind Informationen nach einer bestimmten Reihenfolge zusammengefasst und geordnet.
Der Index der Suchmaschine Google hingegen umfasst alle von Google gecrawlten und gespeicherten Webseiten. Die Ergebnisseiten (SERPS), die von Google zu bestimmten Suchbegriffen ausgespielt werden sind ausschließlich mit Seiten aus dem Index gefüllt. Daraus folgt, dass alle Seiten, die nicht im Index gespeichert sind auch nicht in den SERPS dargestellt werden und somit für den Nutzer nicht sichtbar sind.
Wie unterscheidet sich der Google Index von einem herkömmlichen Index?
Im Vergleich zu einem Lexikon oder ein Telefonbuch, ist der Google Index nicht statisch, sondern extrem dynamisch. Täglich werden unzählige Seiten aus dem Index entfernt oder hinzugefügt. Einzelne Seiten werden beispielsweise aus dem Index entfernt wenn sie gegen die Google Richtlinien verstoßen oder Webseitenbetreiber diese bewusst aus dem Index ausschließen wollen, da sie vielleicht nicht mehr existieren. Auf der anderen Seite wiederum werden unzählige Seiten täglich dem Index durch sogenannte Crawler hinzugefügt.
Darüber hinaus ist der Google Index deutlich komplexer aufgebaut. Denn hier sind die verschiedenen Webseiten nicht nur alphabetisch geordnet, sondern auch nach zahlreichen Rankingfaktoren. Diese Rankingfaktoren basieren auf den von Google entwickelten Algorithmus und ermöglichen Google den Nutzern zu ihrer Suchanfrage die bestmöglichen Ergebnisse (Webseiten) zu liefern.
Je relevanter die jeweilige Webseite zu der Suchanfrage eingestuft wird, desto höher wird sie in den Suchergebnissen dem Nutzer dargestellt. Wichtig zu wissen: Auch die Rankingfaktoren sind höchst dynamisch und ändern sich durch verschiedene Google Updates ständig. Welche Faktoren konkret das Ranking der Suchergebnisse beeinflussen behandelt Google extrem vertraulich.
Was bedeutet Indexierung?
Oftmals wird der Begriff “indizieren” mit “indexieren” verwechselt oder gleichgesetzt, was aber falsch ist. Grundsätzlich gilt die Indexierung als eine Methode der Informationserfassung. In unserem Fall bedeutet dies die Aufnahme eines Dokumentes in den Index der Suchmaschine.
Dieser Vorgang erfolgt auf Basis verschiedener Crawler, die das World Wide Web durchsuchen und Dokumente an den Index liefern. Diese Dokumente werden dann nach bestimmten Kriterien aufgearbeitet. Beispielsweise werden ihnen Schlagwörter zugeordnet, die thematisch zum Inhalt des Dokumentes passen. Dies sorgt für eine schnellere Auffindbarkeit der Inhalte.
Beispiel aus dem Alltag: Bibliotheken arbeiten ebenfalls mit einem Index. Gibt ein Nutzer ein Schlagwort im System ein, erhält er eine Liste von Büchern, die zu diesem Schlagwort relevant sind.
Nach dem identischen Prinzip arbeitet auch die Suchmaschine Google. Sobald der Nutzer einen Suchbegriff in die Eingabemaske eintippt, durchsucht die Suchmaschine nicht das Internet, sondern den eigenen Index und liefert dem Nutzer alle relevanten Inhalte, die zu der Suchanfrage relevant sind.
Wie indexiere ich Inhalte?
Um eine aktive Seite bei Google indexieren zu lassen stehen Websitenbetreiber verschiedene Möglichkeiten zu.
- Google Search Console: Erstellung & Abgabe einer Sitemap
- Einzelne Seiten indexieren:Google Search Console → URL Prüfung → Indexierung beantragen
Wie verhindere ich die Indexierung?
Auf der anderen Seite wiederum ist es genau so wichtig zu wissen, wie man die Indexierung von Inhalten verhindert. Denn alle Seiten, die aus Sicht des Websitenbetreibers unwichtig sind bzw. nicht in den Suchergebnissen auftauchen sollen, sollten von der Indexierung ausgeschlossen werden. Dies können beispielsweise Seiten sein die:
- Doppelte Inhalte besitzen
- In der Entwicklungsphase sind
- archiviert sind
- und vieles mehr…
Auch hier gibt es wieder mehrere Möglichkeiten eine Indexierung der Seiten zu verhindern:
1. Das Meta-Tag noindex vergeben
2. Seiten/Verzeichnisse über die Robots.txt vom Crawling ausschließen
Welche Rolle spielt die Indexierung im SEO?
Die Indexierung gilt im SEO zweifellos als einer der wichtigsten Bestandteile. Sie ermöglicht SEO´s und Websitenbetreiber einzelne Seiten zu crawlen, indexieren und letztlich in den Suchergebnissen anzeigen zu lassen.