INFO: Version 18.xZusatzmodul Core Classic

Einstellungen Indexierung - Indexierung

In den Einstellungen einer Suchekonfiguration können Sie im Register "Indexierung" grundlegende Informationen zur Indexierungseinstellung vornehmen.

Volltextsuche - Einstellungen Indexierung (Indexierung)
Volltextsuche - Einstellungen Indexierung (Indexierung)

Bedienung

'Start-URL':

In diesem Feld tragen Sie den Pfad ein, bei dem die Indexierung beginnen soll. Ausgehend von dieser Datei werden alle verlinkten Dateien rekursiv indiziert.
Die Start-URL stellt meist die Startseite einer Präsenz dar.
Ab Version 005.058.042.000 können Sie auch mehrere Startpfade angegeben werden.
Mehrere Pfadangaben trennen Sie durch das Pipe-Zeichen |. Der letzte Eintrag darf nicht mit einem Pipe-Zeichen enden!
Beispieleintrag:
/base/index.php|/base-en/index.php

'Durchsuchbare Bereiche':

In diesem Feld können Sie optional einen Pfad eintragen, auf den sich die Indexierung beschränken soll.
Auf diese Weise können Sie z.B. bei Start-URL /base/index.php verhindern, dass ein darüber verlinkter anderer Bereich (z.B. /base-en/index.php) auch mit indexiert wird. In diesem Fall tragen Sie hier /base/ ein.
Beachten Sie, dass eine Pfadangabe ohne endendem Schrägstrich (Slash) alle Verzeichnisse einschliesst, die mit der angegebenen Zeichenfolge beginnen (/base durchsucht also z.B. /base/ und /basel/).
Beispieleintrag:
/base/

'Auszuschließende Pfade':

In diesem Feld können Sie optional die Pfade eintragen, die von der Indexierung nicht erfasst werden sollen. Auf diese Weise können Bereiche oder Dateien von der Suche ausgeschlossen werden.
Mehrere Pfadangaben trennen Sie durch das Pipe-Zeichen |. Der letzte Eintrag darf nicht mit einem Pipe-Zeichen enden!
Zu beachten ist folgende Kennzeichnung:
Die Angabe "/_vti" schliesst alle "_vti...." Verzeichnisse im Wurzelverzeichnis aus, also auch "_vti_log".
Die Angabe"/_vti/" schliesst alle "_vti" Verzeichnisse im Wurzelverzeichnis aus, also nicht "_vti_log".
Die Angabe "//_vti/" schliesst nur das "_vti" Verzeichnis direkt auf oberster Ebene (DocumentRoot) aus, nicht "_vti" Verzeichnisse in Unterverzeichnissen.
Beispieleintrag:
/base-en/|/base-en/news/basel.php|/base-fr/

'Auszuschließende Querystrings':

In diesem Feld können Sie optional die Querystrings eintragen, die von der Indexierung nicht erfasst werden sollen.
Mehrere Strings trennen Sie durch das Pipe-Zeichen |. Der letzte Eintrag darf nicht mit einem Pipe-Zeichen enden!
Zu beachten ist folgende Kennzeichnung:
Die Angabe "view" schliesst alle "view..." Strings aus, also auch "viewmode" (z.B. viewmode=print).
Beispieleintrag:
searchTerm=|viewmode|document

'Auszuschließende Dateiendungen':

In diesem Feld können Sie optional die Dateiendungen eintragen, die von der Indexierung nicht erfasst werden sollen.
Mehrere Dateiendungen trennen Sie durch das Pipe-Zeichen |. Der letzte Eintrag darf nicht mit einem Pipe-Zeichen enden!
Zu beachten ist folgende Kennzeichnung:
Die Angabe "doc" schliesst alle "doc..." Endungen aus, also auch "docx".
Beispieleintrag:
doc|shtml

'Zu reduzierende Zeichen':

In diesem Feld können Sie optional die Zeichen eintragen, die aus der URL entfernt werden sollen.
Hiermit ist es möglich, eine Seite indexieren zu lassen, aber alle anderen Links auf die selbe Seite auszuschließen.
z.B.: [\?&]navid=\d+
Die Seite /verzeichnis/index.php wird indexiert, die Seite /verzeichnis/index.php?navid=1234567 wird aber nicht erfasst.
Sollen alle Seiten mit dem Querystring ausgeschlosssen werden, muss 'Auszuschließende Querystrings' verwendet werden.
Mehrere Zeichen trennen Sie durch das Pipe-Zeichen |. Der letzte Eintrag darf nicht mit einem Pipe-Zeichen enden! Der Einsatz von regulären Ausdrücken ist möglich.
Beispieleintrag:
[\?&]navid=\d+

'URLs reduziert hinzufügen':

Ist dieser Parameter aktiviert, wird eine URL auch dann reduziert dem Suchindex hinzugefügt, wenn diese nur bzw. schon beim ersten Treffer mit URL-Parameter verlinkt ist.
(ab CMS Version 008.000.117.000 verfügbar)

'In Wörtern zu berücksichtigende Sonderzeichen':

In diesem Feld können Sie optional die Sonderzeichen eintragen, welche innerhalb von Wörtern bei der Suchindexierung berücksichtigt werden sollen. Die Sonderzeichen geben Sie ohne Trennzeichen getrennt an, also z.B. für das @ und Pipe-Zeichen so: @|
Unterstützt werden derzeit folgende Sonderzeichen zur Angabe: @|/&.-+
Ein Dollarzeichen am Wortbeginn wird bereits im Standard unterstützt.
Beispiel-Suchbegriffe:
we@home , dies & das , 1/2 , domain.tld , links|rechts , CMS-Lizenz , dies+das , $year
Weitere Einstellungsmöglichkeiten, siehe unten.

'Trennzeichen':

In diesem Feld können Sie optional das Zeichen eintragen, über das zusammengesetzte Wörter mit allen Wörtern in den Suchindex mit aufgenommen werden können.
Mit dem Trennzeichen "-" wird z.B. Schiff-fahrt als Schiff und fahrt in den Index geschrieben, wobei Schifffahrt lediglich als Schifffahrt erfasst wird.)
Beispieleintrag:
-

'Suchvorschläge für folgende Verzeichnisse separat speichern':

In diesem Feld können Sie optional die Verzeichnisse eintragen, zu welchen Suchvorschläge (searchSuggest) separat gespeichert werden sollen. Nach einem Suchindex-Durchlauf kann über die wSearchSuggest.php Abfrage auf diese separaten Suchvorschläge zurückgegriffen werden (z.B. über die Einstellungen der Suchergebnisliste).
Mehrere Zeichen trennen Sie durch das Pipe-Zeichen |. Der letzte Eintrag darf nicht mit einem Pipe-Zeichen enden!
Beispiel:
/base/ueber-uns|/base/historie

'Tiefe der Indexierung':

Über diese Auswahlbox definieren Sie, bis zu welcher Tiefe die Indexierung erfolgen soll. Dies entspricht nicht der Verzeichnistiefe, sondern der Tiefe, in der die entsprechende Seite über die Verlinkung gefunden wird.

'Benutzer, unter dem sich der Robot anmeldet':

Über die Auswahl Icon können Sie optional bei lizenzierter personalisierter Suche einen Benutzer angeben, der für die Indexierung personalisierter Dateien herangezogen wird. Über das Papierkorb-Symbol Icon können Sie einen bereits eingetragenen Benutzer wieder aus dem Feld löschen.
Es empfiehlt sich, einen Benutzer vom Typ Administrator anzugeben, der auf alle Dateien Ansichtsrecht hat. In der Suchausgabe selbst wird das Ansichtsrecht des jeweils eingeloggten Benutzers geprüft.

'Weitere Einstellungsmöglichkeiten:':

  • Punkt am Wortanfang
    Tragen Sie hierzu manuel in der xxx.wSearchBot.php folgendes Tag innerhalb des wd:robot Tags hinzu:
    <allowDotAtTheBeginningOfAWord active="1"/>