Viele Argumente sprechen für die Investition in eine moderne Onsite-Suche: Steigerung der Conversion Rate, verbesserte User Experience und zufriedene Website-Nutzerinnen und -Nutzer. Doch mit welcher Software lässt sich eine Suchfunktion, die mehr bietet als nur eine einfache Volltextsuche, technisch realisieren? Wer eine lizenzkostenfreie Variante mit umfangreichen Möglichkeiten für die Programmierung sucht, sollte sich "Apache Solr" genauer anschauen.
Individuelle Ausgestaltung der Onsite-Suche mit Solr
Absoluter Pluspunkt der Solr-Suchmaschine ist die mächtige Abfragesprache, mit der sich die gewünschten Servicefunktionen nach eigenen Anforderungen programmieren lassen. Sowohl eine einfache Suchmaschine mit Basisfunktionen (etwa für klassische Nachrichtenseiten) als auch ein umfangreiches Rechercheinstrument mit ergänzenden Servicefunktionen (beispielsweise auf Websites von Universitäten oder Bibliotheken) lässt sich mit verhältnismäßig geringem Aufwand umsetzen.
Da die Anforderungen an eine moderne Suchmaschine und die Möglichkeiten mit Solr so vielfältig sind, sollte schon in der Konzeptionsphase genau geplant werden, welche Features für die eigene Zielsetzung zweckdienlich sind und welche nicht. - Nicht alles, was technisch machbar ist, sollte auch umgesetzt werden. Zu den Basisfunktionen, die jede moderne Onsite-Suche bieten sollte, zählen eine Vorschlagsfunktion (Type Ahead), eine Rechtschreibkorrektur sowie Filter und Facettierungen für differenzierte und mehrstufige Suchmöglichkeiten.
Gewichtung und redaktionelle Priorisierung mit Solr
Für Suchmaschinen, die auf sehr große und dynamische Datenmengen angewendet werden, bietet Apache Solr zusätzliche Programmiermöglichkeiten, die eine gewichtete Anzeige der Ergebnisse erlauben. So kann beispielsweise festgelegt werden, dass Beiträge und Dokumente, die besonders häufig aufgerufen wurden, prominenter angezeigt werden. Dadurch werden Inhalte, die sich als hilfreich erwiesen haben, weiteren Nutzerinnen und Nutzern zugänglich gemacht. Um zu verhindern, dass dadurch nur Beiträge angezeigt werden, die aufgrund ihres Alters eine hohe Klickzahl vorweisen, greift als korrigierender Faktor die Aktualität des Dokumentes ein.
Auch redaktionell beeinflussbare Gewichtungen sind mit der Solr-Suchmaschine möglich. Zum einen lässt sich für einzelne Beiträge ein Gewichtungsfaktor bestimmen, sodass ihre Bedeutung künstlich erhöht wird und sie eine bessere Position in der Trefferliste erhalten. Als Steigerung dieser Priorisierung steht die sogenannte Elevation-Funktion zur Verfügung. Darüber kann festgelegt werden, dass ein bestimmter Beitrag bei bestimmten Suchbegriffen grundsätzlich in einer Top-Position dargestellt wird. Nur wenn die genannten Solr-Funktionen optimal in das jeweilige Content Management System integriert sind, lässt sich ein effizienter Workflow etablieren.
Anhand bereits verwendeter Suchphrasen können Trefferlisten optimiert und Listen mit Synonymen gepflegt werden. Auf diese Weise erhalten externe Nutzerinnen und Nutzer Zugang zu Fachbegriffen und unternehmensspezifischen Bezeichnungen. Ein simples Beispiel: Wer einen Kühlschrank kaufen möchte, wird in das Suchfeld auf der Website des Herstellers voraussichtlich "Kühlschrank" eingeben. Da der offizielle Begriff bei einigen Anbietern aber "Kühlgerät" ist, würde eine schlecht programmierte Suche keine Treffer liefern. Durch eine entsprechende Synonympflege weiß die Suchmaschine, wonach der Nutzer sucht und wird passende Treffer anzeigen. Auch hier gilt: Eine effiziente Pflege ist nur auf Basis einer gelungenen CMS-Integration möglich.
Einbinden der Suchergebnisse als RSS-Feed
Mit der reinen Suchabfrage sind die Möglichkeiten von Apache Solr noch nicht ausgeschöpft. Dank zahlreicher Schnittstellen lassen sich die Suchabfragen relativ problemlos in andere Websites einbinden. Dort können die Ergebnislisten nach eigenen Wünschen angezeigt werden, beispielsweise eine automatisierte Liste der zehn neuesten Beiträge zu einem bestimmten Thema. Aus technischer Sicht handelt es sich um nichts weiter als einen RSS-Feed, der auch zur inhaltlichen Personalisierung einer Webseite verwendet werden kann. Ein einfaches Beispiel ist die Ausgabe weiterführender multimedialer Inhalte oder News, die zur Verschlagwortung eines Artikels passen.
Technische Basis von Solr
Wie bei jeder Suchmaschine ist auch bei Solr der Index die Grundlage für alle weiteren Suchanfragen, Auswertungen, Gewichtungen etc. Um Inhalte in den Index zu bekommen, gibt es grundsätzlich zwei Varianten: Crawling und Push-Indizierung. Der erstgenannte Weg wird besonders erfolgreich vom Suchmaschinengiganten Google genutzt, der regelmäßig den "Googlebot" durch das Internet schickt, um neue Inhalte zu finden und zu indexieren. Das Crawling eignet sich vor allem für die Indexierung externer Websites und Daten; für Solr wird es mit der Software Nutch realisiert. Wird die Suchfunktion vorrangig für Inhalte der eigenen Website oder einer internen Anwendung verwendet, bietet sich die Push-Indizierung an, die je nach technischer Plattform in die Solr-Schnittstellen integriert wird. Neue Inhalte werden automatisch an den Solr-Index weitergegeben und dort für kommende Suchanfragen zur Verfügung gestellt.
Für die initiale Einrichtung von Solr bietet es sich an, auf das Fachwissen von Softwareentwicklern zurückzugreifen, wobei der benötigte Zeitaufwand stark von den eigenen Anforderungen abhängig ist. Während Suchmaschinen mit geringem Funktionsumfang verhältnismäßig schnell umgesetzt werden können, bringen zusätzliche Servicefunktionen größeren Aufwand mit sich. Bei umfangreicher Nutzung und vielen Anforderungen sollte zuerst ein ausgereiftes inhaltliches Konzept erstellt werden. Sobald die einmalige Einrichtung der Solr-Suchmaschine abgeschlossen ist, reduziert sich der Pflegeaufwand. Nur für redaktionelle Gewichtungen und Priorisierungen sind regelmäßige Anpassungen notwendig. Diese können allerdings problemlos ohne Programmierkenntnisse umgesetzt werden.
Fazit: Die Onsite-Suche mit Solr bietet großen Nutzen bei überschaubarem Aufwand
Lizenzkostenfrei, umfangreiche Programmiermöglichkeiten, geringer Pflegeaufwand - Mit diesen drei Aspekten punktet die Solr-Suchmaschine von Apache und drängt sich als Lösung für die Einrichtung einer Onsite-Suche auf. Selbstverständlich gibt es auch alternative Programme, etwa ElasticSearch oder die kostenpflichtigen Tools Intrafind und Google Search Appliance, aber die Projekterfahrung zeigt, dass mit Solr schöne Ergebnisse erzielt werden können. Wer mit dem Gedanken spielt, die Onsite-Suche zu optimieren, sollte Apache Solr definitiv in Erwägung ziehen.
Welche Lösung ist die Richtige?
Bei einer kostenlosen Erstberatung geben wir Ihnen einen Überblick über aktuelle Technologien zur Realisierung einer Onsite-Suche für Ihre Website.