Elasticsearch

Elasticsearch ist eine flexible und verteilbare Open Source Such- und Analytics-Engine. Sie ist in der Programmiersprache Java geschrieben und baut auf der populären Suchbibliothek Lucene auf. 

 

Aus folgenden Gründen setzen wir auf Elasticsearch:

  • Sprachunabhängig dank REST (JSON) API. Greifen Sie mit PHP, Ruby, Java, Scala, Groovy oder einer anderen Sprache auf die Suchfunktionen von Elasticsearch zu.
  • Suchergebnisse werden fast in Echtzeit zurückgeliefert.
  • Elasticsearch wurde von Anfang an als verteilte Suchlösung umgesetzt.
  • Gegenüber Ausfällen von einzelnen Servern ist ein Elasticsearch-Cluster tolerant.
  • Ein Cluster kann eine Vielzahl von Indizes aggregieren. Es ist möglich, ein oder mehrere Indizes innerhalb eines Clusters abzufragen. Index Aliase können „on the fly“ erzeugt werden. Dies reduziert Ausfallzeiten bei Neuindizierung oder Schema-Änderung enorm bzw. vermeidet solche gänzlich.
  • Unterstützung von Echtzeit-Analysen.
  • Umfangreiches Elasticsearch-Ökosystem.

Auszug Leistungen im Bereich Elasticsearch:

  • Architekturdesign und -review von Search-Driven-Applications basierend auf Elasticsearch.
  • Tuning & Performance Optimierung.
  • Migration von Apache Solr oder FAST ESP auf Elasticsearch.
  • Coaching: hierbei können Sie von unseren Erfahrungen lernen.
  • Entwicklung: wir realisieren auch gerne Ihre neue Suche mit Hilfe von Elasticsearch in den Bereichen Intranet (Enterprise-Suche) und Internet (Homepage, Shop, E-Commerce).

Blog-Posts zu ElasticSearch

von Peter Soth

Competitive Intelligence: Suchmaschinen im Kontext von Business Intelligence

Im  aktuellen BI Spektrum ist von uns ein Artikel bzgl. des Einsatzes von Suchtechnologien im Kontext von Competitive Intelligence erschienen.

Weiterlesen …

von Peter Soth

Artikel von exensio im aktuellen JavaSPKETRUM // Schweizer Taschenmesser für Daten - Serverlose Suchmaschinen

In der aktuellen Ausgabe des JavaSPEKTRUM ist von mir ein Artikel mit dem Titel »Schweizer Taschenmesser für Daten - Serverlose Suchmaschinen« erschienen. In diesem zeige ich auf, dass sich Suchtechnologie noch für mehr, als nur Volltextsuche eignet.

Weiterlesen …

von Peter Soth

Query Turbo für SQL

In diesem Blogpost möchte ich aufzeigen, dass sich Suchmaschinen (in diesem Blogpost gehe ich auf Elasticsearch ein, das wie Apache Solr auf Apache Lucene basiert) auch ausgesprochen effektiv als Turbo für SQL-Queries verwenden lassen. SQL-Queries neigen ab einer gewissen Komplexität (hierarchisch, viele Aggregationen bzw. Joins) dazu, langsam zu werden. So entstehen beispielsweise in Portalen komplexe SQL Statements bei der Abfrage von Personalisierungsregeln (wer darf was sehen). Als prominentes Beispiel kann man hier das Liferay Portal erwähnen. Seit der Liferay-Version 6.2 [1] wird beim Asset Publisher ein Lucene Index anstelle von Datenbankabfragen eingesetzt.

Weiterlesen …

von Peter Soth

OLAP Cube vs. Elasticsearch

In diesem Blog-Post möchte ich die Möglichkeiten aufzeigen, die Elasticsearch im Bereich Business Analytics bietet. Als Basis benutzte ich wiederum Testdaten aus der Publikation »Excel 2010 im Controlling« [1], das im Verlag Rheinwerk (früher Galileo Computing) erschienen ist. Diesmal ist es eine CSV-Datei mit 1,5 Millionen Zeilen. Da diese für Excel zu umfangreich ist (~1 Million Zeilen Limit in Excel 2007), wird im Buch PowerPivot und OLAP Cubes (auch als Datenwürfel bezeichnet) in Kombination mit dem Microsoft SQL Server benutzt.

Weiterlesen …