Big Data Expertenrunde bei Dr. Hornecker in Freiburg

von Peter Soth

Letzten Mittwoch hatte ich die Gelegenheit, bei Dr. Hornecker Software-Entwicklung und IT-Dienstleistungen über Elasticsearch im Kontext von Big Data zu referieren.

Hierbei habe ich die Vorteile von Elasticsearch und NoSQL aufgezeigt. In diesem Zusammenhang möchte ich darauf hinweisen, dass man bereits mit kleinen (strukturierten bzw. unstrukturierten) Datenmengen sinnvolle Anwendungen realisieren kann, die mit der gealterten SQL-Technologie nicht so einfach - wenn überhaupt - umsetzbar sind.



Des Weiteren habe ich folgende Einsatzszenarien für Elasticsearch skizziert:

  • NoSQL Document Store (JSON)
    • Bigdata mittels Sharding
    • Keine Transkationen im Vergleich zu MongoDB
  • Query Engine für strukturierte Daten
    • Daten werden in SQL DB gespeichert
    • Abfragen laufen über Elasticsearch
    • Vereinfachung von komplexen SQL Queries (insb. bei hierarchischen Abfragen)
  • Volltextsuche bzw. Facettierte Suche 
    • Wissensportale
    • Suche in strukturierten (Datenbanken, CRM, ERP, …) sowie unstrukturierten Daten (Content, Dokumente)
  • Geo-Suche (viel einfacher als bei Oracle DB)
    • PLZ-Umkreissuche (Filialen)
    • Flottenmanagement
    • Logistik
  • Logfile-Analyse
    • IT-Forensik
    • Sortimentslücken entdecken
  • Business Analytics (schneller und kostengünstiger vgl. mit DW)
    • Competitive Intelligence (Search Engine sehr gut geeignet, wenn Mapping über eindeutige Id wie EAN Code nicht möglich)
    • Datawarehouse (Aggregationen ersetzen Dimensionen im Star-Schema)
  • Alerts (Percolator -> indiziertes Dokument passt zu gespeicherter Query)
    • News Alerts
    • Internet Of Things (Alarm bspw. Temperatur steigt über Schwellwert)
    • Preis-Monitor
    • Online-Werbung 

Die weiteren Vorträge kamen von Dr. Michael Jachan (Brain Products) über die Grundlagen maschinellen Lernens. Und Dr. Achim Hornecker ergänzte die Runde mit dem dritten Vortrag. Er skizzierte die Entwicklung, die sich in den vergangenen Monaten ausgehend von Hadoop hin zur interaktiven Verarbeitung von großen Datenmengen bis zu Echtzeitanwendungen getan hat.

Weitere Infos auf der Homepage von Dr. Hornecker.

Kategorien: Elasticsearch

Zurück