Connector Design

 

Die Indexierung großer Datenbestände stellt ein komplexes Problem dar: Häufig werden Daten schneller erzeugt oder verändert und gelöscht, als dass diese Veränderungen in eine Suchmaschine und in den Index überführt werden können. Der Grund dafür ist, dass viele Anwendungen nicht mit dem Ziel des Datenexports entworfen wurden, sondern im Sinn einer abgeschlossenen Applikation geschrieben wurden. Die Folge sind "Islands of Information", die einem Konzept einer einheitlichen Informationslandschaft im Unternehmen widersprechen. Zwar gibt es für viele Suchmaschinen und viele Applikationen Konnektoren, die aber häufig nicht die Anforderungen hinsichtlich Performance erfüllen: Sie sind oft für einen einmaligen, langen Gesamtexport entworfen, nicht aber für inkrementelle Indexierungen veränderlicher Daten.

Der Kurs behandelt folgende Themen:

  • Zugriffsmethoden und Transferprotokolle verschiedener Technologien und deren Automatisierbarkeit

  • Rechteverwaltung für User und Gruppen; Authorisierungsmethoden (Kerberos, LDAP usw)

  • Performanceaspekte und Bottlenecks sowie dezentrale Vorverarbeitung

  • Aktualisierungsverfahren und Handling von Änderungen am Korpus

Der Kurs richtet sich an Mitglieder von Projektteams von Enterprise-Suchmaschinen, die komplexe Datenbestände anbinden müssen. Der Kurs ist auf drei Tage angelegt und findet in unseren Räumen sowie inhouse bei Kunden statt. Auf Wunsch organisieren wir Unterkunft und Verpflegung. Die Mindestzahl ist vier Teilnehmer.