Integrierte Informationen

4. Mai 2006, 0:00 Uhr | Werner Fritsch

Integrierte Informationen. Software-Hersteller verbinden verschiedenartige Verwaltungswerkzeuge, um Informationen einheitlich zur Verfügung stellen zu können.

Integrierte Informationen

Alle gewünschten Informationen per Mausklick zu bekommen ist in den Unternehmen bislang nur eine Wunschvorstellung. Dafür müssten die IT-Experten erst einmal die in den Tabellen relationaler Datenbanken verwalteten kaufmännischen Zahlen, semistrukturierte Informationen wie E-Mails, Web-Content, Dokumente aus Office- oder Dokumentenmanagement-Systemen und unstrukturierte Inhalte wie Bilder oder Videos unter einen Hut bringen.

Vielfältige Integrationswerkzeuge
Heute und auf absehbare Zeit gibt es eine ganze Palette von Mechanismen, mit denen Informationen unterschiedlicher Art für verschiedene Zwecke zusammengeführt werden können. Dazu gehören Werkzeuge für die Extraktion, die Transformation und das Laden (ETL) von Daten, die meist im Batch-Betrieb laufen, sowie Werkzeuge zur Enterprise Information Integration (EII), die Daten in Echtzeit lesen, sie jedoch an ihrem Platz belassen. Replikation ist ein Verfahren, um Daten in verteilten Landschaften zu synchronisieren, und Caching wird verwendet, um Daten zwischenzuspeichern, so dass sie im Bedarfsfall dann rasch abgefragt werden können. Weil betrieblich besonders wichtig, genießen Kerndaten um Kunden und Produkte im Rahmen des so genannten Master Data Management (MDM) besondere Aufmerksamkeit. Und damit bei dieser Vielfalt nicht die Übersicht verloren geht, sind Metadaten wichtig, also Informationen über die Struktur und Verwendung der eigentlichen Nutzdaten. Nicht zu vergessen: Auch Enterprise Application Integration (EAI) stützt sich auf den Datenaustausch zwischen Anwendungsprogrammen, meist in Transaktionszusammenhängen. Im Trend ist die Realisierung durch einen Enterprise Service Bus (ESB) mit XML und Java im Rahmen einer serviceorientierten Architektur (SOA). »Bis diese Vielfalt tatsächlich unter den Hut einer einzigen Plattform gebracht ist, wird es wohl noch fünf Jahre dauern«, meint An­dreas Bitterer, Analyst bei dem Marktforschungshaus Gartner. Sein Berufskollege Noel Yuhanna bei Forrester Research glaubt, dass Virtualisierungstechniken mittelfristig zu einer neuen Grundlage dafür führen werden.
Als Lieferanten von Software zur Informationsintegration treten vor allem Datenbankhersteller und Spezialfirmen in Erscheinung, ferner Hersteller, die bei Business Intelligence, be­triebswirtschaftlicher Anwendungssoftware oder Middleware zu Hause sind. So offerieren auch die Business-Intelligence-Größen Business Objects, Cognos und SAS Institute ETL-Produkte, der Applikationsriese SAP kann Informationen in der eigenen Welt integrieren, und BEA Systems, bekannt für seinen Java-Applikationsserver Weblogic, hat EII-Software zugekauft und mittlerweile in seine Produktlinie Aqualogic eingefügt.

Information auf Abruf
Bei IBM spricht man prononciert von Information on Demand. Wolfgang Müschenborn, hierzulande bei diesem IT-Giganten für das Software-Marketing zuständig, weist darauf hin, dass sein Unternehmen in jüngerer Vergangenheit eine ganze Reihe kleinerer Anbieter im Integrationsumfeld übernommen hat. Im Bereich Content sind das namentlich Aptrix, Tarian, Green Pastures, Pure Edge und Cross Access, zur Integration im engeren Sinn Venetica (semistrukturierte Informationen) und Ascential (relationale Daten, ETL), für das Master Data Management Trigo (Produktdaten) und DWL (Kundendaten), für die Auswertung schließlich Alphablox, SRD, LAS und Iphrase. Vor einigen Jahren schon hat sich IBM den Datenbank-Wettbewerber Informix einverleibt. Native XML-Speicherung, die zur Handhabung komplexer, nicht-relationer Informationen wichtig ist, wird indes erst die neue Version des Datenbanksystems DB2 (Code-Name: Viper) bieten.

Datenbank und ­Middleware im Verbund
Die neue Version der Produktlinie Web­sphere Information Integrator für den föderierten Zugriff im EII-Sinn, gegenwärtig unter dem Code-Namen Serrano gehandelt, wird es neben der Variante für relationale Daten auch in einer Content Edition für nicht-relationale Informationen geben. Die Omni Find Edition wird außerdem die Suche in formatfreien Texten ermöglichen. Zur Modellierung soll ein Produkt namens Rational Data Architect hinzukommen. Die unter dem Decknamen Hawk firmierende neue Version der Websphere Data Integration Suite ? eine Weiterentwicklung der von Ascential erworbenen ETL-Software ? wird die Produkte Data Stage und Quality Stage umfassen. Neu hinzu kommt das Produkt Websphere Information Analyzer, das helfen soll, strukturierte Daten besser zu verstehen. Nicht zuletzt: Serrano und Hawk können mit gemeinsamen Metadaten arbeiten und gestatten es, gemeinsame Integrationsdienste in einer serviceorientierten Architektur zu formulieren, etwa als Web Services und per Java Messaging (JMS). Auf der abstraktesten Ebene wird dann ein übergeordneter Websphere Information Server stehen, der Informationen auf dieser Basis als Service bereitstellt und die interne Mühsal der Integration verbirgt.
Für Detlef Neumerkel, hierzulande als Presales Manager bei dem Datenbankhersteller Sybase tätig, ist eine SOA ebenfalls die übergeordnete Vision, in die sich das Thema Datenintegration künftig einzufügen hat. Seit der Übernahme des Herstellers Avaki im vergangenen Jahr ist vor allem der EII-Aspekt im Fokus des Interesses. Mit Enterprise Connect verfügt der Anbieter indes auch über bewährte Software zur Synchronisierung vielfältiger strukturierter Datenbestände und mit Unwired Orchestrator über ein EAI-Produkt.
Bei Oracle gehört das Thema Informationsintegration ebenfalls in das SOA-Umfeld, wie Michael Stapf ausführt, der für diesen Software-Hersteller als Systemberater arbeitet. Im Detail ist die Pa­lette an Integrationswerkzeugen, die sich unter der abstrakten Service-Sicht verbirgt, vielfältig: Sie reicht von Replikationsprogrammen auf Middleware- und Datenbankebene über ETL- und EII-Werkzeuge bis zu so genannten Hubs, in denen Daten für Kunden oder Produkte integriert und im Unterschied zu bloßem MDM duplizierte Stammdatensätze enthalten sind. Bei EII spielt XML mit der zugehörigen Abfragesprache Xquery eine wesentliche Rolle, und die Datenbank kann XML-Informationen nativ speichern. Auf Datenbankebene arbeitet Oracle außerdem an einer einheitlichen Integrationstechnologie namens Streams. Diese können dann Programme auf Middleware-Ebene nutzen, die zu einem Enterprise Service Bus (ESB), einer Engine für die Business Process Execution Language (BPEL), einem Adapter zur Integration von Applika­tionen oder einem Event-Mechanismus im Rahmen eines Business Activity Monitoring (BAM) gehören.
Wie bei IBM, Sybase und Oracle sind auch bei Microsoft Datenbanken und Middleware betroffen, wenn es um die Integration von Informationen geht. So wurde das relationale Datenbanksystem SQL Server in der neuen Version 2005 um so genannte Integration Services erweitert, die den ETL-Werkzeugen anderer Hersteller entsprechen. Zur Verbesserung der Datenqualität, etwa bei Personnamen und Adressen, wurden Verfahren der Fuzzy Logic verwendet, erzählt Boris Cordes, Produktmanager für Business Intelligence. Die Datenbank unterstützt XML nativ. Das EAI-Produkt Biztalk Server ermöglicht außerdem ereignisorientierten Datenabgleich, wie Produktmanager Carsten Hecht ergänzt. Auch Microsoft bietet Verfahren für Replikation und EII. Auf eine übergeordnete SOA scheint es in der Microsoft-Welt hingegen bislang nicht anzukommen.

Serviceorientierung
Ein ähnliche Vision wie IBM und andere heute hatte Informatica bereits vor zwei Jahren unter der Bezeichnung Universal Data Services (UDS) entworfen. Laut Ralf Götz, als Presales Manager für den deutschsprachigen Raum in Diensten dieses Herstellers, wurde dieser Begriff zwar aufgegeben, doch statt dessen spricht man nun dem Zeitgeist folgend von einer serviceorientierten Architektur. Der Sache nach seien in der aktuellen Version 8 des Flaggschiff-Produkts Power Center Dienste implementiert, um Daten über Web Services oder per Messaging weiterzugeben. Darunter liegt eine Schicht mit Diensten für die Bereinigung und Umformung der Daten. Sowohl Bewegung als auch Föderation von Daten sind möglich. Bei der Föderation stützt sich der Anbieter auf Werkzeuge des Partners Composite Software. Die unterste Schicht bilden Programme, die auf vielfältige Datenquellen von relationalen Datenbanken bis zu Dateisystemen zugreifen können. Für die Integration komplexer Informationen fungiert auf OEM-Basis Software des Spezialanbieters Itemfield.
Die Befüllung eines Data Warehouse im ETL-Sinn ist weiterhin das verbreitetste Einsatzszenario der Informatica-Werkzeuge. Doch daneben nennt Götz die Migration von Datenbeständen etwa bei der Fusion von Unternehmen oder der Einführung neuer Anwendungen, ferner Echtzeit-Anforderungen in Business-Intelligence-Lösungen.


Jetzt kostenfreie Newsletter bestellen!

Matchmaker+