Die von Talend übernommene Lösung Stitch Data ermöglicht den Datentransfer aus einer Cloud-basierten Unternehmenssoftware in ein Datawarehouse in der Cloud. Langfristig soll sie das gerade vorgestellte Update von Talend Data Fabric erweitern, das die Echtzeitverarbeitung von heterogenen Big Data fokussiert.

Talend Cloud

Von der einen in die andere Cloud: „Stitch bietet einen Service für den Datentransfer von Cloud-basierten Marketinglösungen wie etwa Salesforce.com in ein Cloud-basiertes Data Warehouse“, berichtet Laurent Bride, Chief Technology Officer bei Talend, einem Anbieter von Lösungen für die Cloud-Integration. „Durch die Übernahme dieses Unternehmens erhalten wir eine Lösung für den Data Warehouse-Markt, mit der wir neue Cloud-Anwender ansprechen. Stitch Data wurde laut Bride 2016 in Philadelphia gegründet und hat aktuell 900 zahlende Kunden.

Analysen im Cloud-basierten Data Warehouse

Stitch Data zielt darauf, die Daten aus einer Cloud-Lösung wie Salesforce.com oder Marketo in ein Cloud-Basiertes Data Warehouse zu ziehen und sie dort zu analysieren. Inhaltlich ergänzt Stitch Data demnach das gerade vorgestellte Fall-2018-Update von Talend Data Fabric. Bei dieser Lösung handelt es sich um eine Unified Data Plattform für die Datenintegration zwischen On-Premise-Systemen und Multicloud-Umgebungen. Aktuell sind Stitch Data und Talend Data getrennte Produkte, die ein eigenes Log-In erfordern. Langfristig sollen die Lösungen laut Bride für ein Single-Sign-on integriert werden.

Das Fall-2018-Update von Talend Data Fabric verarbeitet laut Bride sehr große Datenmengen, um daraus in der Analyse Erkenntnisse zu gewinnen. Hierzu biete die Plattform Funktionen wie einen Datenkatalog, mit dem Unternehmen eine zentrale Instanz für vertrauenswürdige Daten schafften. Schnittstellen zur Anwendungsprogrammierung (CloudAPIs) würden den Zugriff auf standardisierte Daten zur Erstellung von Data-as-a-Service-Anwendungen beschleunigen und so die Produktivität steigern.

Eine konsistente Instanz für vertrauenswürdige Daten

Der Talend Data Catalog soll eine einheitliche und konsistente Instanz für vertrauenswürdige Daten schaffen. Die Lösung untersuche dafür automatisch alle Daten unabhängig von ihrem Speicherort, also zum Beispiel ein Data Lake, lokale Repositories oder die Cloud. Sie führe Profiling und Klassifizierung aller Daten durch, erkenne die Beziehungen zwischen Daten und biete über eine Suchfunktion schnellen Zugriff darauf. So sollen Endbenutzer aussagekräftige Informationen für geschäftliche Entscheidungen erhalten.

Die Ausführung von Machine Learning Algorithmen laufe in der aktuellen Version von Talend Data Fabric schneller als früher und biete nativen Support für Serverless Big Data für Microsoft Azure Databricks oder für Qubole in Amazon Web Services. Das in Talend integrierte Apache Spark mit Self-Service-Funktionen erleichtert laut Anbieteraussage die Cluster-Entwicklung: Dank Serverless- und Spot-Instanzen müssten Unternehmen nur die Ressourcen bezahlen, die sie tatsächlich nutzen. Die neuen Funktionen sollen dabei helfen aussagekräftige Informationen automatisch zu gewinnen und mehr Daten zu niedrigeren Kosten zu verarbeiten.

„Daten sind das Herzstück der digitalen Transformation, aber ihr Nutzen ist für viele Unternehmen schwer zu fassen“, erläutert Ciaran Dynes, SVP Products bei Talend. „Um in einer sich stetig weiterentwickelnden Datenlandschaft erfolgreich zu sein, sollte jeder Schritt der Wertschöpfungskette automatisiert werden.“ Zudem lohne es sich, die Self-Service-Möglichkeiten für alle Anwender von Daten auszubauen. Mit Talend Data Fabric und Stitch Data will Talend Anwender beim Verwalten, Verarbeiten und beim Austausch von Daten unterstützen. Jürgen Frisch