Chris Bergh, CEO von DataKitchen, tritt bei BigIDeas für unterwegs um über die wachsende Bedeutung von DataOps und seine Schnittstelle mit Datenverwaltung.
DataOps – oder DevOps für Data Science
Als Softwareentwickler im Jahr 2005 teilte Bergh seine berufliche Zeit zwischen der Entwicklung von Software und der Leitung von Teams auf. „Dann kam ich auf die zündende Idee, mich auf Daten und Analytik zu konzentrieren – und die Teams zu leiten, die Data Science, Data Engineering und Visualisierung betrieben und Steuerung, noch bevor dieses Wort existierte“, sagt Bergh.
Berghs Idee wurde von zwei verschiedenen Bereichen inspiriert: Fertigung und Software. „Die Prinzipien, die in der Software und in der Fertigung verwendet werden, gelten wirklich für Daten und Analysen.
„Fabriken haben gelernt, wirklich hochwertige Dinge wie Autos herzustellen. Software hat wirklich gelernt, Dinge schnell in die Produktion zu bringen. „Nehmen wir diese beiden Ideen und wenden sie einfach auf die Wertschöpfungskette und die Datenanalyse an“, beschreibt Bergh seinen damaligen Plan. Er nannte diesen Ansatz „DevOps für Data Science“, woraus sich „DataOps“ entwickelte.
Iterieren ist schwierig … es sei denn, Sie automatisieren
Stellen Sie sich zum Beispiel vor, in der Produktion läuft etwas schief – kein ungewöhnliches Ereignis. Plötzlich müssen Sie zehn Leute zusammentrommeln und herausfinden, wo das Problem liegt. Liegt es an der Datenbank? An der Transformation? An den Rohdaten?
Alternativ möchten Sie vielleicht etwas ändern – aber natürlich wirkt sich diese Änderung auf alles andere aus. „Angenommen, ich füge einer Datenbank eine Spalte hinzu. Okay – füge eine Spalte hinzu. Und was ist dann die Transformation? Was ist die Visualisierung? Was ist das Modell? Was ist das Datenkatalog-Update? All diese Dinge sind Änderungen, die gemeinsam – und zwar schnell – umgesetzt werden müssen, denn die besten Analyseteams konzentrieren sich meiner Meinung nach auf das Lernen, und Lernen entsteht durch Iterationen. Iterationen sind schwierig, es sei denn, Sie automatisieren."
Den vollständigen Podcast anhören Weitere Informationen von Bergh zur Zukunft von DataOps für Analyseteams.