„Ich arbeite bereits seit 2001 bei HMS und konnte mich in dieser Zeit von der Software-Ingenieurin bis zur Teamleiterin entwickeln. Unsere Kunden bestätigen meinem Team und mir regelmäßig, dass sie mit uns hochzufrieden sind. Das motiviert und gibt unserer Arbeit einen Sinn.“

Elisabeth Kohm, Teamleiterin und Senior Software-Ingenieurin

Wissen

Webinarreihe: DatenDienstag - Arbeiten in der Datenmine

Der DatenDienstag - was steckt dahinter?

Mittlerweile weiß jeder: Daten sind der Rohstoff der Zukunft. Das Besondere an diesem Rohstoff ist aber, dass er von jedem Unternehmen selbst geschürft werden kann. Einzige Voraussetzung ist, dass die richtigen Werkzeuge vorhanden sind und man weiß, wo man graben muss.

Wer heute nicht diese Voraussetzungen erfüllt, trägt ein immenses Risiko, den Anschluss an seine Kunden zu verlieren: vor knapp hundert Jahren lag das Alter der 500 größten US-Unternehmen noch bei durchschnittlich 67 Jahren. Heute liegt das Durchschnittsalter bei nur noch 15 Jahren. Und Richard Foster, ein Professor an der Yale University und früherer McKinsey-Partner sagt sogar voraus, dass in der nächsten Dekade 75% der heute größten Unternehmen bereits abgelöst worden sind

Mit dem DatenDienstag will Microsoft seine Kunden und Partner unterstützen, die Voraussetzungen für die erfolgreiche Nutzung des Rohstoffs "Daten" zu erfüllen: Beim DatenDienstag werden in insgesamt zehn Webinaren die wichtigsten Werkzeuge für die Arbeit in der Datenmine vorgestellt.


Der HMS-Beitrag:

Big Data Plattformen auf Azure - Best Practices und persönliche Erfahrungen

Das Thema: Immer mehr Unternehmen wagen den Schritt in die Cloud, um zentrale und skalierbare Datenplattformen zu entwickeln. Diese sollen es ermöglichen, moderne analytische Methoden einzusetzen, um verborgene Potentiale im Unternehmen an die Oberfläche zu bringen.  
Oft werden diese Projekte von Unsicherheiten begleitet. Diese reichen von organisatorischen Fragen, wie z.B. den Schnittstellen zwischen Software Engineer, Data Engineer und Data Scientist, bis hin zu technischen Herausforderungen wie der korrekten Datenspeicherung. In diesem Webinar wird über Best Practices, persönliche Erfahrungen und mögliche Fallstricke beim Entwurf von Big Data Plattformen berichtet. 
Inhalte: 

Wer macht was – Software Engineer vs. Data Engineer vs. Data Scientist:  

  • Rollenverständnis: 
    • Wer nutzt welche Tools?
    • Wer braucht welche Fähigkeiten? 
  • Abgrenzung der Aufgabengebiete: 
    • Data Ingestion
    • Operationalisierung 
    • Analytics
    • Data Processing

Wiederverwendbarkeit von Daten:  

  • Strukturierung eines Data Lake – Beispielkonzept „Raw – Stage – Product“
  • Parsen von Logfiles – On-Demand oder auf Vorrat? 

Dateiformate – Textbasierte Formate vs. Avro vs. Parquet:  

  • Kompression
  • Teilbarkeit
  • Schemaevolution

Data Warehousing auf Hadoop 

  • External vs. Managed Table

Cloud vs. On-Premise  

  • Kundenerfahrungen
  • Kriterien für die Toolauswahl: 
    • Automatische Skalierbarkeit
    • Trennung von Storage und Compute Diensten

Datum & Uhrzeit:  Dienstag, 13. November 2018, 14:00 - 15:00 Uhr