Zahlen, Daten, Fakten und möglichst wenig Interpretationsspielraum – das sind die Argumentationswerkzeuge eines Data Engineers. Die beiden Zeiten, in denen sich ein Data Engineer bewegt sind die Vergangenheit und die Zukunft: Die Daten aus der Vergangenheit werden genutzt, um Muster zu erkennen, mit denen sich Vorhersagen für die Zukunft ableiten lassen. Hierbei handelt es sich um Machine Learning Modelle, mit denen Algorithmen entwickelt werden, wie z. B. für selbstfahrende Autos. Klingt spannend? Dann hör doch gerne, was Martin noch so erzählt!
Martins Empfehlungen:
Bücher
- John W. Foreman, Data Smart: Using Data Science to Transform Information into Insight beschreibt konkrete Anwendungsfälle, die sich in Excel gut nachbauen lassen.
- Wes Mckinney, Python for Data Analysis: Data Wrangling with Pandas, NumPy, and Jupyter bietet eine kurzweilige Einführung in das Tooling. Es gibt auch eine deutschsprachige Ausgabe der älteren, 2. Auflage.
- Ramon Wartala, Praxiseinstieg Deep Learning führt mit vielen instruktiven Beispielen in das Thema Deep Learning ein.
Portale / Blogs
- Kaggle stellt jede Menge Aufgaben und Datensätze zur Verfügung, an denen man seine Data Engineering Skills üben und testen kann.
https://www.kaggle.com/ - towards data science diskutiert Theorie und Praxis rund um Data Science und Engineering.
https://towardsdatascience.com/ - Occam's Razor by A. Kaushik gibt immer wieder Denkanstöße quer durch das gesamte Gebiet der Web Analyse und des Marketing.
https://www.kaushik.net/avinash/
Podcasts + Video Channels
- Data Sceptic ist in Staffeln organisiert, die jeweils ein Fokusthema vertiefen. Das Spektrum reicht von Algorithmen (z. B. k-Means und Natural Language Processing) bis zu ethischen Fragen (z. B. in der Staffel "Consensus").
https://dataskeptic.com/ - Data Stories behandelt Themen rund um Visualisierung und Data Storytelling.
https://datastori.es/