Die Nadel im Heuhaufen – ein Datenwissenschaftler für Ihre Projekte der Künstlichen Intelligenz


Seit Finanzinstitute darüber nachdenken, wie sie Künstliche Intelligenz (KI) und Machine-Learning (ML)-Projekte innerhalb ihrer Organisation implementieren können, hat sich die Stelle des Data Scientists – oder Datenwissenschaftlers – innerhalb kürzester Zeit zu einer besonders begehrten entwickelt. Festzustellen, dass man einen Datenwissenschaftler braucht, ist jedoch der einfache Teil des Prozesses. Die eigentliche Schwierigkeit liegt darin, den richtigen Datenwissenschaftler mit den Fähigkeiten und Kenntnissen zu finden, die benötigt werden, um einen echten Geschäftsnutzen erzielen zu können.

Dass Datenwissenschaftlern ein so hoher Stellenwert zugemessen wird, resultiert daraus, dass sehr spezifische Kenntnisse und fundiertes Wissen benötigt werden, um effektive KI-Strategien so zu implementieren, dass sie einen spürbaren Einfluss auf Projekte und deren Art und Richtung nehmen können. Diese Mitarbeiter fällen, basierend auf den Daten, die man ihnen zukommen lässt, ein Urteil darüber, welche Tools genutzt werden und entscheiden über den Aufbau der Untersuchung, die letzten Endes zur Identifizierung und Lieferung des Geschäftswerts durch KI und ML führen.

In jedem Projekt dieser Art gibt es drei unterschiedliche Phasen:

  • Wertidentifizierung: Prüfen, wo sich der Geschäftswert befindet
  • Experimentieren: Beweisen, dass der Geschäftswert erbracht werden kann
  • Operationalisierung: Implementierung des Systems, das die Erbringung des Geschäftswerts sicherstellt

Während der verschiedenen Phasen des Projekts, in denen Datenwissenschaftler mit Entwicklern, SMEs und Data Engineers zusammenarbeiten, tragen sie den größten Anteil zur Realisierung der Wertschöpfung bei.

Dateningenieure vs. Datenwissenschaftler: Wo liegt der Unterschied?

Die Position des Datenwissenschaftlers sollte nicht mit der des Dateningenieurs verwechselt werden – die beiden Rollen unterscheiden sich stark voneinander.

Der größte Unterschied zwischen den beiden wird in der „Experimentierphase“ offensichtlich: Dateningenieure müssen Daten zügig in die „Experimentierzone“ spielen und zwar mit der richtigen Qualität, um dem Datenwissenschaftler überhaupt erst die Ausübung seiner Rolle zu ermöglichen.

Der Datenwissenschaftler nutzt dann eine Auswahl an Tools aus einem riesigen Werkzeugkasten, um die vom Dateningenieur bereitgestellten Daten zu untersuchen und so viele Information wie möglich daraus zu gewinnen. . Diese straffen Durchläufe aus „Experimentieren, Beweisen und Wiederholen“ schaffen Vertrauen in das Modell und demonstrieren, dass das System in Produktion gehen kann.

Der Dateningenieur kommt wieder ins Spiel, um das konfigurierte Modell in Produktion zu nehmen. Der Dateningenieur mag die Ergebnisse vielleicht aus datenanalytischer Sicht verstehen, aber der Datenwissenschaftler ist es, der ihren Wert („das Gold“) erkennt.

Das richtige Toolset auswählen

Wenn ein Anwendungsfall im Bereich Künstliche Intelligenz entwickelt wird, muss der Datenwissenschaftler das richtige Toolset wählen. Es kann durchaus schwierig sein, zu bestimmen, welche Tools genutzt werden sollen. Man kann Natural Language Programming (NLP) auf einen Email-Routing Agent anwenden, um Kosten zu reduzieren. Man kann NLP aber genauso gut in einem Chat-Bot nutzen, der Teil eines kognitiven Prozesses ist.Das Toolset beinhaltet auch einige eindeutig Nicht-KI-Tools, was die fragmentierte und sich schnell ändernde Umgebung dieser Art von Projekten und die Abhängigkeit der Werkzeugverwendung vom Business Case demonstriert.

Es ist klar, dass für jeden Business ein oder mehrere Tools Case gebraucht werden. Eine Aufgabe des Datenwissenschaftlers ist es, das richtige Tool oder die Kombination zum richtigen Zeitpunkt auszuwählen, um den richtigen Geschäftsfaktor zu treffen. Das Urteilsvermögen über die Auswahl der Tools und die Kombination ist dabei eher als Kunst denn als Wissenschaft zu bezeichnet.

Die Nadel im Heuhaufen finden

Manche Leute behaupten, den idealen Datenwissenschaftler finden zu wollen, sei in etwa vergleichbar mit der Suche nach der berühmten Nadel im Heuhaufen. Datenwissenschaftler benötigen hervorragende kommunikative Fähigkeiten, zusätzlich zum relevanten Geschäftswissen. Dieses Wissen ist wichtig, denn es ermöglicht ihnen, zu erkennen und zu verstehen, was die Daten bedeuten. Dies wiederum befähigt sie dazu, den richtigen Riecher für die Wertidentifizierung zu entwickeln. Die kommunikativen Fähigkeiten werden benötigt, um Erkenntnisse zu erläutern, Zuversicht und Vertrauen zwischen den verschiedenen Stakeholdern zu schaffen, um dann zu demonstrieren, dass die statistischen Methoden tatsächlich richtig angewandt wurden.

Dieses vielfältige Fähigkeitsspektrum macht das Becken, in dem nach verfügbaren Talenten gesucht werden kann, ziemlich seicht. Es wird sogar der Vorwurf laut, dass die weltweit führenden Universitäten daran scheitern, genügend Datenwissenschaftler auszubilden, um den jetzigen und zukünftigen Bedarf zu decken.

Ein zusätzliches Problem besteht darin, dass Datenwissenschaftler oftmals Kenntnisse im falschen Businessbereich oder im falschen Tool haben. Dieses Problem der Hyper-Spezialisierung erschwert die Suche nach dem seltenen Experten. Die Analogie zur Nadel im Heuhaufen weist jedoch zu einer möglichen Lösung: Man zerlegt die Anforderungen eines Projektes in Einzelteile. Unterschiedliche Teile des Projektes können dann von unterschiedlichen Leuten mit ihren Spezialkenntnissen erfüllt werden. In der Theorie sollte es dadurch einfacher werden, hinreichend qualifizierte Personen zu finden, deren individuellen Fähigkeiten dann gemeinsam genutzt werden können.

Es zeigt sich, dass allein die Suche nach dem richtigen Datenwissenschaftler eine schwierige Aufgabe darstellt, doch das ist nur ein Teil der Schlacht. Die nächste Herausforderung besteht darin, Datenwissenschaftler auch für sich zu gewinnen und halten zu können. Es gibt einige Beweise dafür, dass das Gehalt von Datenwissenschaftlern in den letzten Jahren auf einem stabilen Level angekommen ist. Das mag wie ein Vorteil erscheinen, doch es impliziert auch, dass das Gehalt nicht die höchste Priorität in Sachen Employee Value Proposition für einen Datenwissenschaftler hat. Das Arbeitsumfeld ist mindestens genauso wichtig.

Das richtige Arbeitsumfeld erschaffen

Unternehmen müssen ehrlich zu sich sein, wenn sie darüber nachdenken, wie sie am besten Datenwissenschaftler für sich gewinnen und diese auch halten können. Wenn sie über ihr Geschäft nachdenken, sollten sie über folgende Punkte nachdenken:

  • Wie steht es um die Agilität? Sind die zu identifizierbaren Probleme interessant und von hohem Wert?
  • Wie sieht es mit den bestehenden Kontrollmechanismen aus? Sehen sich Datenwissenschaftler in der Bürokratie eines monolithischen Unternehmens gefangen?
  • Stehen die neuesten Tools, Infomaterialien und Softwareanbieter zur Verfügung, sodass sie den besten Ansatz für den Job wählen können? Bekommen Datenwissenschaftler freie Hand, um Probleme zu lösen, ohne in ihrer Kreativität eingeschränkt zu sein?

Fazit

Es zeigt sich also: Einen guten Datenwissenschaftler zu gewinnen ist keine leichte Aufgabe. Allgemein gilt – ob das nun richtig oder falsch ist – dass Banken im 20. Jahrhundert vielleicht einmal innovative Arbeitgeber waren, heute jedoch vor erhöhten Regularien stehen und deutlich weniger Risikobereitschaft zeigen. Weit davon entfernt, innovativ zu sein, erscheinen Banken heute eher wie regierungsverwaltete Unternehmen. Firmen, die vor dem Problem stehen, Datenwissenschaftler identifizieren, für sich zu gewinnen und halten zu müssen, sollten sich auf die Tatsache einstellen, dass sie sich in einem Krieg um diese Experten und Talente befinden. Der Ansatz, die eigene Unternehmenskultur attraktiver und die Arbeit interessanter zu machen, ist ein essentieller Faktor, wenn es darum geht, die richtigen Leute zu finden.