Grundlegende Eigenschaften eines Data Scientists

Veröffentlicht: 2017-01-12
Inhaltsverzeichnis anzeigen
Statistisches Denken
Programmierkenntnisse
Ein neugieriger Geist
Ergebnisorientierter Charakter
Kreativität
Verständnis von Datenbanken
Große Kommunikationsfähigkeiten
Hunger nach Daten

Big Data wächst seit den Anfängen der Informationstechnologie. Heute entsprechen die Daten, die wir jeden zweiten Tag erstellen, allen Daten, die wir bis 2003 angesammelt haben. Diese gigantische Menge an Daten bietet unschätzbare Erkenntnisse nicht nur für Unternehmen, sondern für die gesamte Menschheit selbst. Big-Data-Analysen unterstützen die Gesundheitsbranche schon seit geraumer Zeit bei der Forschung. Darüber hinaus könnte Big Data in Kürze sogar das Rätsel des Krebses lösen .

Was wäre, wenn ich Ihnen sagen würde, dass Big Data wirklich nur ein Haufen Daten ist, die keinen Sinn ergeben, wenn Sie nicht wissen, wie man sie nutzt? Hier kommen Data Scientists ins Spiel. Um Big Data zu verstehen, brauchen wir Data Scientists, und zwar gute, um genau zu sein. Und lassen Sie sich vom Titel „Datenwissenschaftler“ nicht täuschen, es gibt einige Eigenschaften, die ein Datenwissenschaftler besitzen sollte, um sich als solcher bezeichnen zu können. Wenn Sie einen Datenwissenschaftler einstellen möchten oder selbst einer werden möchten, finden Sie hier die Eigenschaften, nach denen Sie suchen oder die Sie besitzen sollten.

Datenwissenschaftler

Statistisches Denken

Daten in Informationen umzuwandeln ist die Hauptaufgabe eines Data Scientists. Statistisches Know-how ist daher eine Selbstverständlichkeit. Es ist wichtig, die Dinge mit einer quantitativen Denkweise zu betrachten, um neutral zu bleiben und Vorurteile beim Umgang mit Daten fernzuhalten. Ein guter Data Scientist versteht, dass Tiefe und Verlässlichkeit von Erkenntnissen proportional zur Datenmenge steigen und verzichtet darauf, Schlussfolgerungen mit unzureichenden Daten zu ziehen. Mit einer riesigen Datenmenge tauchen Trends und Erkenntnisse als Zahlen auf. Die Liebe zu Zahlen ist daher notwendig, um ein echter Data Scientist zu sein. Ein Data Scientist sollte in der Lage sein, große Datenmengen abzufragen, um umsetzbare Erkenntnisse abzuleiten und dann prädiktive Modellierungstechniken anzuwenden, um zukünftige Trends vorherzusehen. Ein guter Überblick über Statistiken ist notwendig, um Berichte zu erstellen und die empfohlenen Vorgehensweisen basierend auf den Erkenntnissen zu skizzieren.

Programmierkenntnisse

Ein Datenwissenschaftler würde mit verschiedenen Teams zusammenarbeiten, um Pipelines, Tools, Module, Pakete, Websites, Dashboards und vieles mehr zu erstellen. Das bedeutet nicht, dass ein Datenwissenschaftler ein erfahrener Programmierer sein sollte, aber ein Verständnis von Algorithmen und der Funktionsweise von Codes kann bei der Arbeit eines Datenwissenschaftlers einen großen Beitrag leisten. Wenn das System Ihnen nicht die richtigen Trends oder Erkenntnisse liefern kann, ist es an der Zeit, die Ärmel hochzukrempeln und Code zu schreiben. Ohne Programmierkenntnisse und technische Flexibilität wäre dies nicht möglich.

Python gilt als die vielseitigste und kompatibelste Programmiersprache und ist ideal für die Handhabung von Datenbanken und Abfragen vom Typ MapReduce. Da die Sprache leicht zu erlernen und Open Source ist, sollte das Erlernen von Python kein großes Hindernis zwischen Ihnen und Ihrem Data-Science-Traum sein.

Viele Organisationen ziehen bei der Einstellung eines Datenwissenschaftlers auch ausgezeichnete „Pseudo-Code-Kenntnisse“ in Betracht. „Pseudo-Code-Kenntnisse“ ist die Fähigkeit, in einfachem Englisch zu schreiben, wie eine Abfrage oder ein Algorithmus funktionieren soll. Diese Fähigkeit zur Problemlösung ist unerlässlich, um als Datenwissenschaftler aufzusteigen. Die Datenwissenschaft ist eine Branche, in der sich die Goldstandards mit alarmierender Geschwindigkeit ändern, was betont, wie wichtig es ist, mehr Fähigkeiten zu haben, als das aktuelle Szenario erfordert.

Ein neugieriger Geist

Obwohl Data Science ein ziemlich altes Gebiet ist, werden hin und wieder Entdeckungen gemacht. Der Drang, neue Wege zu finden, um ein altes Problem zu lösen, ist der Grund dafür. Ein Datenwissenschaftler sollte immer neugierig sein, um nach neuen und besseren Möglichkeiten zum Erfassen, Zusammenführen und Verarbeiten von Daten Ausschau zu halten und Tools zu finden, um bessere Erkenntnisse zu gewinnen. Ein idealer Datenwissenschaftler sollte nie aufhören, neugierig zu sein, da die Daten Geheimnisse bergen, die er nur den Neugierigen gestehen würde. Ein echter Datenwissenschaftler versucht nicht herauszufinden, wie die Daten seine Vorurteile belegen, sondern sucht stattdessen nach den Wahrheiten, die tief darin verborgen sind.

Mit Daten kann es manchmal ganz schön schwierig werden, und nur Neugier kann Sie zu den Ergebnissen treiben. Deshalb ist Neugier eine der wichtigsten Eigenschaften eines Data Scientists.

Ergebnisorientierter Charakter

Bei der Datenanalyse geht es mehr um die Ergebnisse als um den Prozess selbst. Es spielt keine Rolle, wie Sie die Ergebnisse mit Daten bringen, solange es die erwarteten Ergebnisse gibt. Datenwissenschaftler müssen manchmal mehr als einen Weg einschlagen, um bestimmte Probleme zu lösen. Sich von kleinen Hürden aufhalten zu lassen, ist keine gute Eigenschaft für einen Data Scientist. Ergebnisorientierung hilft in solchen Fällen, da die starke Entschlossenheit, Daten in Ergebnisse umzuwandeln, zur treibenden Kraft für sich selbst wird. Datenwissenschaftler sind im Allgemeinen Menschen, die sich von einem Problem zum anderen bewegen und gleichzeitig mit verschiedenen Aufgaben jonglieren. Nichts als das Ergebnis kann sie von dem Vorhaben abhalten.

Kreativität

Kreativität könnte in dieser Liste wie das Seltsame aussehen. Die Wahrheit ist, dass es eine der wichtigsten Eigenschaften für einen Data Scientist ist. Kreative Menschen haben keine Angst vor Fehlern, sie experimentieren mit neuen Dingen und wagen sich an neue Territorien. Sie finden Chancen in ihren Fehlern und können leicht die Richtung ändern. All dies ist für die Datenwissenschaft unerlässlich.

Wir kategorisieren Menschen oft in linkshirnige und rechtshirnige. Harte Wissenschaften wie Big Data werden selten mit Kreativität in Verbindung gebracht, und das ist ein großer Fehler. Datenwissenschaftler fallen irgendwo zwischen die beiden Kategorien und brauchen eine Spur Kreativität, um neuere Ansätze und Wege zum Umgang mit Daten zu finden. Statistiken und Datenbanken sind nicht das, worum es in der Datenwissenschaft geht, es ist das Geschichtenerzählen, das das endgültige Ergebnis der Analyse für die Entscheidungsträger nützlich macht.

Kreativität allein macht natürlich keinen Data Scientist. Jemand, der leicht verständliche, attraktive und auffällige Berichte erstellen kann, ist möglicherweise nicht immer die beste Wahl für die Rolle eines Datenwissenschaftlers. Data Scientists können als kreative Problemlöser bezeichnet werden.

Verständnis von Datenbanken

Unabhängig davon, ob Sie mit strukturierten Daten, unstrukturierten oder beiden zusammen arbeiten, ein guter Data Scientist muss eine grundlegende Vorstellung von der Funktionsweise von Datenbanken haben. Außerdem kann ein grundlegendes Verständnis von spaltenorientierten und relationalen Datenbanken die Arbeit eines Datenwissenschaftlers erheblich erleichtern. Viele Warenhäuser der Unternehmen verwenden noch immer traditionelle relationale Datenbanken. Datenwissenschaftler müssen auch an der Einrichtung dieser Datenbanken beteiligt sein, obwohl es technisches Personal geben wird, um die Aufgabe auszuführen. Das Know-how, eine Datenbankinfrastruktur zu entwickeln, die mit unstrukturierten Daten umgehen kann, ist wie ein Sahnehäubchen.

Große Kommunikationsfähigkeiten

Ein Datenwissenschaftler wird meistens gleichzeitig mit Technikern, Analytikern und Geschäftsleuten zusammenarbeiten. Er fungiert oft als Übersetzer für alle Beteiligten. Gleichzeitig mit dem technischen und geschäftlichen Jargon umgehen zu können und zu wissen, was mit wem zu tun ist, erfordert starke Kommunikationsfähigkeiten. Das Ergebnis der Analyse ist normalerweise nicht schön, zumindest für jemanden, der kein Datenwissenschaftler ist. Die Erkenntnisse und Trends stecken in Zahlen und sollten interpretiert und dem Geschäftsteam und den Stakeholdern auf eine Weise mitgeteilt werden, die sie verstehen. Ein guter Datenwissenschaftler sollte in der Lage sein, das komplexe Ergebnis der Analyse mithilfe von Geschichtenerzählen, Metaphern und visuellen Kommunikationsmitteln in eine einfachere Form zu übersetzen, die von Menschen mit unterschiedlichem Hintergrund verstanden wird.

Hunger nach Daten

Ein großartiger Datenwissenschaftler ist immer hungrig nach mehr Daten. Die Suche nach Daten ist eine Suche ohne festgelegte Ziele, da mehr Daten immer bessere Daten sind. Ein Datenwissenschaftler sollte weiterhin nach mehr Datenquellen, besseren Möglichkeiten zu ihrer Erfassung und innovativen Methoden zu ihrer Verarbeitung suchen. Der Drang, mehr Daten zu sammeln, ist etwas, das ein Datenwissenschaftler besitzen muss, da Daten der Treibstoff für Analysen sind.