Erweitern Sie den aktuellen Tool-Stack des Data-Science-Teams

Ich habe vor Kurzem begonnen, ein auf Data Science fokussiertes Unternehmen mit zwei Abteilungen zu leiten, das SPSS Modeler ausgiebig nutzt. Um ehrlich zu sein, hat dort niemand auch nur annähernd die Fähigkeiten eines Datenwissenschaftlers. Meine Erwartung an einen Data Scientist ist auf den Punkt gebracht, dass er/sie komplexe Modelle auf Daten anwenden/testen/entwickeln kann. Da diese Fähigkeit in der Vergangenheit im Grunde fehlte, wurde das bestehende Unternehmen zu einer Berichts- und Business-Intelligence-Abteilung, die im Wesentlichen Daten in Excel an andere Abteilungen innerhalb der Gesamtorganisation liefert.

Der übliche Ablauf ist folgender:

  1. Jemand aus der Gesamtorganisation benötigt einige Daten
  2. Er ruft die Abteilung an und wir führen SQLs in SPSS Modeler durch, um ihnen die Daten bereitzustellen
  3. Wenn sie nicht zufrieden sind, wiederholen wir dies immer wieder, was für alle Teammitglieder umfangreiche Arbeit bedeutete

Dieser Prozess ist schrecklich und zeitaufwändig!

Ich habe kürzlich jemanden eingestellt, der einem " echten " Datenwissenschaftler näher kommt . Er kann Python/R programmieren und verfügt über umfangreiche Modellierungserfahrung. Er implementiert derzeit eine semantische Suche für das Scannen von E-Mails, da dies eines der Modelle ist, die wir derzeit implementieren möchten. Er wird jedoch im Grunde nicht vom Team akzeptiert, da jeder denkt, dass Jupyter, Python usw. wertlos sind. Sie brauchen es nicht und sind glücklich mit dem, was sie haben und zu meiner Überraschung auch mit dem, was sie gerade tun.

Die Roadmap unseres Unternehmens soll jedoch mehr zu einer IT/Data-Science-Einheit werden. Ich möchte, dass wir uns als Unternehmen darauf konzentrieren, analytische Modelle zu erstellen, Dashboards zu automatisieren und NICHT Daten auszuwählen und Excel-Daten zu versenden!

Ich weiß, dass dies ein tiefgreifendes kulturelles Thema ist, und ich versuche derzeit, es zu lösen, indem ich:

  1. In Zukunft nur noch Mitarbeiter einstellen, die nur R/Python und umfangreiche Analytik kennen, um den kulturellen Wandel voranzutreiben
  2. Angebot von Python-Kursen für bestehende Mitarbeiter und Unterstützung bei der Einarbeitung

Ich habe kürzlich mitgeteilt, dass wir immer noch SPSS Modeler haben werden, ABER für die richtigen Probleme, da Python das richtige Werkzeug für andere Probleme ist.

Ich wollte auch mitteilen, dass wir ab jetzt nur noch Modelle in Python/R entwickeln, da einige unserer bestehenden Modelle nur in SPSS Modeler erstellt wurden und nicht gut funktionieren.

Ich habe auch das Gefühl, dass ich das Team davon überzeugen möchte, Jupyter noch mehr zu verwenden, und sie sehen dann die Möglichkeiten.

Wie würden Sie diesen kulturellen Wandel mit Jupyter/Python vorantreiben, um unserem Ziel, ein IT-/Data-Science-Unternehmen zu werden, näher zu kommen!

Wenn Sie die Autorität haben, tun Sie es einfach und lassen Sie die derzeitige Vorgehensweise auslaufen
Es klingt für mich so, als müssten Sie die Funktionen hier trennen. Die Berichterstattung ist nicht tot, sie wird nicht durch maschinelles Lernen überholt (ich weiß nicht, ob Sie das vorschlagen). Ihr Team klingt wie ein OK-Reporting-Team, auch wenn SPSS auch hier nicht das beste Tool ist, aber Sie brauchen ein (separates) Team, das ML / Data Science betreibt. Quadratische Stifte, runde Löcher usw.
@JoeStevens Danke für deinen Rat. Im Grunde würden Sie diesen neuen Mitarbeiter also zum Lead Data Scientist für Modelle machen, richtig? Wenn jemand aus dem Team Modelle machen will, muss er grundsätzlich Teil dieser neuen Infrastruktur sein.
Es ist besorgniserregend, dass sie Python für "wertlos" für die Datenarbeit halten. SQL macht einige Dinge wirklich, wirklich gut (und sollte gegebenenfalls zusammen mit Python verwendet werden), aber was tun sie für alles andere?
@Oso Um ehrlich zu sein, verwendet jeder SPSS für fast alles. Erstellen von ETL-Jobs, Auswählen von Daten und WENN wirklich benötigt, können einige auch leichtes SQL codieren, das in SPSS Modeler implementiert wird. Im Grunde kennt mein direkter Teamleiter SPSS Modeler gut und jetzt muss es jeder benutzen.
Die Lösung hier könnte nicht einfacher sein, lassen Sie sie morgen gehen. (Oder heute, wenn es Ihre Zeitzone zulässt.) EINE HANDVOLL „Datenwissenschaftler“ sind unbezahlbar. Den Rest lass sie einfach gehen.
Es muss nicht einmal erwähnt werden, aber wer denkt oder erwähnt, dass „Python für Data Science nutzlos ist“, sollte einfach auf der Stelle gehen gelassen werden.

Antworten (2)

Sie brauchen es nicht und sind glücklich mit dem, was sie haben und zu meiner Überraschung auch mit dem, was sie gerade tun.

Hier hast du es. Ihr Team ist zufrieden mit dem, was sie tun, und ihre Tools funktionieren gut genug für sie. Sie müssen ihnen beweisen, dass Ihre Methoden besser oder notwendig sind. Auch der Heliozentrismus hatte dieses Problem – es war die bessere Theorie, aber es dauerte lange, bis sie sich tatsächlich als nützlich erwies.

Sie müssen ihnen gegenüber Ihren Standpunkt beweisen, sonst werden alle Schulungen und Vorschriften wirkungslos. Sie müssen Ihren Mitarbeitern gegenüber respektvoll sein und ihre Meinung einholen. Erfahren Sie, welche Vorteile sie in ihrem aktuellen Tool sehen. Quantifizieren Sie dann, was mit dem aktuellen System kaputt oder ineffizient ist und warum Ihre Tools überlegen sind. Gewähren Sie ihnen dann Ihre Unterstützung beim Erlernen der neuen Tools.

Dies ist definitiv ein Muster am Arbeitsplatz: ein überlegenes System / neue Leute kommen herein, haben aber Schwierigkeiten, sich durchzusetzen. Lassen Sie sich von erfahrenen Führungskräften beraten.

Nach dem, was Sie beschrieben haben, liegt das Problem nicht bei den Werkzeugen.

SPSS Modeler verwendet Python und Sie können dafür in Python codieren. Das Tool soll jedoch die Komplexität der Codierung und die einfache Bereitstellung reduzieren.

Der Wechsel zu Python/R, weil man nicht weiß, wie man die vollen Funktionen eines Tools nutzt, ist kein guter Grund für einen Wechsel.

Wenn Sie sich vom Management beteiligen möchten, müssen Sie nachweisen, dass die Kosten für den Wechsel und den Betrieb des neuen Tools die Kosten und den Zeitaufwand drastisch reduzieren werden.

Dies berücksichtigt (keine umfassende Liste)

  • Bestehende Prozesse auslaufen lassen
  • Umstellung auf neue Systeme (Zeit und Aufwand)
  • Weiterqualifizierung bestehender Mitarbeiter
  • Erwartungen der Mitarbeiter nach Erhalt neuer Fähigkeiten.
  • Betriebskosten des neuen Prozesses.
  • Kosten für die Suche/Einstellung neuer Mitarbeiter
  • Jede andere organisatorische Änderung.

Wie ich Sie verstehe, ist dies eher ein Computer-IT-/Entwicklungsteam. Sind Sie der Manager dieses Teams?

Wenn dies der Fall ist, ist ein Ansatz wie folgt.

  • Sehen Sie sich an, wo die Prozessautomatisierung durch benutzerdefinierte Knoten in SPSS verbessert werden kann
  • Lassen Sie Teammitglieder diese benutzerdefinierten Knoten in Python erstellen
  • Achten Sie darauf, dass sich 1-2 des Teams auf das Erlernen von Data Science-Fähigkeiten + Python konzentrieren.
  • Lassen Sie sie 1-2 Prozessabläufe in Python konvertieren (zuerst mit SPSS, dann mit nativem Python)

So bekommen Sie ein Gefühl dafür, ob sich eine solche organisatorische Veränderung lohnt. Sie werden möglicherweise auch das Team an Bord holen, um zu wechseln. Im schlimmsten Fall werden sie erfahrener und Prozessverbesserungen reduzieren Ärger.