Welche Softwarelösung sollte ich verwenden, um Predictive Analytics (als Neuling) einzusetzen?

Ich bin Business Intelligence-Analyst und arbeite fast ausschließlich mit SQL Server Management Studio (SSMS) und Tableau, um BI-Berichte zu erstellen. Ich würde gerne anfangen, einige prädiktive Analysen einzubauen, und es scheint eine Vielzahl von Optionen zu geben. Ich hätte gerne die Einblicke von Leuten, die im Bereich maschinelles Lernen/Data Science gearbeitet haben, wie man vorgeht. Es sieht so aus, als gäbe es eine Vielzahl von Optionen

Meine objektiven Kriterien sind:

1.) Erlernen und verwenden Sie Predictive Analytics ziemlich schnell in einem Gesundheitsumfeld.

Meistens sind meine Ergebnisvariablen binär (hat jemand einen Rückfall erlitten oder nicht), meine Eingabevariablen sind eher kategorisch (in welchem ​​Programm waren sie?) und es handelt sich um EHR-Daten für Menschen mit psychischen Erkrankungen, daher gibt es nur wenige konkrete Metriken und weit dazwischen (was war ihre Bewertung der Fähigkeiten?).

2.) Halten Sie den Datenimport/-export zwischen SSMS und den Tools, mit denen ich am Ende arbeite, einfach

Ich brauche eine einfache Berichterstellung und die Minimierung der Anzahl der eingesetzten Softwareplattformen – mit zu vielen Tools werden unsere Benutzer überlastet, daher möchte ich dieselbe Berichterstellungsplattform (im Moment Tableau) verwenden.

3.) Haben Sie eine robuste Benutzerbasis für alles, was letztendlich verwendet wird

Ich möchte in der Lage sein, ohne Probleme oder veraltete/Nischensoftware, die niemand verwendet, zu lernen und Fehler zu beheben. Ich bin kein großer Autodidakt, daher wäre es schön, wenn es gute Online-Unterstützung/Tutorials gäbe. Netzwerkeffekte rocken!

Daher habe ich oberflächlich untersucht, was Microsoft bereits hat: Es scheint, dass es R Client, Microsoft Machine Learning Server (ehemals Microsoft R Server) und SQL Server Machine Learning Services (In-Database) und das einfache alte R gibt.

Die In-Database-Option sieht gut aus, insbesondere weil ich gespeicherte Prozeduren vom Front-End ausführen könnte und vorhersagende Datenergebnisse - selbst wenn es nur Regressionsanalyseergebnisse sind - an den Benutzer zurückkommen. Ich möchte jedoch die verschiedenen R-Bibliotheken verwenden können (ggplot2 sieht fantastisch aus) und bin mir nicht sicher, ob das machbar ist.

Der R-Server sieht auch gut aus, aber ich möchte auch hier die Ausgabe in Tableau integriert halten, damit die Benutzer ein einziges Tool haben. Wenn ich Tableau immer noch verwenden könnte, um eine gespeicherte Prozedur mit Eingabeparametern zu starten, die an den R-Server übergeben werden und die resultierenden Daten an sie zurückkommen, wäre das großartig. Ich weiß nur nicht, ob die Ergebnisse speicherbar sind und wenn ja, können sie in der von SSMS verwendeten Datenbank aufbewahrt werden.

Ich habe keine Ahnung, was R-Client tut; Angesichts der Tatsache, dass ich für eine kleine Organisation mit einer 6-köpfigen IT-Abteilung arbeite, ist das vielleicht eine bessere Option. Hat aber wohl auch seine Schattenseiten.

Es gibt hier wahrscheinlich eine Menge Verwirrung und ich hoffe, Sie verzeihen meine Naivität, aber es gibt eine Menge Informationen da draußen. Ich versuche, eine ausreichende und zufriedenstellende Lösung zu finden, die eine solide Rechtfertigung für den Kauf hat, bevor wir viel in etwas investieren. Ich tendiere zu Microsoft Machine Learning Server (ehemals R Server), bin aber sehr offen für Abmahnungen. Irgendwelche Vorschläge?

Danke!

Aaron

Antworten (1)

Ich habe kürzlich einen Online-Kurs für Datenanalyse und Big-Data-Analyse besucht. Der Kurs beinhaltete die R-App, ein kostenloses Open-Source-Analyseprogramm. Der Kurs umfasste auch Abschnitte zu Tableau für seine Visualisierungsprozesse. Die beiden Codes scheinen gut zusammenzuarbeiten. R verfügt über eigene Plotroutinen, jedoch nicht auf der Ebene von Tableau. Ich würde empfehlen, dass Sie R ausprobieren und sehen, ob es Ihren Anforderungen entspricht. R scheint sehr leistungsfähig und einfacher zu sein, als Sie mit Python zu rollen.

Komisch, aber ich verachte die R-Sprache besonders im Vergleich zu Python. In jedem Fall müssen Sie Code schreiben.