Verbessertes Hosting durch Amazon Web Services für Samba Safety

Auf einen Blick

Samba Safety setzt sich für sicherere Gemeinschaften ein, indem es das Risiko für Fahrer reduziert. Ihre Software, die in der Automobil- und Schifffahrtsbranche eingesetzt wird, hilft Fahrern, ein risikoarmes Profil zu erstellen, um Verletzungen und Schäden zu vermeiden.

Herausforderung

Das Data-Science-Team von Samba Safety benötigte Unterstützung bei der Erweiterung seiner Arbeitsabläufe mit der kontinuierlichen Bereitstellung, um manuelle Modellpflegeaufgaben zu reduzieren.

Lösung
Firemind hat zwei ML-Pipelines für Samba Safety erstellt: eine für das Modelltraining und eine für die Inferenz, die AWS-Services nutzt.
Genutzte Dienste
  • Amazon SageMaker
  • AWS Step Functions
  • AWS Lambda
  • AWS CodeStar
Ergebnisse
  • 70% weniger Zeit bis zur Lieferung
  • Schnellere Bereitstellungszeiten und verbesserte Genauigkeit
Geschäftliche Herausforderungen

Automatisierung der manuellen Modellbereitstellung und Integration mit dem Data-Science-Workflow von Samba Safety

Das Data-Science-Team von Samba Safety nutzte schon seit langem die Macht der Daten, um ihr Unternehmen zu optimieren. Es verfügte über mehrere erfahrene Ingenieure und Wissenschaftler, die aufschlussreiche Modelle entwickelten, um die Qualität der Risikoanalyse auf ihrer Plattform zu verbessern. Die Herausforderungen, mit denen dieses Team konfrontiert war, hatten nichts mit Data Science zu tun. Das Data-Science-Team von Samba Safety benötigte Unterstützung, um seinen bestehenden Data-Science-Workflow mit einer Continuous-Delivery-Lösung zu optimieren.

Das Data-Science-Team von Samba Safety pflegte mehrere skriptähnliche Artefakte als Teil seines Entwicklungsworkflows. Diese Skripte führten verschiedene Aufgaben aus, darunter Datenvorverarbeitung, Feature Engineering, Modellerstellung, Modelloptimierung sowie Modellvergleich und -validierung. Diese Skripte wurden alle manuell ausgeführt, wenn neue Daten zum Training in der Umgebung eintrafen. Außerdem führten diese Skripte keine Modellversionierung und kein Hosting für Inferenzen durch. Das Data-Science-Team von Samba Safety hatte manuelle Workarounds entwickelt, um neue Modelle in die Produktion zu überführen, aber dieser Prozess wurde zeitaufwändig und arbeitsintensiv.

Um die hochqualifizierten Data-Science-Teams von Samba Safety für neue ML-Workloads zu entlasten, mussten die manuellen Aufgaben im Zusammenhang mit der Pflege bestehender Modelle automatisiert werden. Außerdem sollte die Lösung den manuellen Arbeitsablauf des Data-Science-Teams von Samba nachbilden und Entscheidungen über das weitere Vorgehen auf der Grundlage der Ergebnisse dieser Skripte treffen.

Schließlich musste die Lösung in die bestehende Codebasis integriert werden. Das Data-Science-Team von Samba Security verwendete eine Code-Repository-Lösung außerhalb von AWS. Die endgültige Pipeline musste so intelligent sein, dass sie auf der Grundlage von Aktualisierungen der Code-Basis, die hauptsächlich in R geschrieben wurde, ausgelöst werden konnte.

Stehst Du vor ähnlichen Herausforderungen?

Wir sind Spezialisten für die Lösung von Problemen mit Daten und KI. Lass uns Dir helfen, die Vorteile der Cloud zu nutzen.

Was unsere Kunden sagen

Höre direkt von denjenigen, die unsere Dienstleistungen in Anspruch genommen haben. Entdecke, wie wir für unsere Kunden den Unterschied gemacht haben.

Lösung

Automatisierte Pipeline für maschinelles Lernen unter Nutzung der AWS-Dienste

Die Lösung für das Data-Science-Team von Samba Security wurde um zwei ML-Pipelines herum aufgebaut. Die erste ML-Pipeline trainierte ein Modell mit Hilfe von Sambas benutzerdefinierten Skripten für die Datenvorverarbeitung, das Training und die Tests. Das daraus resultierende Modell-Artefakt wird für Batch- und Echtzeit-Inferenzen an Modell-Endpunkten bereitgestellt, die von Amazon SageMaker verwaltet werden.

Die zweite ML-Pipeline erleichtert die Inferenzanfrage an das gehostete Modell. Auf diese Weise ist die Pipeline für das Training von der Pipeline für die Inferenz entkoppelt. Eine der Schwierigkeiten bei diesem Projekt besteht darin, die manuellen Schritte der Datenwissenschaftler von Samba Security zu replizieren. Das Team von Firemind verwendete AWS Step Functions und SageMaker Processing, um diese Aufgabe zu bewältigen. Mit Step Functions können Sie Aufgaben in AWS mithilfe von AWS Lambda-Funktionen, Amazon Elastic Kubernetes Service (Amazon EKS) Workern oder in diesem Fall SageMaker ausführen. Mit SageMaker Processing kann man Aufgaben definieren, die auf verwalteten ML-Instanzen innerhalb des SageMaker-Ökosystems ausgeführt werden. Jeder Lauf eines Step Function-Jobs führt seine eigenen Protokolle, Laufhistorie und Details über den Erfolg oder Misserfolg des Jobs. Das Team nutzte Step Functions und SageMaker zusammen mit Lambda, um die Automatisierung von Training, Tuning, Bereitstellung und Inferenz-Workloads zu bewältigen.

Das einzige, was noch fehlte, war die kontinuierliche Integration von Codeänderungen in diese Bereitstellungspipeline. Firemind implementierte ein CodeStar-Projekt, das eine Verbindung zum bestehenden Code-Repository von Samba Security herstellte. Sobald das Data-Science-Team von Samba Security eine Aktualisierung an einem bestimmten Branch der Codebasis vornimmt, greift CodeStar die Änderungen auf und löst die Automatisierung aus.

Verbesserte Analyse

Wir waren in der Lage, den bestehenden Data-Science-Workflow von Samba Safety mit einer kontinuierlichen und skalierbaren Delivery Pipeline zu verbinden.

Skalierbare Automatisierung

Der Einsatz von Amazon Sagemaker und Step Functions half, die Vorteile eines automatisierten Workflows voll auszuschöpfen. Es wurde sichergestellt, dass die Trainings-, Abstimmungs-, Bereitstellungs- und Inferenz-Workloads ohne eine Instanz ablaufen konnten.

Kontakt aufnehmen

Möchtest Du mehr erfahren?

Hast Du eine bestimmte Fallstudie oder ein Thema gesehen und möchtest mehr erfahren? Oder denkst Du über Dein nächstes Projekt nach? Schreibe uns eine Nachricht!