Solutions
- Lösungsbausteine – Mobile
  
  Bewertung des Reifegrads von Daten und KI
  
  Fahrplan zur Verbesserung der Reife von Daten und KI.
  
  Pulse
  
  Optimiere Deine Arbeitsabläufe mit Generativer KI.
  
  Arc
  
  Verwaltung von KI- und ML-Workloads
  
  Lösungskatalog
  
  Speziell angefertigte Generative KI-Lösungen.
Services
- Dienstleistungen Block – Mobile
  
  Datenmodernisierung
  
  Erstelle intelligente Infrastruktur.
  
  Daten-Strategie
  
  Modernisiere Deine Daten & KI Strategie.
  
  Generative KI
  
  Nutzung von Generativer KI auf AWS.
  
  Managed AI
  
  Verwalte die Lebenszyklen von KI- und ML-Workloads.
Industries
- Industries Block – Mobile
  
  Einzelhandel
  
  Steigere Deinen Erfolg im Einzelhandel mit AWS.
  
  Sport
  
  Das Sporterlebnis verbessern.
  
  Telekommunikation
  
  Telekommunikation im Wandel.
  
  Finanzen
  
  Die Zukunft der Finanzen neu erfinden.
  
  Medien & Unterhaltung
  
  Entdecke die Zukunft der Medien.
  
  Gesundheitswesen & Biowissenschaften
  
  Innovatives Gesundheitswesen mit AWS.
  
  Alle anzeigen
  
  Branchenübergreifende Anwendung von Fachwissen.
Content hub
- Content Hub Block – Mobil
  
  Events
  
  Die neuesten Firemind & AWS Events.
  
  Fallstudien
  
  Erfahre mehr über Kundenprojekte.
  
  Insights
  
  Erfahre die neuesten Insights.
  
  Presse
  
  Neuigkeiten & Erfolge.
About us
- Über uns – Mobile
  
  Über uns
  
  Wer wir sind und was wir tun.
  
  Karriere
  
  Entdecke Deine nächste Chance.
  
  Partnerschaften
  
  Gemeinsam mehr erreichen.
  
  Blog
  
  Neuigkeiten von Firemind.
  
  Podcast
  
  Entdecke alle Episoden des Full Circle Podcasts.
Kontakt aufnehmen
Deutsch
- English (Englisch)

Reduziere die Kosten und die Komplexität der Vorverarbeitung von Machine Learning

Vor einer Woche schrieben Nate Bachmeier, AWS Senior Solutions Architect, und Marvin Fernandes, Solutions Architect, einen aufschlussreichen Artikel auf dem AWS Machine Learning Blog. Darin beschreiben sie eine Lösungsübersicht, die sowohl die Komplexität als auch die Kosten bei der Vorverarbeitung von Machine Learning reduziert! Diese Aussage hat unsere Aufmerksamkeit geweckt. Lassen Sie uns tiefer einsteigen!

Die Lösung

Die Lösung drehte sich um die gemeinsame Nutzung von Amazon Simple Storage Service(Amazon S3) und Anpassungen an der Pipeline, die auf unstrukturierten Daten (wie Video, Audio und Freiformtext) trainiert. Die von AWS verfeinerte Lösung zeigte ein klares Muster für eine deutliche Reduzierung der Komplexität, der Kosten und der zentralen Verwaltung des zweiten Schritts (wenn es um die Eingaben von Datenwissenschaftlern/Ingenieuren geht).

AWS Infrastruktur-Diagramm für AWS Insight

Die grundlegende Infrastruktur, insbesondere die Normalisierung von Datensätzen, die zum Trainieren von Machine Learning-Modellen verwendet werden.

So funktioniert die „elegante“ Lösung von AWS

„Wenn ML-Algorithmen unstrukturierte Daten wie Bilder und Videos verarbeiten, sind verschiedene Normalisierungsaufgaben (wie Grauskalierung und Größenänderung) erforderlich. Dieser Schritt dient dazu, die Konvergenz des Modells zu beschleunigen, eine Überanpassung zu vermeiden und die Vorhersagegenauigkeit zu verbessern. Sie führen diese Vorverarbeitungsschritte oft an Instanzen durch, die später das KI-Training durchlaufen. Dieser Ansatz führt zu Ineffizienzen, da diese Ressourcen in der Regel über teurere Prozessoren (z. B. GPUs) verfügen, als für diese Aufgaben erforderlich sind. Stattdessen externalisiert unsere Lösung diese Vorgänge über wirtschaftliche, horizontal skalierbare Amazon S3 Object Lambda-Funktionen.

Dieses Designmuster hat drei entscheidende Vorteile. Zunächst zentralisiert es die gemeinsamen Datenumwandlungsschritte, wie die Bildnormalisierung und die Beseitigung von ML-Pipeline-Code-Duplikationen. Zweitens vermeiden die S3 Object Lambda-Funktionen durch JIT-Konvertierungen Datenkonsistenzprobleme bei abgeleiteten Daten. Und schließlich reduziert die serverlose Infrastruktur den betrieblichen Overhead, erhöht die Zugriffszeit und begrenzt die Kosten auf die Zeit pro Millisekunde bei der Ausführung Ihres Codes.

Es gibt eine elegante Lösung, bei der Sie diese Datenvorverarbeitungs- und Datenkonvertierungsvorgänge mit S3 Object Lambda zentralisieren können. S3 Object Lambda ermöglicht es Ihnen, Code hinzuzufügen, der Daten aus Amazon S3 verändert, bevor er sie an eine Anwendung zurückgibt. Der Code wird innerhalb einer AWS Lambda-Funktion ausgeführt, einem serverlosen Rechenservice. Lambda kann sofort auf Zehntausende von parallelen Läufen skalieren und unterstützt Dutzende von Programmiersprachen und sogar benutzerdefinierte Container.“ – AWS Team für Lösungsarchitektur

Ajish Palakadan, Chief Technology Officer bei Firemind, sagt: „Als ML- und KI-Spezialist freuen wir uns, Amazon SageMaker auf neue und spannende Weise zu nutzen. Kostenreduzierung ist immer ein wichtiger Teil eines Kundenprojekts, und die Nutzung der neuesten Lösungen, um dies zu ermöglichen, ist das, was uns von anderen unterscheidet.“ Ajish Palakadan, Chief Technology Officer bei Firemind

Die feinen Details

Bei der im obigen Infrastrukturdiagramm dargestellten Lösung enthält der S3-Bucket die zu verarbeitenden Rohbilder. Anschließend müssen Sie einen S3 Access Point für die Bilder erstellen. Wenn Sie mehrere Ebenen von Modellen für maschinelles Lernen erstellen, sollten Sie für jedes Modell einen eigenen S3 Access Point anlegen.

Alternativ unterstützen die AWS Identity and Access Management (IAM)-Richtlinien für Zugangspunkte die gemeinsame Nutzung wiederverwendbarer Funktionen in ML-Pipelines. Dann hängen Sie eine Lambda-Funktion mit Ihrer vorverarbeitenden Geschäftslogik an den S3 Access Point. Nachdem Sie die Daten abgerufen haben, rufen Sie den S3 Access Point auf, um JIT-Datentransformationen durchzuführen. Schließlich aktualisieren Sie Ihr ML-Modell, um den neuen S3 Object Lambda Access Point zum Abrufen von Daten aus Amazon S3 zu verwenden.

Der ursprüngliche Artikel führt Sie dann durch die Erstellung des S3 Object Lambda-Zugangspunkts und erläutert die typischen Kosteneinsparungsanalysen, die die Ineffizienzen der Standardmodellschulung berücksichtigen. Wir empfehlen Ihnen, sich den Artikel anzuschauen und sich Zugang zu der scrollbaren Python-Sprache zu verschaffen (die Ihnen hilft, eine Lambda-Funktion zu erstellen, die die Anpassung und Konvertierung der Bilder vornimmt).

Kontakt aufnehmen

Möchtest Du mehr erfahren?

Hast Du eine bestimmte Fallstudie oder ein Thema gesehen und möchtest mehr erfahren? Oder denkst Du über Dein nächstes Projekt nach? Schreibe uns eine Nachricht!

Entdecke die neuesten AWS Insights von Firemind

Mai 22, 2025

Lösungen

Beschleunige die Reise zur Generativen KI

Bewertung des Reifegrads von Daten und KI

Pulse

Arc

Lösungskatalog

Services

Erschließe den langfristigen geschäftlichen Mehrwert

Datenmodernisierung

Daten-Strategie

Generative KI

Managed AI

Branchen

Innovation in allen Branchen fördern

Einzelhandel

Sport

Telekommunikation

Finanzdienstleistungen

Medien & Unterhaltung

Gesundheitswesen & Biowissenschaften

Events

Fallstudien

Insights

Presse

IDP und Agentische Arbeitsabläufe: Die wichtigsten Erkenntnisse des Gipfels

Über uns

Karriere

Partnerschaften

Blog

Podcast

Shay O’Carroll schließt sich Firemind als Business Development Executive an

Bewertung des Reifegrads von Daten und KI

Pulse

Arc

Lösungskatalog

Datenmodernisierung

Daten-Strategie

Generative KI

Managed AI

Einzelhandel

Sport

Telekommunikation

Finanzen

Medien & Unterhaltung

Gesundheitswesen & Biowissenschaften

Alle anzeigen

Events

Fallstudien

Insights

Presse

Über uns

Karriere

Partnerschaften

Blog

Podcast

Reduziere die Kosten und die Komplexität der Vorverarbeitung von Machine Learning

Kontakt aufnehmen

Möchtest Du mehr erfahren?

Entdecke die neuesten AWS Insights von Firemind

KI-Agenten und ihr Potenzial im Bankwesen verstehen

Die Entwicklung der generativen KI in der intelligenten Dokumentenverarbeitung: Leitfaden 2025

Wie Sie das volle Potenzial der generativen KI für Ihr Unternehmen erschließen können

Lösungen

Services

Entdecke

Über uns

Ressourcen