Khalil Adib erforscht Amazon SageMaker und YOLOv5 für die Erkennung und Verfolgung von Objekten
Lernen Sie Khalil Adib kennen, einen der Data Scientists von Firemind mit einer Leidenschaft für künstliche Intelligenz (AI) und maschinelles Lernen (ML). Neben seinen Kundenprojekten hat Khalil mit AWS-Diensten wie Amazon SageMaker und den API-Ergänzungen von YOLOv5 für die Erkennung und Verfolgung von Objekten experimentiert. Lesen Sie weiter unten, um mehr über diese Zusammenarbeit von Diensten zu erfahren und darüber, wie sie für eine Reihe von intelligenten Anwendungen in verschiedenen Branchen und Sektoren genutzt werden können.
Bevor wir uns also mit Khalils eigenem Test von YOLOv5 und Amazon SageMaker befassen(unter Verwendung einiger unserer vergangenen Team-Event-Aufnahmen), lassen Sie uns zunächst einen Blick auf die Objektsegmentierung, die Erkennung und deren Einsatzmöglichkeiten werfen.
Objekterkennung und Segmentierung sind zwei wichtige Aufgaben in der Computer Vision, für die es eine Vielzahl von Anwendungen im realen Leben gibt. Bei der Objekterkennung wird die Position von Objekten in einem Bild oder Videostream identifiziert, während bei der Segmentierung ein Bild auf der Grundlage seiner visuellen Eigenschaften in mehrere Segmente oder Regionen unterteilt wird.
Eine der häufigsten Anwendungen der Objekterkennung ist in autonomen Fahrzeugen zu finden, wo die Technologie eingesetzt wird, um Hindernisse auf der Straße zu erkennen und dem Fahrzeug zu helfen, sicher zu navigieren. Die Objekterkennung kann auch in Überwachungssystemen eingesetzt werden, um Personen oder Objekte von Interesse zu erkennen und zu verfolgen. Im Einzelhandel kann die Objekterkennung eingesetzt werden, um den Bestand zu verfolgen und das Kaufverhalten der Kunden zu überwachen. Außerdem kann die Objekterkennung und -segmentierung in der medizinischen Bildgebung eingesetzt werden, um Krankheiten wie Krebs zu erkennen und zu diagnostizieren.
Als ein Amazon Web Services (AWS) All-in-Beratungsunternehmen arbeiten wir eng mit einer Reihe von Diensten zusammen, die mit Objekterkennung und Segmentierung zu tun haben. Amazon Rekognition zum Beispiel ist ein Cloud-basierter Bild- und Videoanalysedienst, der Objekte und Szenen erkennen sowie Gesichter analysieren und Text erkennen kann. Amazon SageMaker ist ein weiterer AWS-Service, der Funktionen für maschinelles Lernen bietet, einschließlich der Schulung Ihrer benutzerdefinierten Objekterkennungs- und Segmentierungsmodelle, die auf AWS trainiert und bereitgestellt werden können. Aus diesem Grund hat sich Khalil für SageMaker entschieden, da es unglaublich gut mit Objekterkennung und alternativer Software wie YOLOv5 zusammenarbeitet.
Durch die Nutzung dieser Dienste können Unternehmen die Objekterkennung und -segmentierung schnell und einfach in ihre Anwendungen und Arbeitsabläufe integrieren. Computer Vision und Objekterkennung können zum Beispiel in Wohnhäusern und Geschäftsgebäuden eingesetzt werden, um die Sicherheit zu erhöhen und automatische Alarme auszulösen, wenn menschliche Bewegungen erkannt werden. Ein Gesundheitsdienstleister könnte die Objekterkennung und -segmentierung nutzen, um medizinische Bilder schnell und genau zu analysieren und so die Ergebnisse für die Patienten zu verbessern.
Ein Beispiel anhand unseres eigenen Testmaterials
Um diese Objekterkennung in die Praxis umzusetzen, lud Khalil einige Aufnahmen von einem früheren Firemind-Team-Event hoch. Das Filmmaterial enthielt eine Mischung aus verlangsamten Bewegungen und schnelleren Szenen, um YOLOv5 vor eine größere Herausforderung zu stellen. Wie Sie sehen werden, wenn Sie sich das Filmmaterial unten ansehen, wurde das Modell darauf trainiert, Personen zu erkennen und auf der Grundlage von erkennbaren Gesichtsmerkmalen, Körpertypen, der Positionierung der Gliedmaßen und anderen Datensätzen eine Bewertung vorzunehmen. Diese Datentypen bewerten eine Person mit einer „1“ für eine 100%ige Übereinstimmung mit den trainierten Daten bis hin zu einer „0“ (für keine Übereinstimmung – kommt nie vor).
Wie Sie im Video sehen können, leisten SageMaker und YOLOv5 bemerkenswert gute Arbeit bei der Klassifizierung der Personen in jeder Szene, selbst wenn nur Teile einer Person sichtbar sind. Außerdem erkennt und segmentiert es jede Person innerhalb eines zuverlässigen Rahmens, so dass die Genauigkeit beim Betrachten des Filmmaterials leicht zu erkennen ist.
Kontakt aufnehmen
Was bedeuten also Studien und Tests wie diese für den Einsatz von Objektklassifizierung, -erkennung und -segmentierung in der Zukunft? Ganz einfach. Es gibt einen wachsenden Bedarf an solchen Lösungen in vielen Branchen und Anwendungsfällen. Wir haben bereits einige in diesem Artikel erwähnt, aber Sie könnten weitergehen und Live-Video-Feedback untersuchen, um die richtige Körperhaltung und das Training von Sportlern zu untersuchen. Sie könnten diese Software einsetzen, um die Passantenströme in stark frequentierten Einkaufsstraßen zu überwachen und so einen weiteren Einblick in die Sicherheit in Zeiten hohen Verkehrsaufkommens zu erhalten.
Die Möglichkeiten sind grenzenlos. Und als Cloud-Beratungsunternehmen mit einer natürlichen Neigung zu dieser Art von ML-Projekten sind wir bereit, gemeinsam mit unseren Kunden das Beste aus SageMaker, Rekognition und Zusätzen wie YOLOv5 und YOLOv8 zu nutzen.
Kontakt aufnehmen
Möchten Sie mehr erfahren?
Haben Sie eine bestimmte Fallstudie oder einen Einblick gesehen und möchten Sie mehr erfahren? Oder denken Sie über Ihr nächstes Projekt nach? Schreiben Sie uns eine Nachricht!