Anmelden


Videoanalytik-Objekterkennung: Worum es sich bei der Objekterkennung und -identifizierung handelt

Bei der Videoüberwachungsanalyse ist die Objekterkennung und -identifizierung eine entscheidende Komponente. Mit dieser Funktion können Bediener ein bestimmtes Objekt, z. B. eine Person, ein Fahrzeug oder einen Rucksack, lokalisieren und dann von Bild zu Bild verfolgen. Das Ergebnis? Die Fähigkeit, das Objekt in stundenlangen Aufnahmen schnell zu identifizieren und damit Sicherheits- und Polizeiermittlern wichtige forensische Beweise zu liefern, Geschäftsinhabern dringend benötigte Einblicke zu verschaffen und einer Vielzahl von Nutzern bessere Anwendungen zu bieten.

Im Klartext bedeutet Objekterkennung einfach die Fähigkeit, Objekte in Videos zu erkennen - allerdings ist dieser Prozess alles andere als einfach, wenn er von einer fortschrittlichen Technologie ausgeführt wird. Im ersten Schritt, der "Objektextraktion", wird ein Objekt zu einem bestimmten Zeitpunkt erkannt und verfolgt. Dann wird eine weitere Technologie namens "Hintergrund/Vordergrund-Trennung" hinzugefügt, die einen statischen Hintergrund der Szene identifiziert.

Die Fähigkeit, Objekte aus dem Video zu extrahieren und sie von dem Hintergrund zu unterscheiden, vor dem sie erkannt werden, ermöglicht anspruchsvollere Videoanalyseaktivitäten, wie z. B. die forensische Suche, Echtzeit-Alarmierung oder die VIDEO SYNOPSIS®-Technologie, die alle extrahierten Videoobjekte gleichzeitig anzeigt, so dass die gesamte Aktivität einer stundenlangen Szene auf einmal und nicht in linearer Zeit betrachtet werden kann.

Wie funktioniert die Objekterkennung?
Wie wird nun die Objekterkennung - und die anschließende Objekterkennung - möglich gemacht? Durch künstliche Intelligenz. Künstliche Intelligenz und Deep Learning begegnen uns tagtäglich in Form von Tools wie Spracherkennung oder automatischen Übersetzungsdiensten. Deep Learning ist eine KI-gestützte Disziplin, bei der Computer durch den Kontakt mit Daten lernen und Aufgaben wie die Identifizierung von Objekten oder die Erkennung eines Objekts in einem Video ausführen. Damit Deep Learning erfolgreich sein kann, sind große Mengen an Daten erforderlich, die verarbeitet und mit Anmerkungen versehen werden müssen. Mit diesen Daten wird das Netzwerk dann so lange trainiert, bis es in der Lage ist, das zu wiederholen, wofür es trainiert wurde.

Bei der Objekterkennung werden die Trainingsdaten (im Falle der Videoanalyse das Video selbst) in Einzelbilder zerlegt, um jedes Objekt zu extrahieren und die neuronalen Netze des Systems für tiefes Lernen zu trainieren, damit sie bestimmte Objekte mit ihrer Klassifizierung und ihren Attributen verknüpfen können. Wenn Ermittler beispielsweise nach einem vermissten Kind suchen, das eine rosa Hose trägt, können sie die Videoanalyse nutzen, um Videobeweise nach Objekten zu durchsuchen, die das System als Personen erkennen kann, die eine rosa Hose tragen. Der Benutzer würde seine Suche anhand dieser Attribute filtern, und die Videoanalysesoftware wäre - nachdem sie mit großen Datensätzen von Personen, rosa Objekten und Hosen in Berührung gekommen ist - in der Lage, eine Abfrage anhand des tatsächlichen Filmmaterials zu beantworten: "Identifiziere alle Instanzen von Personen, die rosa Hosen tragen.

Um Übereinstimmungen zu erkennen, muss der Deep-Learning-Algorithmus wissen, was rosa ist, und er muss mit Tausenden von Datenbeispielen dieser Farbe gefüttert worden sein. Dies wird für so viele Objekte, wie erforderlich sind, bis ins Unendliche wiederholt.

Objektverfolgung
Es reicht nicht aus, dass ein Objekt erkannt wird, es muss auch verfolgt werden. Bei jeder Videosuche - sei es im Rahmen von Ermittlungen der Strafverfolgungsbehörden oder zur Gewinnung umfassenderer Geschäftsinformationen - ist es wichtig, dass das Objekt vom Eintritt in den Tatort bis zum Verlassen des Tatorts genau verfolgt werden kann, selbst wenn es ein Hindernis oder eine Menschenmenge gibt.

Sobald das Objekt erkannt und verfolgt wurde, können ihm beschreibende Informationen (oder Metadaten) zugeordnet werden, um eine umfangreiche strukturierte Datenbank mit klassifizierten Objekten zu erstellen. Dieser Schritt ermöglicht es der Technologie, stundenlanges Filmmaterial schnell zu untersuchen, um ein bestimmtes Objekt zu identifizieren - oder, wie in unserem Beispiel, die rosa Hose.

Wann wird sie eingesetzt?
Die Objektdetektion und -erkennung kann vor, während und nach einem Ereignis eingesetzt werden. Die Überprüfungsfunktionen ermöglichen die Untersuchung eines Ereignisses, das bereits stattgefunden hat. Es kann aber auch eine Echtzeit-Warnung aktiviert werden, die es ermöglicht, auf ein Ereignis zu reagieren, während es stattfindet, um Objekte von Interesse zu identifizieren. Die Objektdetektion und -erkennung findet auch außerhalb der Strafverfolgung Anwendung. So kann beispielsweise eine Echtzeitwarnung für eine bestimmte Kamera am Eingang einer Baustelle eingestellt werden, um sicherzustellen, dass jeder, der die Baustelle passiert, einen Schutzhelm trägt. Wenn jemand nicht das vorgesehene Objekt, in diesem Fall einen orangefarbenen Schutzhelm, trägt, wird eine Warnung an das Personal gesendet, das dann in Echtzeit reagieren kann.

Die Erkennung von Objekten ist eine wichtige technologische Grundlage für eine ausgefeilte Videoanalyse für verschiedene Geschäfts- und Sicherheitszwecke. Möchten Sie erfahren, wie die Videoanalyse Ihre tägliche Entscheidungsfindung durch umsetzbare Informationen optimieren kann? Machen Sie die BriefCam Business Case Bewertung.

AUTORIN: LIZZI GOLDMEIER