Computer Vision hilft bei der Automatisierung vieler wichtiger Aufgaben im Geschäft, aber damit dies funktioniert, müssen Sie einer hohen Bilderkennungsgenauigkeit den Vorrang geben, um sich von der Konkurrenz abzuheben.

Auf dem schnelllebigen und wettbewerbsintensiven Einzelhandelsmarkt von heute haben die meisten Hersteller und Einzelhändler keinen genauen und zeitnahen Überblick über die Regalbedingungen oder verwertbare Einblicke in die Realität des Einzelhandels im Geschäft. Manuelle Audits durch das Verkaufspersonal, die die Regalbedingungen auf einem Handheld-Gerät dokumentieren, sind langsam, teuer, inkonsistent und führen zu subjektiven Daten.

Computer-Vision-Lösungen (CV) verändern die Art und Weise, wie Marken und Einzelhändler die Regale sehen. Diese Technologie bietet Herstellern einen Einblick in die Bedingungen im Einzelhandelsregal in Form eines digitalen Bildes und gibt Außendienstmitarbeitern nahezu in Echtzeit Hinweise, wie sie den Wert der Produkte steigern können.

Damit dies funktioniert, müssen Sie einer hohen Bilderkennungsgenauigkeit den Vorrang geben, um sich von der Konkurrenz abzuheben. In diesem Artikel werfen wir einen Blick hinter die Kulissen, um zu sehen, was nötig ist, um eine genaue Erkennung auf SKU-Ebene in kurzer Zeit und in großem Umfang zu ermöglichen.

Warum Genauigkeit wichtig ist

In einem typischen Lebensmittelgeschäft kann es mehr als 30.000 Artikel geben, von denen sich im Laufe des Jahres durchschnittlich 30 % durch neue Produkteinführungen und Verpackungsumgestaltungen ändern können. Zusätzlich zur Bewältigung der schieren Menge an Produkten muss eine automatische Erkennungsplattform auch andere Hürden für die Genauigkeit im Einzelhandel überwinden, wie z. B.:

  • Nahezu identische Produkte
  • undurchsichtige und spiegelnde Verpackungen und schlechte Blickwinkel
  • Schlechte Sichtbedingungen wie schlechtes Licht
  • Teilweise verdeckte Produkte
  • Änderungen im Produktlebenszyklus wie neue Designvarianten

Werden diese übersehen, kann dies zu ungenauen Daten führen - zum Beispiel zu einer falschen Berechnung des Anteils einer Marke am Regal aufgrund von teilweise verdeckten Produkten. Wenn diese unzuverlässigen Daten als Grundlage für Verkaufsentscheidungen verwendet werden, können sich die finanziellen Verluste im Laufe der Zeit schnell summieren.

Ein viergliedriger Ansatz zur Durchsetzung von Genauigkeit

Bei Trax werden diese Hürden durch einen rigorosen Ansatz zur Durchsetzung der Datenqualität überwunden, der auf den folgenden Maßnahmen beruht:

  1. Riesiger Bestand an Schulungsdaten

Computer Vision nutzt fortschrittliche neuronale Netze und Deep Learning-Techniken für Aufgaben wie die Objekterkennung. Sie ist dem menschlichen visuellen Kortex nachempfunden, d. h. ähnlich wie beim menschlichen Gehirn gilt: Je mehr man sieht, desto besser lernt man.

Mit einem ausreichend großen Bildspeicher können fortschrittliche Deep-Learning-Algorithmen Herausforderungen wie schlechte Beleuchtung und Hindernisse in Geschäften überwinden. Die genauesten Systeme sind diejenigen, die den Kontext der Regale erkennen und nicht nur Produkte, sondern auch leere Stellen in den Regalen schnell erkennen.

 

  1. Bilder in hoher Qualität

Während der Aufnahme sorgt ein Werkzeug zur Vermeidung von Unschärfe für ein scharfes Bild, während ein Schnappschuss-Tool den Benutzer darauf aufmerksam macht, wenn die Ausrichtung von einem früheren Bild abweicht. Um Lichtmangel auszugleichen, wird der Kamerablitz automatisch aktiviert, und ein eingebautes Nivellierungstool hilft dem Benutzer, seine Geräte im perfekten Winkel und Abstand zum Regal auszurichten.

  1. Mehrstufige Validierung

Ein aktives Lernsystem sorgt dafür, dass Produkte automatisch aus Bildern erkannt werden. Bildproben, bei denen es schwieriger ist, Produkte zu erkennen oder zu unterscheiden, durchlaufen eine zusätzliche Validierungsebene mit einem Prozess, der als Voting bekannt ist. Hier validieren qualifizierte Fachleute die gesammelten Daten, um zu prüfen, ob sie mit den tatsächlichen Bildern übereinstimmen. Das bedeutet, dass das System stets ein extrem hohes Maß an "Vertrauen" in seine Erkennungsgenauigkeit aufbringt, selbst bei identischen Produkten oder neuen Designs.

 

 

  1. Messung der Erkennungsgenauigkeit

Präzision ist das Kernstück moderner Deep-Learning-Systeme. Dies bedeutet, dass die Algorithmen wesentlich mehr relevante Ergebnisse liefern als irrelevante. Gleichzeitig muss er die meisten relevanten Ergebnisse liefern. Nehmen wir an, es befinden sich 100 Produkte in einem Regal. Ein Algorithmus kann 80 davon erkennen, von denen 77 richtig erkannt werden. Das bedeutet, dass die Erkennungsgenauigkeit 96 % beträgt.

Trax sorgt für Datentransparenz, indem es den Nutzern Web-Dashboards zur Verfügung stellt, auf denen die Genauigkeit der Erkennungsleistung, die Konfidenz, nicht identifizierte Produkte und andere Metriken dargestellt werden.

Schauen Sie sich dieses Video der Trax Computer Vision Plattform in Aktion an, um zu sehen, wie wir Bilder präzise in Erkenntnisse umwandeln.