UTZ Certified

Machine Learning

UTZ Certified

Kunde

UTZ certified
Branche: Labeling
Firmensitz: Amsterdam, Niederlande

Technologien

Unsupervised Fraud Detection

Ausgangssituation

UTZ certified ist eine Nichtregierungsorganisation (NGO), die Produkte wie Kaffee, Tee, Kakao und Haselnüsse von Bauern weltweit zertifiziert. Dieses Labeling bestätigt den nach UTZ certified festgelegten Standards nachhaltige Anbaumethoden, soziale Kriterien und eine strenge Überwachung der Lieferkette, um Transparenz im gesamten Prozess zu versichern.

Auftrag

Um die Transparenz noch zu steigern und mögliche Betrüge, die am Anfang des Prozesses durch Falschangaben über die Ernte gemacht wurden, auszuschließen, unterstützt die cimt ag UTZ certified dabei, mit Hilfe von Machine Learning, diese möglichst komplett auszuschließen. Dabei handelt es sich um eine sogenannte Fraud Detection, Betrugserkennung bzw. Anomalie Erkennung.

Herausforderungen

Um die Betrugserkennung mit Machine Learning zu lösen, muss zunächst die Verfügbarkeit der Labels, d.h. die Kennzeichnung der Daten, der zu untersuchenden Daten geprüft werden.

Man unterscheidet zwischen der supervised, semi-supervised und unsupervised Detection.

In diesem Fall sind keinerlei Labels verfügbar, so dass wir unmittelbar im Feld des unsupervised Machine Learnings sind. Die Unsupervised Fraud Detection Verfahrensweise ist aufgrund der fehlenden Labels die komplexeste aller drei aufgeführten Machine Learning Zweige und kann unter Umständen zu ungenauen Ergebnissen führen.

Technologien und Methoden

Um den o.g. Herausforderungen Stand halten zu können, arbeiten wir mit verschiedenen unsupervised Fraud Detection Algorithmen. Algorithmen, die auf verschiedenen Prinzipien beruhen, z.B. Nachbar-, Dichte-basiert oder Clustering. Die generierten Ergebnisse der Algorithmen liefern für jede Instanz einen Score, welcher mit allen anderen Score-Ergebnissen der Algorithmen zu einem finalen Score zusammengeführt wird. Eine solche Methode reduziert die mögliche Ungenauigkeit der unsupervised Machine Learning Verfahrensweise enorm.

Visualisierung des Outlier Scores des Algorithmus kNN Global

Um einen schnellen und reibungslosen Ablauf der Prozess zu ermöglichen, nutzten wir RapidMiner, welches ein weit verbreitetes Data-Mining Tool ist. 

Auszug aus RapidMiner Prozess

Ergebnisse

Mit unserer unsupervised Fraud Detection Verfahrensweise können wir UTZ certified ein stabiles Ergebnis liefern, welches anhand von Scores deutlich aufzeigt, welche Instanzen im Datensatz einen möglichen Betrug darstellen. Diese Scores können zukünftig in Labels umgewandelt werden, so dass das Trainieren einen supervised Models möglich ist und noch genauere Resultate liefert. 

Zusammenfassung

Wir beraten Sie gerne

Sie haben einen ähnlichen Fall? Vereinbaren Sie mit uns einen Termin mit uns. Wir freuen uns auf Sie!

WEITERE BUSINESS CASES
Nach oben scrollen