unsupervised Fraud Detection

Kunde

UTZ certified
Branche: Labeling
Firmensitz: Amsterdam, Niederlande

 

Technologien

RapidMiner
RapidMiner Extension „Anomaly Extension“
Python

    Ausgangssituation 

    UTZ certified ist eine Nichtregierungsorganisation (NGO), die Produkte wie Kaffee, Tee, Kakao und Haselnüsse von Bauern weltweit zertifiziert. Dieses Labeling bestätigt den nach UTZ certified festgelegten Standards nachhaltige Anbaumethoden, soziale Kriterien und eine strenge Überwachung der Lieferkette, um Transparenz im gesamten Prozess zu versichern.

    Auftrag

    Um die Transparenz noch zu steigern und mögliche Betrüge, die am Anfang des Prozesses durch Falschangaben über die Ernte gemacht wurden, auszuschließen, unterstützt die cimt ag UTZ certified dabei, mit Hilfe von Machine Learning, diese möglichst komplett auszuschließen. Dabei handelt es sich um eine sogenannte Fraud Detection, Betrugserkennung bzw. Anomalie Erkennung.

    Herausforderungen

    Um die Betrugserkennung mit Machine Learning zu lösen, muss zunächst die Verfügbarkeit der Labels, d.h. die Kennzeichnung der Daten, der zu untersuchenden Daten geprüft werden.

    Man unterscheidet zwischen der supervised, semi-supervised und unsupervised Detection.

    In diesem Fall sind keinerlei Labels verfügbar, so dass wir unmittelbar im Feld des unsupervised Machine Learnings sind. Die Unsupervised Fraud Detection Verfahrensweise ist aufgrund der fehlenden Labels die komplexeste aller drei aufgeführten Machine Learning Zweige und kann unter Umständen zu ungenauen Ergebnissen führen.

    Technologien und Methoden

    Um den o.g. Herausforderungen Stand halten zu können, arbeiten wir mit verschiedenen unsupervised Fraud Detection Algorithmen. Algorithmen, die auf verschiedenen Prinzipien beruhen, z.B. Nachbar-, Dichte-basiert oder Clustering. Die generierten Ergebnisse der Algorithmen liefern für jede Instanz einen Score, welcher mit allen anderen Score-Ergebnissen der Algorithmen zu einem finalen Score zusammengeführt wird. Eine solche Methode reduziert die mögliche Ungenauigkeit der unsupervised Machine Learning Verfahrensweise enorm.

    Alternativ Text
    Visualisierung des Outlier Scores des Algorithmus kNN Global

    Um einen schnellen und reibungslosen Ablauf der Prozess zu ermöglichen, nutzten wir RapidMiner, welches ein weit verbreitetes Data-Mining Tool ist. 

    Alternativ Text
    Auszug aus RapidMiner Prozess

    Ergebnisse

    Mit unserer unsupervised Fraud Detection Verfahrensweise können wir UTZ certified ein stabiles Ergebnis liefern, welches anhand von Scores deutlich aufzeigt, welche Instanzen im Datensatz einen möglichen Betrug darstellen. Diese Scores können zukünftig in Labels umgewandelt werden, so dass das Trainieren einen supervised Models möglich ist und noch genauere Resultate liefert. 

    Zusammenfassung

    • Ermöglichung der Bekämpfung von Betrugsfällen, bevor Ernte zertifiziert wird 
    • Zukunftsorientierte Umsetzung mit Hilfe von Machine Learning 
    • Unsupervised Fraud Detection 
    • Umsetzung mit RapidMiner und diversen Algorithmen 
    Wir beraten Sie gerne

    Sie haben einen ähnlichen Fall? Vereinbaren Sie mit uns einen Termin mit uns. Wir freuen uns auf Sie!

    Weitere Business Cases
    ZU ALLEN REFERENZEN

    Sie möchten mehr erfahren?