Machine learning nog niet geschikt voor betrouwbare fraudedetectie

De huidige machine learning is nog niet volwassen genoeg voor een betrouwbare fraudedetectie

Machine learning nog niet geschikt voor betrouwbare fraudedetectie

Bijna de helft van de bedrijven in Nederland heeft te maken gehad met fraude, corruptie of witwassen, blijkt uit onderzoek van accountants- en adviesorganisatie EY. Veel organisaties zijn dan ook begrijpelijk geïnteresseerd in fraudedetectie-oplossingen waarbij gebruik wordt gemaakt van kunstmatige intelligentie en machine learning. Een computer is immers sneller en slimmer dan een mens, is nog altijd de heersende gedachte. Maar de huidige machine learning is nog niet volwassen genoeg voor een betrouwbare fraudedetectie, stelt Erik Biemans, lead analist bij Fox-IT.

Artificial Intelligence (AI) heeft de toekomst. Daar is vrijwel iedereen het wel over eens. Maar die toekomst ligt echt nog een heel eind voor ons. “Vergelijk het met een kind”, zegt Biemans. “Die kan ook niet direct na de geboorte lopen, praten of fietsen. Je moet een kind dingen leren, opvoeden. Datzelfde geldt voor AI.”

En dat opvoeden, in de IT ook wel ‘supervised learning’ genoemd, neemt veel tijd in beslag. Bij supervised learning leren mensen het systeem wat wel en niet klopt. “Wil je bijvoorbeeld dat een systeem gezichten kan herkennen, dan moet je duizenden foto’s aanbieden en aangeven op welke foto een gezicht te zien is en op welke foto niet. Alleen zo leert een algoritme zelf de juiste inschatting te maken.”

Bij fraudedetectie is het bovendien belangrijk dat het systeem niet alleen leert wat legitiem gedrag (true negative) is, maar ook wat frauduleus gedrag (true positive) is. “Hoe meer van beide soorten wordt aangeboden aan het systeem, hoe beter het de verschillen leert onderscheiden. Het lastige is echter dat veel organisaties beschikken over slechts een beperkte hoeveelheid fraudecases. Dat beperkt de kracht van supervised learning.”

Samenwerking tussen mens en machine

De tegenhanger van deze manier van leren is ‘unsupervised learning’, waarbij een grote hoeveelheid data aan het systeem wordt aangeboden en het algoritme de afwijkingen eruit haalt “Op dit moment is machine learning op zichzelf nog niet volwassen genoeg voor betrouwbare fraudedetectie”, stelt Biemans. Hij is van mening dat unsupervised learning een fraude-analist kan helpen in het voorwerk, waarna de uitkomsten aan een supervised learningsysteem kunnen worden gevoed.   Deze manier van samenwerking tussen mens en machine wordt ook wel ‘augmented intelligence’ genoemd.

Dat systemen op de lange termijn wél zelf fraude leren herkennen, is een voorspelling die Biemans wel durft te maken. “Maar voor het zover is, moet het systeem uitvoerig leren welk gedrag indicatief is voor fraude en wat niet.” Daarom pleit hij voor waarbij fraudeonderzoekers worden bijgestaan door unsupervised learning om het voorwerk te doen en irrelevante data weg te filteren. De eindconclusie van een onderzoek kan vervolgens worden ingevoerd in een systeem dat gebruik maakt van supervised learning.

Het onderzoeken van fraude vereist ervaring en domeinkennis. Door ontwikkelingen in de financiële sector, zoals bijvoorbeeld PSD2 en de invoering van Instant Payments, is het noodzakelijk dat ook de functie van fraudeonderzoeker een ontwikkeling doormaakt. Machine learning kan daar een rol in spelen. “Slimme algoritmes kunnen onderzoekers helpen een grote hoeveelheid datapunten behapbaar te maken. Door de verkregen conclusies vervolgens weer aan een ander slim systeem te voeren, kan dat systeem getraind worden om op termijn nóg meer frauduleuze transacties zelfstandig te ontdekken.” Maar het optimaal trainen van een systeem om dit te doen, kan jaren tijd in beslag nemen.

Inzichtelijke black box

Het is daarnaast belangrijk dat een slim algoritme geen ‘black box’ vormt waarvan niemand weet hoe het tot zijn conclusie is gekomen, benadrukt Biemans. Liefhebbers van de comedyserie Little Britain herkennen vast de zin ‘Computer says no’, waarin de onnavolgbare keuze van een computer onopgehelderd blijft.

“Wanneer een bedrijf de salarissen ineens niet meer kan uitbetalen, omdat transacties ten onrechte als frauduleus zijn aangemerkt, wil je wel graag weten op welke gronden dat is. Alleen de verklaring ‘omdat de computer dat nou eenmaal bepaald heeft’ volstaat dan echt niet. Mensen moeten de denkstappen die het algoritme heeft genomen, kunnen uitleggen, zodat helder is hoe een systeem tot zijn beslissing is gekomen. De huidige algoritmes bieden dat inzicht over het algemeen niet.”

Om  tot succesvolle detectie van fraude te komen, moeten de systemen dus eerst worden opgevoed; door mensen. En is het nog niet de silver bullet die alle problemen oplost. “Vooralsnog hebben we aan machine learning een peuter die al een paar woordjes kan zeggen, maar de wereld nog niet goed snapt en vaak aan het handje moet worden meegenomen. Augmented intelligence is voor die peuter de weg naar jongvolwassenheid.”

Nu bij Fox-IT

Neem contact op

+31 (0) 15 284 79 99

fox@fox-it.com

Delft