Uw datakwaliteit verbeteren door Master Data Management

07 dec. 2022
detail-website-datakwaliteit.png

High-precision matching

Een belangrijk aspect van de implementatie van een Master Data Management oplossing is het uniek en uniform vastleggen van relatiegegevens. Aangezien er meerdere toepassingen zijn waarin (productgerichte) werkzaamheden worden uitgevoerd en waarin vaak dezelfde relaties opnieuw worden opgeslagen, is niet gegarandeerd dat die gegevens gelijk zijn.
Wanneer een bepaalde toepassing wordt aangesloten op het MDM-systeem worden die gegevens gevalideerd en gestandaardiseerd. Dat leidt tot verhoging van de datakwaliteit. Minstens zo belangrijk is dat bij het opnemen van gegevens in het MDM-systeem een fout-tolerante en high-precision matching wordt uitgevoerd.
 
High-precision matching maakt gebruik van de genoemde fout-tolerantie, maar stelt tegelijk zeer nauwkeurige regels om te bepalen welke matches wel en welke matches niet relevant zijn. Door rekening te houden met de algemene overeenkomst én de overeenkomst van specifieke elementen, kan zeer nauwkeurig worden bepaald in welke mate twee relaties een match zijn.
Wijkt alleen de naam af (bijvoorbeeld “Matijssen” versus “Mathijssen”) of is ook de geboortedatum enigszins anders (bijvoorbeeld 13-02-1955 en 16-02-1955) of is zelfs, ondanks gelijke voorletters, de voornaam teveel afwijkend (bijvoorbeeld “Joan” versus “Johan”)?
 
High-precision matching leidt dus tot minder false positives (onterechte matches) én voorkomt false negatives (gemiste matches). Dat zorgt ervoor dat in het MDM-systeem alleen de juiste records tot één Golden Record worden verwerkt. Voor de Data Steward blijft een beperkte set van potentiële matches over die beoordeeld moeten worden.

Golden record

Een belangrijk aspect waar een MDM-systeem waarde toevoegt is op het gebied van dubbelen en datakwaliteit. Tijdens het verwerken van de gegevens vanuit de bronsystemen vindt een validatie en standaardisatie van die gegevens plaats. Het doel is enerzijds om gegevens op een uniforme wijze te registreren, maar natuurlijk wilt u ook de beste kwaliteit in uw Golden Records. Dat is waar validatie om de hoek komt. Gegevens worden voorzien van een indicator die de kwaliteit van de verschillende onderdelen aangeeft en daarmee kunnen beslissingen over het samenstellen van het Golden Record worden gestuurd, maar kan ook een Data Steward gerichte acties ondernemen.
 
Iets soortgelijks geldt voor het matchen van gegevens vanuit de bronsystemen, waarbij dubbelen worden gesignaleerd. Boven een zelf te bepalen grens zullen die klanten als zekere dubbelen worden beschouwd en automatisch worden samengevoegd. De groep daaronder betreft de mogelijke dubbelen en daar kan een Data Steward vervolgens een beoordeling op doen en besluiten die records al dan niet samen te voegen.
  
Een actieve Data Steward zorgt ervoor dat de kwaliteit van gegevens in de bronsystemen telkens blijft toenemen. Door de continue synchronisatie worden gegevens verbeterd en door de beoordeling van dubbelen kunnen dubbele klanten in de bronsystemen ook worden samengevoegd.