Automatisch persoonsgegevens in documenten anonimiseren of pseudonimiseren

Automatisch persoonsgegevens in documenten anonimiseren of pseudonimiseren

Vrij recent is de GDPR-wetgeving, ook wel AVG, van kracht geworden in Europa. Bedrijven zijn zich door deze wetgeving bewuster dan ooit van de verantwoordelijkheid die ze hebben met betrekking tot het beheren van persoonsgegevens. Een duidelijke consent van de klant is tegenwoordig noodzakelijk alvorens persoonsgegevens opgeslagen kunnen worden.

Voor veel bedrijven leidt dit tot een grote uitdaging, want wat moet er gebeuren met alle reeds opgeslagen persoonsgegevens? Soms in fysieke, soms in digitale archieven in allerlei verschillende soorten databases en soorten documenten. Voor lang niet al deze gegevens is een consent ontvangen. Bedrijven hebben dan vaak drie keuzes:

1.     De documenten en databases met persoonsgegevens verwijderen.

2.     Alsnog consent vragen van klanten om de gegevens op te slaan.

3.     De documenten en databases anonimiseren.

De eerste keuze is vaak lastig om te maken. Andere gegevens in de documenten kunnen zeker van belang zijn en misschien zelfs noodzakelijk voor bijvoorbeeld de administratie. De tweede optie is lang niet altijd uitvoerbaar, want hoe bereik je iemand voor een consent en wat doe je als je geen reactie krijgt? Optie drie is vaak een enorme klus waar veel handwerk bij komt kijken en is dus vaak erg kostbaar.  Maar wat als punt 3, het anonymiseringsprocess van documenten, geautomatiseerd zou kunnen worden? Met Klippa is dit mogelijk!

Wat is Klippa?

Klippa is een specialist in data extractie voor onder andere contracten, facturen, bonnen en identiteitsbewijzen. In allerlei soorten toepassingen wordt onze slimme software gebruikt om gegevens als namen, datums en bedragen te extraheren. Dit doen we bijvoorbeeld voor factuurverwerking, declaratieverwerking en KYC processen. Goede data extractie begint met tekstherkenning en de lokalisatie van gegevens. Omdat deze technologie al aan de kern van onze software ligt hebben we nu besloten onze dienstverlening uit te breiden met de anonimisering van herkende data.

Hoe werkt document anonimisering dan?

Klippa zet een speciale beveiligde server op in een land naar keuze.  Hier kunnen door jouw organisatie documenten heen gestuurd of geupload worden. Nu gaat de Klippa software aan de slag. De eerst stap in het proces heet document segmentering. In deze stap kijkt de Klippa software met machine learning wat voor soorten documenten er allemaal binnen komen en verdeeld deze documenten over digitale bakjes. Zo worden bijvoorbeeld contracten gescheiden van facturen.  Vervolgens gaan we in overleg met de klant kijken welke gegevens per soort document relevant zijn. Dit zijn zaken als de naam van de klant, adresgegevens, telefoonnummers, e-mailadressen, sofinummers en meer. Wat je ook wil vinden, Klippa kan het regelen.

Persoonsgegevens anonimiseren

Nu duidelijk is welke documenten er allemaal zijn en welke gegevens relevant zijn voor de specifieke use case, is het tijd voor scan en herken. De Klippa scan en herken software gaat dan stap voor stap alle documenten langs, zet ze om in een leesbaar bestandsformaat en gaat middels patroonherkenning op zoek naar de vooraf bepaalde soorten informatie. Gevonden patronen (persoonsgegevens) worden uit het document geëxtraheerd en vervangen door een nader te bepalen identifier. Vaak is dit iets betekenisloos zoals een ‘spatie’ zijn, een reeks streepjes ‘—‘ of een variabele aanduiding als ‘NAAM’, ‘TELEFOONNUMMER’ etcetera. De originele waardes worden, afhankelijk van de wensen, echt uit het document verwijderd en zijn in een later stadium dan ook niet meer terug te halen.  Als laatste stap worden de document nu opgeslagen en teruggestuurd naar de server van de klant. Het resultaat? Een archief met volledig automatisch geanonimiseerde documenten die voldoen aan de GDPR / AVG regelgeving!

Indien gewenst is het nog mogelijke een menselijke controlestap te realiseren alvorens de documenten definitief als ‘anoniem’ te markeren en terug in het archief te stoppen. Een interface voor menselijke controle is reeds beschikbaar. In deze interface controleren mensen van jouw organisatie of de software alles correct heeft uitgevoerd en geven een soort final stamp of approval.

Zit jouw organisatie ook met een uitdaging op het gebied van data extractie, ocr of anonimisering? Neem contact met ons op en Klippa lost het op een kostenefficiënte manier voor je op.