ANONIMISEREN MET NATURAL LANGUAGE PROCESSING – NLP
Met NLP bedoel ik niet Neuro-linguistic-programming en ook niet Non-linear-programming, maar Natural Language Programming. Een techniek die gebruikt wordt om bijvoorbeeld documenten grondig te analyseren, door vooral, zoals L van NLP ook zegt, een linguïstische analyse. Deze toepassing kan op oneindig veel terreinen nuttig worden ingezet. Het terrein waar wij als BnAS het voor gebruiken is het anonimiseren / redigeren.
Anonimiseren met NLP – TOEPASSINGEN VAN NLP
NLP wordt ook gebruikt om bijvoorbeeld taalkundige overeenkomsten tussen twee documenten binnen enkele seconden op het scherm toveren. Of het nu Nederlands documenten zijn of Latijnse documenten. Een mooi voorbeeld van deze NLP techniek is met name Google translate, een programma dat bijv. razendsnel een Engels document omzet in het Nederlands. Maar wij gebruiken NLP om te analyseren voor het anonimiseren.
Anonimiseren met NLP – ONS WERKPROCES
Zo gaan wij vooraf aan het anonimiseren eerst de documenten d.m.v. de Natural Language Programming methode zorgvuldig analyseren. Deze analyse gebruiken wij vervolgens om een goed beeld te krijgen van de inhoud van de documenten van onze klanten. De resultaten van deze analyse worden opgeslagen in de database van onze anonimiseringssoftware BnAS (BIQE netwerk Anonimisering Software / Solution) Na analyse door NLP krijgt u als klant een persoonlijke op u toegesneden databaseoplossing. Deze database bevat de woorden van de documenten van u als klant. Op deze manier kunnen wij meer dan 98% automatisch anonimiseren.
WIJ ANALYSEREN OM TE ANONIMISEREN
Wij gebruiken in BnAS ook speciaal ontwikkelde Imagefilters, waardoor de te anonimiseren tekst dusdanig wordt verbeterd, dat de OCR optimaal is. Ons motto is : wij willen niet slechts analyseren (NLP) maar ook goed anonimiseren. Want analyse zonder goede OCR is zinloos. Alleen gebruik maken van NLP zonder goede OCR levert, met name bij oudere documenten veel te lage percentages automatisch anonimiseren op. 90% of meer.
EEN PRAKTIJKVOORBEELD
Sommige bedrijven claimen dat ze meer dan 90% automatisch anonimiseren met behulp van NLP. Wij als BnAS hebben een anonimiseeropdracht uitgevoerd voor een provincie van meer dan 1.3 miljoen pagina’s. Dat deden wij in een tijdsbestek van 4 weken met een percentage van 98%. En toen maakten we nog geen gebruik van NLP. Beste lezers, u wilt toch niet dat er zoals in dit geval van 1.3. miljoen – 130.000 anonimiseringsfouten (10%) in uw documenten zouden achterblijven? Wij vinden 2% niet eens acceptabel, laat staan 10%!
NATURAL LANGUAGE PROCESSING VOOR EEN NOG BETERE OCR
Door gebruik te maken van NLP hebben we een grote stap voorwaarts gezet in het automatisch anonimiseren van al uw documenten. Niet alleen nieuwe documenten, die doen we sowieso voor 100%, maar ook uw oudere documenten zijn bij ons in goede handen.
MENSEN MET EEN AFSTAND TOT DE ARBEIDSMARKT
Wij werken bij grotere opdrachten met mensen met een afstand tot de arbeidsmarkt, omdat wij vertrouwen hebben in mensen, ja, maar ook omdat wij vertrouwen in onze anonimiserings-software. Ook het z.g. 1.3-miljoen-pagina’s-project is door deze mensen uitgevoerd.
WIJ DIGITALISEREN EN ANONIMISEREN OOK BOUWDOSSIERS
Ook voor al uw bouwdossiers hebben wij, als BIQE, de perfecte software ontwikkeld, die wij ScanDispatcher noemen al meer dan 3 jaar met grote tevredenheid door het zeer bekende Amsterdam Archief tot op de dag van vandaag wordt gebruikt. Deze kunnen wij na verwerking ook voor u anonimiseren in één doorgaand proces.
BnAS ALS EEN SOFTWARE OF ALS EEN SERVICE
Misschien anonimiseert u maar een paar documenten per dag, maar u wilt het wel meteen kunnen doen. Dat kan door onze BNAS – Software. Wij installeren de software bij u op locatie. Op uw desktop of op een netwerkomgeving. Ook geven wij alle mensen die met de software willen werken op uw kantoor een gedegen training en een GRATIS helpdesk! Dat noemen wij optie 1.
Maar we hebben ook een optie 2 die heet: BnAS -Service, waarin wij u volledig ‘ontzorgen’! U levert de documenten aan via onze beveiligde FTPS verbinding (incl. whitelist) en nog dezelfde dag / week kunt u geanonimiseerde bestanden weer downloaden.
Niet slechts het bovenste laagje van de afbeelding wordt geanonimiseerd, maar ook de onderliggende tekst (OCR) van de geanonimiseerde woorden is onherstelbaar verwijderd.
Dus optie 1 als een software waarbij u al het ‘automatische werk’ zelf doet of optie 2 waarbij wij als BnAS u al het werk uit handen nemen, oftewel ‘ontzorgen’.
BnAS werkt samen met experts op het gebied van AVG – wetgeving (GDPR). Experts die een echte langdurige opleiding hebben gevolgd en alles weten ven de hoed en de rand. Die u via ons als BnAS ook kunt raadplegen voor advies op het gebied van AVG / GDPR, WOB, WKPB etc.
Zo blijven niet alleen wij, maar blijft ook u altijd op de hoogte van de nieuwste wettelijke ontwikkelingen op het gebied van anonimiseren (redigeren) volgens de AVG / GDPR normen.
Jannes Hoekman
CEO BIQE