Eenvoudig uitgelegd.
Data kwaliteit
Datakwaliteit is de mate waarin data voldoet aan de gestelde eisen en verwachtingen en geschikt is voor gebruik. Bij het effectief inzetten van data binnen een organisatie is het belangrijk om te zorgen voor hoge datakwaliteit, omdat data die van lage kwaliteit is niet betrouwbaar is, kan leiden tot foutieve of onjuiste inzichten en het vertrouwen in de data analytics omgeving schaadt.
Datakwaliteit kan worden beïnvloed door factoren zoals foutieve of onvolledige data, duplicaten, inconsistentie en onverwachte veranderingen in de data.
Wanneer je je datakwaliteit wil verhogen zul je de volgende gebieden moeten adresseren:
Complete data
Dit houdt in dat de data volledig en nauwkeurig is en geen ontbrekende of onjuiste waarden bevat, denk aan ontbrekende verplichte velden zoals een geboortedatum.
Juiste data
Dit houdt in dat de data correct is en voldoet aan de verwachtingen en specificaties, zoals data in het juiste formaat en met de verwachte waarden. Een geboortedatum dient altijd in het verleden te liggen en te analyseren zijn in het formaat dd-mm-jjjj.
Consistente data
Dit houdt in dat de data consistent is opgeslagen binnen verschillende systemen. Het klant- of burgernummer, naam en adres dient bijvoorbeeld gelijk dient te zijn in alle systemen die zijn aangesloten.
Unieke data
Dit houdt in dat de data uniek is en geen duplicaten bevat, wanneer deze er niet zouden moeten zijn. Denk bijvoorbeeld aan het uitsluiten van dubbele klanten of orders.
Actuele data
Dit houdt in dat de data bijgewerkt is conform een verwachte interval. Een niet bijgewerkte dataset waarop de maandelijkse facturatie wordt gebaseerd kan serieuze financiele impact hebben.
Accurate data
Dit houdt in dat de data accuraat moet zijn, waarbij verouderde data en verkeerd gespelde namen zoveel mogelijk worden uitgesloten.
Authentieke data
Dit houdt in dat de data afkomstig is van een betrouwbare bron en niet is vervalst. Tegenwoordig een steeds actueler gebied aangezien AI toepassingen steeds vaker niet gevalideerde informatie genereren
Afscheid nemen van complexiteit?
Onze oplossing, de Intelligenthive, zorgt ervoor dat je je niet meer druk hoeft te maken over het bijhouden van alle data ontwikkelingen, termen & technieken.
Benieuwd? Bekijk dan verderop de interactieve tour en vraag vandaag nog een demo aan om te leren hoe wij je afscheid laten nemen van deze complexiteit.