Home » Het normaliseren van gegevens

Het normaliseren van gegevens

Om tot een goed georganiseerde database te komen is het raadzaam om gegevens te normaliseren. Het klinkt moeilijker dan het is, maar normalisatie is eigenlijk niets minder dan het ontwerpproces. In dit proces komt de uiteindelijke database tot stand.

Bij het normaliseren nemen we gegevens over uit een bepaald proces. We gaan vervolgens deze gegevens extraheren tot kleine groepjes. Tijdens het extraheren proberen we te voorkomen dat gegevens dubbel worden opgeslagen.

Met de gegevens die we hebben genormaliseerd kunnen we de uiteindelijke tabellen vormen. En deze tabellen samen slaan we we op in de database.

Waarom gegevens normaliseren?

We willen gegevens normaliseren, omdat we het opslaan van dubbele gegevens dus willen voorkomen. De reden hiervoor is dat het bijhouden van dubbele gegevens foutgevoelig is. Het risico bestaat namelijk dat er in een van de plekken een foutje ontstaat. Denk hierbij aan een foutief adres of een spelfout in een achternaam.

Stel dat we bijvoorbeeld klant,- en ordergegevens in dezelfde tabel opslaan. Wanneer bijvoorbeeld de klantgegevens veranderen, dan moeten we dus elk record met deze gegevens aanpassen. Als beide gegevens zijn gescheiden (genormaliseerd), dan hoeven we slechts 1 record aan te passen.

advertentie

Wat zijn de risico’s van niet normaliseren?

Het is aan de ontwerper/ontwikkelaar zelf om te bepalen of hij gegevens gaat normaliseren. Bij het niet normaliseren, is er het volgende risico aanwezig:

  • Redundantie: Elke keer als we de gegevens nogmaals opslaan, dan bestaat er de kans dat we één keer iets verkeerd invoeren.

Hoe werkt het normalisatie proces?

Tijdens het normalisatie proces, gaan we unieke gegevens strippen en onderbrengen in categorieën.

Zo vormt bij een bestelling de klant met zijn gegevens een eigen categorie. Maar ook de productgegevens zijn een mogelijke categorie. En ten slotte vormen de ordergegevens ook een eigen categorie.

Elke categorie wordt uiteindelijk een tabel in de database.

De verschillende normaalvormen

Omdat het normaliseren uit meerdere vormen bestaat, is er een onderverdeling gemaakt tussen de verschillende normaalvormen: