Leer alles over SQL

Het normaliseren van gegevens

| geschreven door Andy

Om tot een goed georganiseerde database te komen is het raadzaam om gegevens te normaliseren. Het klinkt moeilijker dan het is, maar normalisatie is eigenlijk het ontwerpproces waarin de database tot stand komt.

Tijdens het normaliseren worden gegevens op een dusdanige wijze geëxtraheerd, waardoor het opslaan van dubbele gegevens wordt voorkomen. Feitelijk gezien worden gegevens genomen uit een bepaald proces. Deze gegevens worden uit elkaar getrokken, hierdoor ontstaan tabellen die vervolgens gebruikt kunnen worden in de database.

Waarom gegevens normaliseren?

We willen gegevens normaliseren, zodat we kunnen voorkomen dat gegevens dubbel worden opgeslagen. Stel dat we bijvoorbeeld klant,- en ordergegevens in dezelfde tabel opslaan. Als iets in de klantgegevens gewijzigd moet worden, dan moet elk record worden aangepast. Als beide gegevens zijn gescheiden (genormaliseerd), dan hoeft er slechts 1 record in een klanttabel worden gewijzigd.

Wat zijn de risico’s van niet normaliseren?

Het is aan de ontwerper/ontwikkelaar zelf om te bepalen of hij gegevens gaat normaliseren. Bij het niet normaliseren, zijn de volgende risico’s aanwezig:

  • Redundantie: Elke keer als de gegevens nogmaals worden opgeslagen dan bestaat er de kans dat het één keer verkeerd wordt ingevoerd.

Hoe werkt het normalisatie proces?

Tijdens het normalisatie proces, gaan we unieke gegevens strippen en ondergebracht in categoriën. Bij een bestelling zou de klant met zijn gegevens een categorie vormen, de productgegevens is een categorie en de ordergegegevens zou een categorie kunnen zijn. Elke categorie wordt uiteindelijk een tabel in de database.

De verschillende normaalvormen

Omdat het normaliseren uit meerdere vormen bestaan is er een onderverdeling gemaakt tussen de verschillende normaalvormen: