Normalizace databází je přístup k návrhu databází, který zavedl Edgar F. Codd v 70. letech 20. století. Některé databáze, známé jako relační databáze, umožňují ukládat data do oddělených skupin. Každá skupina se běžně nazývá tabulka. Aby tyto skupiny poskytovaly užitečné informace, jsou vzájemně propojeny. Například studenti mohou být uloženi v jedné skupině a třídy v jiné skupině. Aby se ukázalo, že student je zapsán do třídy, vytvoří se "vztah" mezi jednou skupinou a druhou. Student by mohl mít vztah k mnoha třídám, v každé z nich by byl zapsán, zatímco třída by měla vztah k mnoha studentům.

Tradiční alternativou je "databáze plochých souborů", kde jsou všechna data seskupena jako v tabulkovém procesoru. Problém databází s plochými soubory spočívá v tom, že mohou mít mnoho prázdných míst a u každého záznamu se musí opakovat spousta informací. To znamená, že databáze je větší, než by musela být, a zvyšuje to pravděpodobnost, že bude obsahovat chyby. Relační databáze díky rozdělení dat do skupin snižují pravděpodobnost výskytu chyb a nezabírají více místa, než je nutné. Aby však fungovala, musí být dobře navržena.

Normalizace databází je metoda návrhu kvalitních relačních databází. Existuje několik "normálních forem", z nichž každá má svá pravidla, která by měla databáze splňovat. Codd původně specifikoval tři sady kritérií, které musí různé databáze splňovat: první, druhou a třetí normální formu.

Pokud relace (nebo "databázová tabulka") splňuje určitou normální formu, není zranitelná vůči určitým modifikacím, které by ovlivnily integritu dat. Nevýhodou splnění takového souboru kritérií je obvykle to, že dotazování na určitá data z databáze bude obtížnější.