Relační databázeRelační databáze je databáze založená na relačním modelu. Často se tímto pojmem označuje nejen databáze samotná, ale i její konkrétní softwarové řešení. Relační databáze je založena na tabulkách, jejichž řádky obvykle chápeme jako záznamy a eventuálně některé sloupce v nich (tzv. cizí klíče) chápeme tak, že uchovávají informace o relacích mezi jednotlivými záznamy v matematickém slova smyslu. Termín relační databáze definoval Edgar Frank v roce 1970. HistorieV roce 1890 vznikl na objednávku státních úřadů v USA první automat na bázi děrných štítků. U jeho zrodu stál Herman Hollerith, jehož firma při fúzi několika firem dala vzniknout IBM. Ta stála v popředí i v roce 1951, kdy vznikl první digitální počítač pro komerční využití UNIVAC I. V roce 1960 vznikl předchůdce dnešních databázových jazyků COBOL. V 60. letech založil Charles Bachman spolu s dalšími výzkumníky seskupení Codasyl, které publikovalo základní specifikaci pro programovací jazyky, především pro COBOL. Většina Codasyl kompatibilních databází byla postavena na síťovém modelu, zatímco firma IBM se vydala cestou hierarchického modelu. V roce 1970 přišel Ted Codd s novým návrhem datového modelu, relačním modelem. Dle relační teorie lze pomocí základních operací (sjednocení, kartézský součin, rozdíl, selekce, projekce a spojení) uskutečnit veškeré operace s daty a ostatní operace jsou již jen kombinacemi těchto šesti. Zavádí se použití relačního kalkulu a algebry. Databáze mají být nezávislé na fyzickém uložení dat i na použitém jazyce. Pod tlakem událostí se do projektu vkládá i IBM, která přichází s jazykem SQL. První SQL databází se v roce 1980 stal Oracle pro počítače VAX-11. Druhá v řadě přichází i firma IBM s produktem IBM DB2. TerminologieZákladním konstruktorem relačních databází jsou relace (databázové tabulky), což jsou dvourozměrné struktury tvořené záhlavím a tělem. Jejich sloupce se nazývají atributy, řádky tabulky jsou pak záznamy. Atributy mají určen svůj konkrétní datový typ a doménu, což je množina přípustných hodnot daného atributu. Řádek je řezem přes sloupce tabulky a slouží k vlastnímu uložení dat. Pojem „relační databáze“ souvisí s teorií množin. Každá konkrétní tabulka totiž realizuje podmnožinu kartézského součinu množin přípustných hodnot všech sloupců – relaci. Kandidátní klíč Podrobnější informace naleznete v článku Kandidátní klíč.
Kandidátní klíč je atribut nebo skupina atributů, které jednoznačně identifikují záznam v relační tabulce. Kandidátní klíč se může stát primárním klíčem; ty, které se primárním klíčem nestanou, jsou označovány jako alternativní klíče. Např. v relaci Zaměstnanec, která má atributy číslo_zaměstnance, rodné_číslo, jméno a příjmení, jsou kandidátními klíči atributy číslo_zaměstnance a rodné_číslo. Pokud primárním klíčem zvolíme číslo_zaměstnance, alternativním klíčem bude rodné_číslo a naopak. Primární klíč Podrobnější informace naleznete v článku Primární klíč.
Primární klíč je jednoznačný identifikátor záznamu, řádku tabulky. Primárním klíčem může být jediný sloupec či kombinace více sloupců tak, aby byla zaručena jeho jednoznačnost. Pole klíče musejí obsahovat hodnotu, tzn. nesmí se zde vyskytovat nedefinovaná prázdná hodnota NULL. V praxi se dnes často používají umělé klíče, což jsou číselné či písmenné identifikátory – každý nový záznam dostává identifikátor odlišný od identifikátorů všech předchozích záznamů (požadavek na unikátnost klíče), obvykle se jedná o celočíselné řady a každý novější záznam dostává číslo vždy o jednotku vyšší (zpravidla zcela automatizovaně) než je číslo u posledního vloženého záznamu (číselné označení záznamů s časem stoupá). Cizí klíč Podrobnější informace naleznete v článku Cizí klíč.
Dalším důležitým pojmem jsou nevlastní/cizí klíče. Slouží pro vyjádření vztahů, relací, mezi databázovými tabulkami. Jedná se o pole či skupinu polí, která nám umožní identifikovat, které záznamy z různých tabulek spolu navzájem souvisí. Integrita databáze Podrobnější informace naleznete v článku Integrita databáze.
Integrita databáze znamená, že data v ní uložená jsou konzistentní vůči definovaným pravidlům. Lze zadávat pouze data, která vyhovují předem definovaným kritériím (např. musí respektovat datový typ nastavený pro daný sloupec tabulky, či další omezení hodnot přípustných pro daný sloupec). K zajištění integrity slouží integritní omezení. Jedná se o nástroje, které zabrání vložení nesprávných dat či ztrátě nebo poškození stávajících záznamů v průběhu práce s databází. Typicky je možné zajistit mazání dat, která již ztratila svůj význam (kupř. smažeme-li uživatele z tabulky uživatelů, odstraní se i na něj navázané záznamy v ostatních databázových tabulkách). Druhy integritních omezení
Dodržování integritních omezeníV zásadě existují tři způsoby, jak zajistit dodržování integritních omezení.
Možná je i kombinace předchozích variant v závislosti na konkrétních podmínkách. Kontroly integritních omezení se zpravidla provádějí po každé provedené operaci, což snižuje nároky na server. Není nutno nijak zaznamenávat, které kontroly mají být provedeny později. Složitější integritní omezení však vždy nelze takto ověřit, proto je možné kontrolovat dodržení pravidel až po dokončení celé transakce. Vztahy mezi tabulkamiVztahy (angl. relationships) slouží ke svázání dat, která spolu souvisejí a jsou umístěny v různých databázových tabulkách. Každý vztah je charakterizován třemi základními vlastnostmi:
Stupeň vztahu
Ternární a n-ární vztahy se nesnadno modelují a v praxi se objevují velice zřídka. Kardinalita vztahuKardinalita vztahu je maximální počet vztahů instancí, kterých se může entita účastnit.
Parcialita vztahuParcialita vyjadřuje, zda je účast entity ve vztahu povinná nebo volitelná. Jinými slovy, parcialita určuje minimální počet vztahů (0 nebo 1). Povinnost se realizuje pomocí integritního omezení NOT NULL. Při převodu z E-R modelu se ale některé informace o parcialitě ztrácí. Normální formy Podrobnější informace naleznete v článku Normalizace databáze.
Pod pojmem normalizace rozumíme proces zjednodušování a optimalizace navržených struktur databázových tabulek. Hlavním cílem je navrhnout databázové tabulky tak, aby vykazovaly minimum redundance (opakování stejné informace na více místech). Správnost navržení struktur v tomto smyslu lze ohodnotit některou z následujících normálních forem:
Nultou normální formu (0NF) splňuje každá tabulka. Příklady (relačních) databázíOdkazySouvisející článkyExterní odkazy |