Третя нормальна форма

Третя нормальна форма (3НФ) — нормальна форма використовна в нормалізації баз даних. 3НФ первісно була визначена 1971 року Едгаром Коддом.[1] За Коддом таблиця знаходиться в 3НФ тоді й лише тоді, коли виконуються наступні умови:

Неключовий атрибут R — атрибут, що не є частиною будь-якого потенційного ключа.[2] Транзитивною називають таку функціональну залежність, в якій XZ (X визначає Z) не прямо, а через XY і YZ (і неправильно, що YX).[3]

Інше визначення 3НФ тотожне до визначення Кодда, 1982 року дав Карло Заніоло. Це визначення стверджує, що таблиця в 3НФ тоді й лише тоді, коли для кожної її функціональної залежності XA, вірна хоча б одна з наступних умов:

  • X містить A (тоді XA це тривіальна функціональна залежність), або
  • X це суперключ, або
  • A-X, різниця множин A і X це ключовий атрибут (тобто, A-X міститься в потенційному ключі)[4]

Визначення Заніоло пояснює різницю між 3НФ і строгішою нормальною формою Бойса-Кодда. НФБК просто виключає третій варіант («A це ключовий атрибут»).

Підсумкове визначення

Підсумкове визначення Кодда 3НФ було дане Біллом Кентом: кожен неключовий атрибут «має надавати факт про ключ, цілий ключ, і ні про що окрім ключа.»[5]

Вимога, щоб неключовий атрибут знаходився в залежності від «цілого ключа», гарантує, що таблиця знаходиться в 2НФ; наступна вимога, щоб неключові атрибути були залежні від «нічого окрім ключа», гарантує, що таблиця знаходиться в 3НФ.

Крістофер Дейт згадував підсумок Кента, як «інтуїтивно привабливу характеризацію» 3НФ, і зауважував, що з невеличкою адаптацією він може слугувати, як визначення трохи сильнішої нормальної форми Бойса-Кодда: «Кожен атрибут має уособлювати факт про ключ, про цілий ключ, і нічого окрім ключа.»[6] Версія визначення для 3НФ слабша за варіант Дейта для БКНФ, бо попередня забезпечує гарантію залежності від ключів лише для неключових атрибутів. Ключові атрибути (які є ключами або їх частиною) мають бути вільними від функціональної залежності взагалі; кожен з них подає факт про ключ в сенсі надання частини ключа або цілого ключа. (Це правило застосовується тільки для функціонально залежних атрибутів, застосування його до всіх атрибутів спричинить неявну заборону складних потенційних ключів, бо кожна частина такого ключа буде порушувати умову «цілого ключа».)

Приклад таблиці в 2НФ, що порушує вимоги 3НФ:

Переможець змагання
Змагання Рік Переможець Дата народження переможця
Вище неба 1998 Степан Гуцало 21 липня 1975
Осінній лист 1999 Яромир Грабар 28 вересня 1968
День вареників 1999 Степан Гуцало 21 липня 1975
Вище неба 1999 Іван Швидкосвист 14 березня 1977

Через те, що кожний рядок таблиці має сказати нам, хто виграв конкретне змагання конкретного року, складний ключ {Змагання, Рік} - це найменший набір атрибутів, який гарантовано визначає рядок. Тобто, {Змагання, Рік} є потенційним ключем для цієї таблиці.

Таблиця не знаходиться в 3НФ, бо неключовий атрибут «Дата народження переможця» транзитивно залежить від потенційного ключа {Змагання, Рік} через неключовий атрибут «Переможець». Функціональна залежність «Дата народження переможця» від «Переможець» призводить до логічних несумісностей, у цій таблиці ніщо не заважає одній особі мати дві дати народження в різних записах.

В порядку відображення цього факту без порушення 3НФ, необхідно розбити таблицю на дві:

Переможець змагання
Змагання Рік Переможець
Вище неба 1998 Степан Гуцало
Осінній лист 1999 Яромир Грабар
День вареників 1999 Степан Гуцало
Вище неба 1999 Іван Швидкосвист
Дата народження гравців
Гравець Дата народження
Степан Гуцало 21 липня 1975
Яромир Грабар 28 вересня 1968
Іван Швидкосвист 14 березня 1977

Аномалії оновлення не можуть статися в цих таблицях, бо обидві в 3НФ.

Отримання умов Заніоло

Визначення 3НФ запропоноване Карло Заніоло в 1982, доводиться наступним чином: Нехай X → A нетривіальна функціональна залежність (тобто X не містить A) і нехай A неключовий атрибут. Також нехай Y буде ключем для R. Тоді Y → X. Отже A не транзитивно залежить від Y тоді і тільки тоді, коли X → Y, тобто, тоді і тільки тоді, коли X —суперключ.[7]

Примітки

  1. Codd, E.F. "Further Normalization of the Data Base Relational Model." (Presented at Courant Computer Science Symposia Series 6, "Data Base Systems," New York City, May 24th–25th, 1971.) IBM Research Report RJ909 (August 31st, 1971). Republished in Randall J. Rustin (ed.), Data Base Systems: Courant Computer Science Symposia Series 6. Prentice-Hall, 1972.
  2. Codd, p. 43.
  3. Codd, p. 45–46.
  4. Zaniolo, Carlo. "A New Normal Form for the Design of Relational Database Schemata." ACM Transactions on Database Systems 7(3), September 1982.
  5. Kent, William. "A Simple Guide to Five Normal Forms in Relational Database Theory" [Архівовано 2 лютого 2007 у Wayback Machine.], Communications of the ACM 26 (2), Feb. 1983, pp. 120–125.
  6. Date, C.J. An Introduction to Database Systems (7th ed.) (Addison Wesley, 2000), p. 379.
  7. Zaniolo, p. 494.

Посилання