Функциональная зависимость (программирование)

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Функциона́льная зави́симость — концепция, лежащая в основе многих вопросов, связанных с реляционными базами данных, включая, в частности, их проектирование. Математически представляет бинарное отношение между множествами атрибутов данного отношения и является, по сути, связью типа «один ко многим». Их использование обусловлено тем, что они позволяют формально и строго решить многие проблемы.

Определения[править | править вики-текст]

Функциональная зависимость[править | править вики-текст]

Пусть дано отношение r со схемой (заголовком) R, A и B — некоторые подмножества множества атрибутов отношения r. МножествоB функционально зависит от A тогда и только тогда, когда каждое значение множества A связано в точности с одним значением множества B. Обозначается A\to B.

Другими словами, если два кортежа совпадают по атрибутам A, то они совпадают и по атрибутам B.

r\left( R \right),\ A\subseteq R,\ B\subseteq R
\left( A\to B \right)\Leftrightarrow \left( \left( \forall {{t}_{1}},{{t}_{2}}\in r:{{t}_{1}}\left( A \right)={{t}_{2}}\left( A \right) \right)\Rightarrow \left( {{t}_{1}}\left( B \right)={{t}_{2}}\left( B \right) \right) \right)

В этом случае A — детерминант, B — зависимая часть.

Функциональная зависимость называется тривиальной, если зависимая часть является подмножеством детерминанта.

\left( B\subseteq A \right)\Rightarrow \left( A\to B \right)

Замыкание множества зависимостей[править | править вики-текст]

Одни функциональные зависимости могут подразумевать другие функциональные зависимости. Например, транзитивная функциональная зависимость,

\left( A\to B \right)\wedge \left( B\to C \right)\Rightarrow \left( A\to C \right).

Множество {{S}^{+}} всех функциональных зависимостей, которые подразумеваются данным множеством функциональных зависимостей S называется замыканием множества S.

Замыкание множества атрибутов[править | править вики-текст]

Пусть Z — некоторое множество атрибутов отношения r, а S — множество функциональных зависимостей этого отношения. Замыканием {{Z}^{+}} множества атрибутов Z в пределах S называется такое множество всех атрибутов {{A}_{i}} отношения r, что функциональная зависимость Z\to {{A}_{i}} является членом замыкания {{S}^{+}}.

r\left( R \right),\ S,\ Z\subseteq R,\ {{A}_{i}}\subseteq R,\ i=\overline{1,n}
{{Z}^{+}}=\left\{ {{A}_{i}}:\left( Z\to {{A}_{i}} \right)\in {{S}^{+}} \right\}

Неприводимые множества зависимостей[править | править вики-текст]

Пусть {{S}_{1}} и {{S}_{2}} — некоторые множества функциональных зависимостей.

  • Если любая функциональная зависимость из {{S}_{1}} входит и в {{S}_{2}}, то {{S}_{2}} называют покрытием множества функциональных зависимостей {{S}_{1}}.
  • Если {{S}_{2}} — покрытие для {{S}_{1}}, а {{S}_{1}} — для {{S}_{2}} (то есть S_{1}^{+}=S_{2}^{+}), то такие множества называются эквивалентными.
  • Множество функциональных зависимостей S называется неприводимым тогда и только тогда, когда выполняются следующие условия:
    • В каждой функциональной зависимости зависимая часть содержит только один элемент;
    • Детерминант каждой функциональной зависимости является неприводимым (ни один атрибут не может быть удален из детерминанта без изменения замыкания {{S}^{+}});
    • Ни одну функциональную зависимость из S нельзя исключить без изменения замыкания {{S}^{+}}.
  • Для любого множества функциональных зависимостей существует по крайней мере одно эквивалентное множество, которое является неприводимым. Такое эквивалентное множество называется неприводимым покрытием.

Вычисление замыканий[править | править вики-текст]

Правила вывода Армстронга[править | править вики-текст]

В 1974 году Вильям Армстронг предложил набор правил вывода новых функциональных зависимостей на основе данных.

Пусть у нас есть отношение r\left( R \right) и множества атрибутов A,B,C,D\subseteq R. Для сокращения записи вместо X\cup Y будем писать просто XY.

  • Рефлексивность:
    \left( B\subseteq A \right)\Rightarrow \left( A\to B \right)
  • Пополнение:
    \left( A\to B \right)\Rightarrow \left( AC\to BC \right)
  • Транзитивность:
    \left( A\to B \right)\wedge \left( B\to C \right)\Rightarrow \left( A\to C \right)

Правила вывода Армстронга полны (используя их, можно вывести все остальные функциональные зависимости, подразумеваемые данным их множеством) и надежны («лишних» функциональных зависимостей вывести нельзя; выведенная функциональная зависимость справедлива везде, где справедливо то множество функциональных зависимостей, из которого она была выведена).

Кроме того, из данных правил довольно просто выводятся несколько дополнительных правил, упрощающих задачу вывода функциональных зависимостей.

  • Самоопределение:
    A\to A
  • Декомпозиция:
    \left( A\to BC \right)\Rightarrow \left( A\to B \right)\wedge \left( A\to C \right)
  • Объединение:
    \left( A\to B \right)\wedge \left( A\to C \right)\Rightarrow \left( A\to BC \right)
  • Композиция:
    \left( A\to B \right)\wedge \left( C\to D \right)\Rightarrow \left( AC\to BD \right)
  • Теорема всеобщего объединения Дарвена:
    \left( A\to B \right)\wedge \left( C\to D \right)\Rightarrow \left( A\cup \left( C-B \right)\to BD \right)

Теорема: Функциональная зависимость A\to B выводима из данного множества функциональных зависимостей S по правилам вывода Армстронга тогда и только тогда, когда B\subseteq {{A}^{+}}.

Замыкание множества атрибутов[править | править вики-текст]

Если применять правила из предыдущего раздела до тех пор, пока создание новых функциональных зависимостей не прекратится само собой, то мы получим замыкание для заданного множества функциональных зависимостей. На практике редко требуется вычислять это замыкание само по себе, чаще всего нам гораздо интереснее узнать, будет ли та или иная функциональная зависимость входить в замыкание. Для этого нам достаточно вычислить замыкание детерминанта. Для этого существует довольно простой алгоритм.

  1. Пусть X — множество атрибутов, которое в конечном счете станет замыканием.
  2. Осуществляем поиск функциональных зависимостей вида {{B}_{1}}{{B}_{2}}\ldots {{B}_{m}}\to C, где {{B}_{1}}{{B}_{2}}\ldots {{B}_{m}}\subseteq X, а C\not\subset X. Зависимую часть каждой найденной зависимости добавляем в X.
  3. Повторяем пункт 2, пока ко множеству X будет невозможно добавить атрибуты.
  4. Множество X, к которому невозможно добавить атрибуты и будет замыканием.

Применение[править | править вики-текст]

Проектирование БД[править | править вики-текст]

Функциональные зависимости являются ограничениями целостности и определяют семантику хранящихся в БД данных. При каждом обновлении СУБД должна проверять их соблюдение. Следовательно, наличие большого количества функциональных зависимостей нежелательно, иначе происходит замедление работы. Для упрощения задачи необходимо сократить набор функциональных зависимостей до минимально необходимого.

Если I является неприводимым покрытием исходного множества функциональных зависимостей S, то проверка выполнения функциональных зависимостей из I автоматически гарантирует выполнение всех функциональных зависимостей из S. Таким образом, задача поиска минимально необходимого набора сводится к отысканию неприводимого покрытия множества функциональных зависимостей, которое и будет использоваться вместо исходного множества.

Декомпозиция отношений[править | править вики-текст]

Теорема Хита[править | править вики-текст]

Пусть дано отношение r\left( A,B,C \right).

Если r удовлетворяет функциональной зависимости A\to B, то оно равно соединению его проекций r\left[ A,B \right] и r\left[ A,C \right].

\left( A\to B \right)\Rightarrow \left( r\left( A,B,C \right)=r\left[ A,B \right]\ \text{JOIN}\ r\left[ A,C \right] \right)

См. также[править | править вики-текст]

Литература[править | править вики-текст]

  • К. Дж. Дейт Введение в системы баз данных = Introduction to Database Systems. — 8-е изд. — М.: «Вильямс», 2006. — С. 1328. — ISBN 0-321-19784-4