Таблиця фактівТаблиця фактів використовується у сховищі даних та складається з вимірювань, показників або фактів бізнес-процесу. Вона розташована у центрі схеми зірки або схеми сніжинки в оточенні таблиць розмірностей. Там, де використовуються декілька таблиць фактів, вона організована як схема сузір'я фактів[en]. Таблиця фактів зазвичай складається з двох типів стовпців: ті, що містять факти та ті, що є зовнішнім ключем до таблиць розмірностей. Первинний ключ таблиці фактів зазвичай є складеним ключем, який поєднує в собі усі зовнішні ключі. Таблиці фактів містять зміст сховища даних та зберігають різні типи вимірювань, такі як адитивні, неаддитивні та півадитивні метрики. Таблиці фактів надають (зазвичай) адитивні значення, які діють як незалежні змінні, за допомогою яких аналізуються атрибути розмірності. Таблиці фактів часто визначаються за ступенем деталізації або гранулярністю. Ступень деталізації таблиці фактів є найбільшим атомарним рівнем, за яким ці фактори можуть бути визначені. Наприклад, гранулярність таблиці фактів «продаж» може бути зазначено як «Обсяг продажів відповідно до дня, товару, магазину». Тому кожен запис цієї таблиці фактів є унікальним для дня, товару та магазину. Інші параметри можуть бути частиною цієї таблиці фактів (наприклад, місце розташування або регіон), але вони нічого не додають до унікальності фактичних записів. Ці «партнерські параметри» дозволяють отримувати додаткові фрагменти незалежних фактів, але, як правило, забезпечують розуміння на більш високому рівні агрегації (регіон містить багато магазинів). ПрикладЯкщо бізнес-процес — це продажі, то відповідна таблиця фактів буде, як правило, містити стовпчики, що представляють як сирі факти, так і агреговані[en] у рядках. Наприклад:
«Середньодобові продажі» — це вимірювання, яке зберігається у таблиці фактів. Таблиця фактів також містить зовнішній ключ із таблицями розмірностей, де зберігаються часовий ряд (наприклад, дата) та розмірності іншого параметру (наприклад, місце розташування магазину, продавець, товар). Усі зовнішні ключі між таблицею фактів та таблицею розмірностей повинні бути сурогатними ключами, а не похідними від операційних даних. Типи вимірювань
Таблиця фактів може містити у собі або деталі на рівні фактів, або факти, які були об'єднані (таблиці фактів, що містять сукупні факти, часто називаються підсумковими таблицями). Особливу увагу слід приділяти при обробці пропорцій та відсотків. Одне добре правило при розробці[1] полягає в тому, щоб ніколи не зберігати відсотки або пропорції у таблицях фактів, а лише обчислювати їх у інструменті доступу до даних. Таким чином, у таблицях фактів зберігається лише чисельник і знаменник, які потім можуть бути агрегованими, а збережені агреговані значення можуть потім використовуватися для обчислення пропорцій або відсотків вже в інструменті доступу до даних. У реальному світі можна мати таблицю фактів, яка не містить жодних розмірностей чи фактів. Ці таблиці називаються «таблицями фактів без фактів» або «таблицею з'єднань[en]». «Таблиці фактів без фактів» можуть, наприклад, використовуватися для моделювання відносин «багато-до-багатьох» або створення відміток часу подій.[1] Типи таблиць фактівІснує чотири основних типів вимірювальних подій, які описують всі таблиці фактів.[2]
Кроки розробки таблиці фактів
Альтернативний підхід до розробки, описаний Кімбаллом:[1] 1) Вибрати бізнес-процес; 2) Визначити ступінь деталізації; 3) Визначити розмірності; 4) Визначити факти. Примітки
|