Рекомендуем, 2020

Выбор редакции

Разница между таблицей фактов и таблицей измерений

Таблица фактов и таблица измерений являются важными факторами для создания схемы . Запись таблицы фактов представляет собой комбинацию атрибутов из разных таблиц измерений. Таблица фактов помогает пользователю анализировать бизнес-аспекты, которые помогают ему принимать решения по улучшению своего бизнеса. С другой стороны, таблицы измерений помогают таблице фактов собирать измерения, по которым должны быть приняты меры.

Отличие таблицы фактов от таблицы измерений состоит в том, что таблица измерений содержит атрибуты, по которым принимаются меры в таблице фактов . Существуют и другие факторы, которые создают различия между таблицей фактов и таблицей измерений для их просмотра. Давайте взглянем на сравнительную таблицу, показанную ниже.

Сравнительная таблица

Основа для сравненияТаблица фактовТаблица размеров
основнойТаблица фактов содержит измерение вдоль атрибутов таблицы измерений.Таблица измерений содержит атрибуты, по которым таблица фактов вычисляет показатель.
Атрибут и записиТаблица фактов содержит меньше атрибутов и больше записей.Таблица измерений содержит больше атрибутов и меньше записей.
Размер столаТаблица фактов растет по вертикали.Таблица размеров растет горизонтально.
ключТаблица фактов содержит первичный ключ, который является объединением первичных ключей всей таблицы измерений.Каждая таблица измерений содержит свой первичный ключ.
СозданиеТаблица фактов может быть создана только после заполнения таблиц измерений.Таблицы измерений должны быть созданы в первую очередь.
схемаСхема содержит меньшее количество таблиц фактов.Схема содержит большее количество таблиц измерений.
АтрибутыТаблица фактов может содержать данные как в числовом, так и в текстовом формате.Таблица размеров всегда содержит атрибуты в текстовом формате.

Определение таблицы фактов

Таблица фактов - это таблица, которая содержит измерения вдоль атрибутов таблиц измерений. Он может содержать информацию на минимально возможном уровне. Некоторая таблица фактов просто содержит сводные данные, называемые агрегированной таблицей фактов . Таблица фактов почти содержит данные с отметкой даты . Давайте обсудим характеристики таблицы фактов.

Сцепленный ключ
Таблица фактов содержит объединенный ключ, который является объединением первичных ключей всех таблиц измерений. Объединенный ключ таблицы фактов должен однозначно идентифицировать строку в таблице фактов.

Зерно данных
Зернистость данных показывает, насколько глубоко были сохранены измерения в таблице фактов. Зерно данных должно быть на максимально возможном уровне.

Аддитивные меры
Атрибуты таблицы фактов могут быть полностью аддитивными или полуаддитивными . Полностью аддитивные меры - это те, которые можно легко суммировать для всех измерений в таблице фактов. Например, number_ordered - это атрибут, который можно суммировать для всех измерений. Например, мы можем вывести общее количество по порядку для конкретного клиента, региона, даты, бренда и т. Д. Полуаддитивные меры - это те, которые можно суммировать по некоторым измерениям таблицы фактов, но не по всем измерениям. Мол, сумма баланса не может быть суммирована во временном измерении, поскольку она изменяется со временем.

Разреженные данные
Иногда мы можем видеть записи в таблице фактов, которая имеет атрибуты с нулевыми мерами . Например, не может быть никакого заказа в праздничный день. Таким образом, атрибуты для этой даты будут иметь нулевые показатели. Нам не нужно хранить показатели для такого рода записей, поскольку они не предоставляют никакой информации.

Вырожденные размеры
Иногда вы можете встретить некоторые измерения в таблице фактов, которые вообще не являются аддитивными. Например, order_number, customer_id, вы не можете добавить эти типы измерений. Однако, в случае, если вам нужно найти заказ, сделанный конкретным клиентом в этом месяце; тогда вам понадобится customer_id, чтобы связать ваш поиск. Эти типы, если атрибуты или измерения таблицы фактов называются вырожденным измерением .

Определение таблицы размеров

Таблица измерений является ключевым компонентом для начальной схемы. Таблица измерений содержит атрибуты, которые представляют измерения, по которым выполняется измерение в таблице фактов. Далее мы обсудим некоторые характеристики таблицы измерений.

Атрибуты и ключи
Каждая таблица измерений должна иметь первичный ключ, который однозначно идентифицирует каждую запись таблицы. Обычно наблюдается, что таблица измерений содержит много атрибутов. Следовательно, он кажется широким, т.е. когда вы создаете таблицу измерений, вы обнаружите, что она распространяется горизонтально .

Значения атрибута
Значения атрибутов в таблице измерений редко бывают числовыми, в большинстве случаев вы найдете значения в атрибутах в текстовом формате . Например, название продукта, бренд, категория, подкатегория и т. Д.

Отношение между атрибутами
Часто вы можете наблюдать, что атрибуты, с которыми вы сталкиваетесь в таблице измерений, не связаны напрямую. Например, Product_brand не имеет ничего общего с package_date, но все же оба могут быть атрибутами таблицы измерений Product.

нормализация
Таблица измерений не должна быть нормализована . Это потому, что нормализация таблицы создаст много промежуточных таблиц. Когда запрос выбирает атрибут из таблицы измерений и восстанавливает результаты измерений для таблицы фактов, запрос должен проходить через те промежуточные таблицы, которые становятся неэффективными. Следовательно, таблицы измерений не нормализованы.

Сверлить, свернуть
Атрибуты таблицы измерений позволяют получать подробные сведения, переходя от агрегированных атрибутов более высокого уровня к атрибутам более низкого уровня. Например, если вы хотите найти общий объем продаж в регионе, вы можете перейти к поиску продаж по штатам, городам и почтовым индексам. Вы можете даже свернуть, чтобы найти общий объем продаж сначала по почтовому индексу, затем по городу и затем штату.

Множественная иерархия
Часто таблица измерений предлагает несколько иерархий. Например, у нас есть таблица измерений продукта для универмага. Сейчас у нас два отдела маркетинга и бухгалтерия.

Отдел маркетинга будет детализировать атрибуты таблицы измерения продукта в определенной иерархии, чтобы получить измерения для таблицы фактов.

С другой стороны, бухгалтерия будет детализировать среди атрибутов таблицы измерения продукта в другой иерархии, чтобы получить измерения для таблицы фактов.

Таким образом, таблица измерений должна иметь несколько иерархий или уровень агрегации атрибутов, чтобы позволить пользователю детализировать любую из нескольких иерархий.

документация
Хотя таблица измерений имеет слишком много атрибутов, в ней меньше записей.

Основные различия между таблицей фактов и таблицей измерений

  1. Таблица фактов содержит измерения по измерению / атрибутам таблицы измерений.
  2. Таблица фактов содержит больше записей и меньше атрибутов по сравнению с таблицей измерений, тогда как таблица измерений содержит больше атрибутов и меньше записей.
  3. Размер таблицы таблицы фактов увеличивается вертикально, тогда как размер таблицы измерения измеряется горизонтально.
  4. Каждая таблица измерений содержит первичный ключ для идентификации каждой записи в таблице, тогда как таблица фактов содержит составной ключ, который является комбинацией всех первичных ключей всей таблицы измерений.
  5. Таблица измерений должна быть записана до создания таблицы фактов.
  6. Схема содержит меньше таблиц фактов, но больше таблиц измерений.
  7. Атрибуты в таблице фактов являются как числовыми, так и текстовыми, но атрибуты таблицы измерений имеют только текстовые атрибуты.

Заключение:

Оба одинаково важны для создания схемы, но таблица измерений должна быть записана перед таблицей фактов. Так как невозможно создать таблицу фактов без измерений.

Top