
Проще говоря, витрина данных - это хранилище данных, ограниченное по объему, данные которого можно получить путем суммирования и выбора данных из хранилища данных или с помощью различных процессов извлечения, преобразования и загрузки из системы исходных данных.
Сравнительная таблица
Основа для сравнения | Хранилище данных | Data Mart |
---|---|---|
основной | Хранилище данных не зависит от приложений. | Данные витрины специфичны для приложения системы поддержки принятия решений. |
Тип системы | централизованные | децентрализованная |
Форма данных | детализированный | Обобщенная |
Использование денормализации | Данные немного денормализованы. | Данные сильно денормализованы. |
Модель данных | Низходящий | Вверх дном |
Природа | Гибкий, ориентированный на данные и долгий срок службы. | Ограничительная, ориентированная на проект и короткая жизнь. |
Тип используемой схемы | Факт Созвездие | Звезда и снежинка |
Легкость строительства | Трудно построить | Прост в сборке |
Определение хранилища данных
Термин « хранилище данных» означает временную, предметно-ориентированную, энергонезависимую и интегрированную группу данных, которые помогают в процессе принятия решений руководством. В качестве альтернативы, это хранилище информации, собранной из нескольких источников, хранящейся в единой схеме, на единственном сайте, который позволяет интегрировать различные прикладные системы. Как только эти данные собраны, они хранятся в течение длительного времени, следовательно, имеют длительный срок службы и позволяют получить доступ к исторической информации.

Следовательно, хранилище данных предоставляет пользователю единый интегрированный интерфейс с данными, через который пользователь может легко писать запросы поддержки принятия решений. Хранилище данных помогает превратить данные в информацию. Проектирование хранилища данных включает нисходящий подход.
Он собирает информацию о субъектах, охватывающих всю организацию, таких как клиенты, продажи, активы, товары, и, следовательно, его диапазон охватывает все предприятие. Обычно в нем используется схема констелляции фактов, которая охватывает широкий круг вопросов. Хранилище данных не является статичной структурой и постоянно развивается .
Определение Data Mart
Витрина данных может быть вызвана как подмножество хранилища данных или подгруппа общекорпоративных данных, соответствующих определенному набору пользователей. Хранилище данных включает в себя несколько ведомственных и логических витрин данных, которые должны быть постоянными в их иллюстрации данных, чтобы обеспечить надежность хранилища данных. Витрина данных - это набор таблиц, которые концентрируются на одной задаче, разработанной с использованием подхода «снизу вверх».

Поскольку схема « звезда» и « снежинка» ориентирована на моделирование одного объекта, именно поэтому они обычно используются в витрине данных. Хотя схема «звезда» более популярна, чем схема «снежинка». В зависимости от источника данных витрины данных могут быть классифицированы на два типа: зависимые и независимые витрины данных.
Ключевые различия между хранилищем данных и представлением данных
- Хранилище данных не зависит от приложения, в то время как витрина данных является специфической для приложения системы поддержки принятия решений.
- Данные хранятся в одном централизованном хранилище в хранилище данных. В отличие от этого, витрина данных хранит данные децентрализованно в пользовательской области.
- Хранилище данных содержит подробную форму данных. Напротив, витрина данных содержит обобщенные и выбранные данные.
- Данные в хранилище данных слегка денормализованы, тогда как в случае витрины данных они сильно денормализованы.
- Построение хранилища данных предполагает нисходящий подход. И наоборот, при построении витрины данных используется восходящий подход.
- Хранилище данных является гибким, ориентированным на информацию и давно существующим характером. Напротив, витрина данных ограничена, ориентирована на проект и имеет более короткое существование.
- Схема констелляции фактов обычно используется для моделирования хранилища данных, тогда как в витрине данных схема «звезда» более популярна.
Заключение
Хранилище данных обеспечивает представление предприятия, единую и централизованную систему хранения, собственную архитектуру и независимость приложений, в то время как витрина данных является подмножеством хранилища данных, которое обеспечивает представление отдела, децентрализованное хранилище. Поскольку хранилище данных очень большое и интегрированное, оно имеет высокий риск отказа и сложностей при его создании. С другой стороны, витрину данных легко построить, и связанный с этим риск отказов также меньше, но витрина данных может подвергаться фрагментации.