Разделы

Бизнес Цифровизация Инфраструктура Бизнес-приложения

Хранилища данных: шаги от идеи до внедрения

От качества владения информацией зависит многое в бизнесе: быстрота решений, анализ результатов, чёткость и глубина представления "картины" бизнес-связей и т.п. С хранилищами данных связывали и продолжают связывать большие надежды в сфере развития информационной индустрии.

Для развития и процветания бизнеса недостаточно просто владеть информацией, все зависит от качества владения - умения четко и быстро определять категорию показателей, на основании которых требуется принимать решение, проводить анализ определенных значений данных показателей с различной степенью детализации с учетом всех параметров, оказывающих на них влияние. Хранилище данных является хорошим инструментом в решении данной задачи. Тот, у кого есть средства, позволяющие четко представить картину бизнес-данных, их взаимосвязь, историю возникновения, временную глубину, оказывается в выигрыше. Он может отследить тенденции развития, спрогнозировать возможные изменения, и, соответственно, получить конкурентные преимущества. Качественная визуализация данных, ориентированных на различные группы работников и отделы - одна из основных задач, решаемых с помощью хранилища данных.

Что такое хранилище данных

Хранилище данных (Data Warehouse) по сути представляет собой центр, в который собирается вся необходимая информация из различных подразделений предприятия. Прежде чем попасть в хранилище, данные должны быть соответствующим образом обработаны. БД, в которых происходит накопление, обработка первичных данных, на основании которых строится хранилище, будем далее называть транзакционными. Разные отделы могут использовать неодинаковые системы обработки со своими транзакционными БД. Соответственно, прежде чем использовать эти разрозненные данные, их нужно проанализировать. Этот процесс занимает весьма длительный период в процессе подготовки к созданию хранилища.

Связь между хранилищем данных и транзакционными БД

 Связь между хранилищем данных и транзакционными БД

Источник: CNews Analytics

Поскольку хранилище – это объединение и интеграция данных, необходимо выявить разницу в форматах хранения информации в различных источниках, провести ревизию корректного заполнения полей таблиц, построить план взаимосвязи информации, а также решить, какая информация из транзакционных баз нам будет необходима для дальнейшего использования в хранилище.

Олег Гиацинтов: Первый и основной этап – это правильная постановка задачи

Олег Гиацинтов

На вопросы об особенностях организации корпоративного хранилища данных корреспонденту CNews ответил Олег Гиацинтов , технический директор компании Data Integration Software.

CNews: Каким, на ваш взгляд, должно быть корпоративное хранилище данных.

Олег Гиацинтов: Во-первых, хранилище данных должно решать определенные задачи: получение полной информации о клиенте, предоставление конкретных данных для последующего анализа определенного сегмента рынка и т.д. Во-вторых, хранилище должно быть гибким. Практика показывает, что по мере развития бизнеса задачи меняются. Соответственно, меняются требования к данным, отчетности и, как следствие, к хранилищу.

Полный текст интервью

Когда стоит задуматься о ХД?

Основанием для начала проектирования хранилища служит все возрастающая потребность бизнеса компании в определенных категориях данных за различный период времени. Объем информации, на основании которой необходимо принимать решение, постоянно растет и становится головной болью аналитиков и менеджеров компании. В конце концов это может привести к большим затратам времени (а соответственно - средств) на оценку реального состояния дел, составление планов работ, а также получение недостоверных данных - ведь разобраться в море отчетов, таблиц, операций и т.д. становится весьма непросто. При этом данные из различных подразделений поступают зачастую в разных форматах, с разной степенью детализации и качества. Другими словами, достигается некая "точка кипения", когда требуется вносить серьезные изменения в информационную систему компании.

Схема взаимодействия отделов с хранилищем данных

 Схема доступа к хранилищу данных

Источник: CNews Analytics

Хранилище предоставляет возможность получения каждым подразделением данных в разрезе интересующих его показателей, в удобном и привычном для сотрудников этого подразделения виде. Можно сравнить хранилище с огромным складом с большим ассортиментом продукции, а информацию по подразделениям, получаемых из него, с небольшими специализированными отделами, где собрана соответствующая категория товаров. Такого рода специализированные представления информации, часто называют витринами данных.