Разделы

Цифровизация Бизнес-приложения

Хранение и обработка данных в стиле SAP: BW или HANA?

Современные компании тонут в море информации, утверждают исследования экспертов в области ИТ. Объемы данных растут, а сроки, которые есть у руководителя на принятие взвешенного управленческого решения, уменьшаются. Счет идет не на дни и недели, как раньше, а на часы и минуты. Как найти точки сопряжения этих тенденций, движущихся по расходящимся курсам? Один из способов – построить аналитическую систему, чтобы быстро получать агрегированные данные из различных ИТ-приложений.

Данные для анализа в SAP HANA также могут поступать из базы данных, находящейся под управлением ERP-системы. Отличие от использования хранилища на основе SAP BW – отсутствие процессов ETL. Загрузка информации осуществляется с помощью технологии репликации данных, которая позволяет переносить все изменения, которые произошли внутри ERP-системы, в базу данных внутри SAP HANA в режиме, максимально приближенном к real-time. В результате пользователям не нужно ожидать очередного (как правило, ежесуточного) срабатывания ETL-процесса или работать с устаревшими данными. Результаты всех изменений данных, происходящих в ERP, оперативно доступны через привычные интерфейсы бизнес-аналитики SAP BI (рис. 2).


Увеличить

Рис.2 Взаимодействие систем при обработке данных SAP ERP
на основе комплекса SAP HANA

Как и в случае с традиционным хранилищем данных, в качестве источников информации SAP HANA может использовать не только ERP-систему, но и другие приложения. В этом случае для загрузки данных используются средства SAP BusinessObjects Data Services (рис.3).


Увеличить

Рис.3 Взаимодействие систем при обработке данных
из различных источников на основе комплекса SAP HANA

В такой конфигурации скорость обработки запросов даже при анализе больших объемов данных остается высокой, хотя о работе в режиме реального времени (с точки зрения актуальности данных) речь уже не идет.

Баланс стоимости, потребностей и перспектив

Помимо нацеленности на разные задачи, платформа SAP HANA отличается от хранилища данных на основе SAP BW более высокой начальной стоимостью. Хотя здесь, безусловно, многое зависит от ландшафта и особенностей конкретного предприятия. Частично снизить затраты времени и ресурсов на развертывание SAP HANA помогает то, что наиболее востребованный функционал (например, ускоренная подготовка отчетности по анализу прибыльности) поставляется в виде пакетированных решений. Практика EPAM Systems показывает, что в этом случае удается свести к минимуму участие бизнес-консультантов в проекте внедрения. В других случаях (например, если компании требуется функциональность для получения оперативной отчетности из ERP-системы) потребуются ресурсы на адаптацию поставляемого набора панелей управления и отчетов к реальным бизнес-процессам.

Ряд технологий, реализованных в SAP HANA, позволяет в дальнейшем расширить применение этого комплекса и тем самым компенсировать более ранние инвестиции. К примеру, одна из перспектив – это использование платформы как базы данных для ERP-системы. Таким образом, SAP HANA станет местом хранения как аналитической, так и транзакционной информации.

Сейчас есть проекты, в которых SAP HANA выступает в качестве базы данных и для SAP BW. Такой подход помогает сохранить выстроенную инфраструктуру компании, сделанные ранее инвестиции и значительно повысить скорость работы SAP BW. Кроме того, у компании появляется возможность постепенно технологически развивать текущий ландшафт, но при этом существенно экономить финансовые средства.

Важная особенность платформы - функциональность Calculation Engine. Она позволяет выполнять ресурсоемкие операции над данными непосредственно в оперативной памяти и значительно сокращать обмен информацией между базой данных и приложениями. В результате SAP HANA может использоваться и как платформа для разработки in-memory-приложений, которые будут полностью работать в оперативной памяти. Для определения закономерностей, прогнозирования ситуации и других видов предиктивного анализа Calculation Engine может использовать собственную библиотеку функций статистической обработки данных. Также для этих целей имеется возможность задействовать всю мощь и широкий спектр библиотек открытого языка R. Тем самым аналитика переходит на новый уровень – от констатации фактов к выявлению закономерностей и предвидению ситуации.

Стоит отметить, что, в отличие от хранилищ данных, в состав SAP HANA входит не только программное обеспечение, но и аппаратная часть – комплекс blade-серверов на базе архитектуры Intel Nehalem-EX CPU. Такой подход также позволяет экономить ресурсы на интеграцию комплекса в уже существующий на предприятии ландшафт.

Решение о выборе варианта построения аналитической системы зависит от задач и особенностей каждой конкретной компании. Для кого-то, возможно, окажется вполне достаточным функциональности, качества и скорости, которые обеспечивает SAP BW. Для кого-то условия конкуренции уже сейчас становятся настолько тяжелыми, что нужна скорость и перспективность SAP HANA. В любом случае реализация такого проекта поможет более эффективно использовать накопленные и накапливаемые объемы данных, обеспечит требуемые сроки принятия управленческих решений и будет залогом успешности бизнеса.

Иван Копть и Алла Ленская, EPAM Systems