ВТБ вложит миллиард в большие данные

Интеграция Бизнес-приложения Инфраструктура ИТ в банках
мобильная версия
, Текст: Валерия Шмырова

ВТБ намерен вложить 1 млрд руб. в создание гибридного хранилища данных для анализа заемщиков. Архитектурной основой решения стали Teradata и Hadoop. Система состоит из двух кластеров, предназначены для решения разных задач.


Гибридное хранилище

ВТБ создает гибридное хранилище данных, в которое намеревается инвестировать более 1 млрд руб. Платформа будет собирать розничные данные для последующего решения аналитических задач. Использоваться она будет для анализа заемщиков и формирования для них индивидуальных предложений.

По словам Сергея Баранова, руководителя ИТ-департамента и старшего вице-президента ВТБ, в перспективе банк планирует создать «целую экосистему больших данных» в целях улучшения качества обслуживания клиентов.

В основу архитектуры гибридного хранилища легли платформы Teradata и Hadoop. По словам Андрея Алексеенко, генерального директора Teradata Россия, компания решает различные задачи для ВТБ уже несколько лет. Среди приоритетов для банков сегодня Алексеенко выделил мобильность, персонализацию и клиентоориентированность.

Как это работает

С целью повышения катастрофоустойчивости в состав платформы были включены два полностью дублирующих друг друга продуктивных контура. Они синхронизированы, но находятся в разных локациях.

При этом каждый контур выполняет свои классы задач. Один занимается обработкой данных, поступающих из различных систем, поддерживает онлайн-сервисы банка и формируют отчетность. Второй контур обеспечивает работу корпоративных пользователей — как непосредственную работу, так и с использованием бизнес-приложения или инструментов Business Intelligence (BI).

vtb600.jpg
ВТБ развивает экосистему больших данных

Все компоненты масштабируются, что позволяет получить прямой доступ к данным внешних систем. По словам разработчиков, это помогает платформе соответствовать меняющимся требованиям бизнеса в каждый конкретный момент.

ВТБ и большие данные

В июле 2017 г. CNews писал, что в ВТБ завершился пилотный проект по внедрению инструментов больших данных с использование свободного ПО. В организации была развернута система формирования аналитической и управленческой отчетности на открытой платформе Hadoop с применением технологий обработки данных Apache Spark и Apache Zeppelin.

В качестве реляционной СУБД была задействована свободная PostgreSQL, которая не является непосредственной частью системы и в случае необходимости может быть заменена на другую базу данных.

Система получила название ГАУСС (GAUSS) — Global Transaction Business Analytic Unified Source & System, единая аналитическая система-источник для транзакционного бизнеса. Вендором проекта выступила компания Luxoft.

ГАУСС работает на кластерах, состоящих из множества узлов, где предусмотрено дублирование системы на случай выхода из строя одного из них и осуществляется поддержка нескольких рабочих копий данных. Hadoop был выбран для построения системы, так как его работа основана на принципе параллельной обработки данных.

В начале 2018 г. выяснилось, что пользователям ГАУСС для формирования аналитической и управленческой отчетности потребовались привычные инструменты бизнес-аналитики, а именно Microsoft Power BI. С учетом того, что напрямую Power BI с Hadoop взаимодействовать не может, но хорошо работает с данным в Microsoft SQL Server, в ВТБ решили осуществить интеграцию этой СУБД с Hadoop, задействовав для этого Microsoft Polybase. Осуществить проект помогли специалисты из самой Microsoft.