Хранилище данных ВТБ охватит Россию, СНГ и Европу
Группа ВТБ – одна из крупнейших российских финансовых организаций. Подразделения и дочерние предприятия Группы находятся в разных регионах России, СНГ, странах Европы и Азии. Сегодня Группа ВТБ развивает такие направления, как инвестиционный бизнес, банковская розница, страхование, лизинг, факторинг и др. Структуры компаний Группы серьезно отличаются друг от друга, что значительно осложняет формирование и хранение данных. Поэтому в Группе ВТБ при поддержке "ВТБ Капитал" был инициирован проект по перестройке системы аналитической финансовой отчетности и разработке корпоративного хранилища данных, охватывающего региональные и зарубежные подразделения. Партнером проекта выступила группа компаний AT Consulting.Политика безопасности
Особое внимание в рамках реализации проекта было уделено обеспечению информационной безопасности при передаче данных от дочерних предприятий.
Структура системы хранения и анализа данных
Технически система состоит из 4 компонентов. Это модуль приема данных – упомянутый веб-интерфейс на базе Apache 2.2, использующий язык PHP5 для создания динамически формируемого контента, язык mod_ssl для аутентификации и авторизации пользователей с помощью RSA-сертификатов. Также применяется технология AJAX для предотвращения полной перезагрузки веб-страниц в момент каких-либо действий. Второй компонент – модуль преобразования и загрузки данных в формате Excel (ETL), реализованный на технологии .NET и использующий приложение SQL*Loader из стандартного пакета Oracle Client 10g. Третий – хранилище данных на базе Oracle 10g с реализованной физической моделью данных, специально разработанной для данной задачи. Четвертый модуль – система предоставления отчетности на базе Oracle BI.
Для координации загрузок и хранения метаданных предусмотрен контрольный механизм, реализованный на языке PL\SQL в хранилище данных. Он используется всеми модулями системы и позволяет вести учет загрузок и их статусов, а также предоставляет ряд вспомогательных программных интерфейсов. Для его применения в системах, расположенных в других сегментах, реализована периодическая репликация метаданных.
Процесс загрузки данных предусматривает обращение уполномоченного пользователя из дочернего предприятия к веб-интерфейсу и загрузки файла с данными в формате Excel 2003/2007 с помощью заранее предопределенной формы. Такие пользователи подключаются к выделенному сегменту сети с помощью технологии VPN. Файл снабжается метаописанием и отправляется в асинхронном режиме в другой сегмент сети для обработки и загрузки (ETL-процесс). Пользователи получают результаты своих действий в режиме оффлайн – протоколы ошибок, возникших при проверке качества данных, а также статусы загрузок. Далее файл проходит стадию разбора и преобразования во временные структуры (таблицы Oracle), предназначенные для дальнейшей загрузки в физическую модель данных. После заполнения таких структур происходит запуск проверки информации на соответствие бизнес-логике. В случае успешного прохождения всех проверок блок данных загружается в физическую модель данных. Информация из нее используется для построения консолидированной статической отчетности в Oracle BI Publisher и настраиваемой отчетности в Oracle BI Answers.
Для этого были применены различные современные технологии информационной безопасности (ИБ): на сетевом уровне – выделенные домены сегментов сетей, разделенные между собой файерволами и специальными средствами защиты снаружи. Дочерние предприятия Группы ВТБ, имея доступ к общей системе, не имеют при этом возможности доступа в локальную сеть Банка ВТБ. Они могут попасть только в специально выделенный сегмент сети, который физически "оторван" от локальной сети Банка ВТБ. Данные в локальную сеть передаются по специальным каналам с высоким уровнем защиты.
Для Банка ВТБ был построен отдельный тракт сбора данных таким образом, что информация не выходит за его пределы, не попадает на тот сервер, на который приходят данные дочерних предприятий. При этом внутри Банка ВТБ гораздо проще было реализовать задачу обеспечения информационной безопасности хранилища. Была применена общая политика ИБ для внутренней системы, использованы стандартные средства, построенные, в основном, на решениях Oracle и Microsoft.
При доступе к системам в Банке ВТБ давно используется доменная идентификация, каждый вход в сеть регламентируется. Кроме того, в новой аналитической системе есть свои средства безопасности, идентифицирующие специалистов, имеющих право управлять отчетностью. Доступ пользователей к отчетам разграничивается на основе групп Active Directory (WNA). Все действия сотрудников аудируются, ведутся соответствующие журналы и протоколы, доступные администраторам и службе безопасности Банка ВТБ.
Помимо технического контроля, на этапе загрузки данных и после нее есть возможность бизнес-проверки – внутри каждого отчета и между отчетами. Реализованы кросс-проверки, которые обеспечиваются и после загрузки полного пакета данных за соответствующий период.
Камни преткновения
Известно, что при реализации крупного проекта невозможно обойтись без сложностей. Одна из главных проблем проекта построения хранилища данных в Группе ВТБ – его гетерогенность. "Дочки" Группы находятся в разных концах России, СНГ, Европы и Азии. При этом структура зарубежных компаний значительно отличается. Также Группа ВТБ включает и предприятия, специализирующиеся на лизинге, факторинге, других небанковских направлениях деятельности, которые тоже необходимо было подключить к общей системе. "Ключевая сложность заключалась в унификации процессов, регламентов и стандартов, – говорит Денис Гузовский. – Осложняла задачу также большая географическая распределенность предприятий, разница во времени и т.п.". Решались эти проблемы посредством поэтапной разработки методологии, которая подойдет всем. Она прошла несколько итераций, от чего-то пришлось отказаться, но в конце концов был выработан вариант, который подошел всем предприятиям Группы.
Не мене сложным был процесс унификации требований внутри Банка ВТБ: это очень крупная организация, включающая много подразделений, некоторые достаточно молоды, в частности, департамент рисков был создан всего несколько лет назад. Согласование единых стандартов в таких случаях – всегда проблемный процесс, требующий множества совместных встреч, поиска компромиссов и выработки единого подхода. И здесь, как отметил Денис Гузовский, также были необходимы бизнес-консультанты и востребованы дополнительные услуги АТ Consulting. В рамках проекта были выработаны несколько новых единых стандартов Банка ВТБ, появились соответствующие документы, которые значительно упростили работу даже в не связанных с проектом сферах.
Результаты
На сегодняшний день работы по первому этапу завершены. "Мы считаем проект успешным и эффективным, – говорит Денис Гузовский. – С помощью консультантов на первом этапе мы определили основные ожидания, установили достаточно жесткие, но реальные сроки и выдержали их. Хочу отметить, что этот проект даже выделен руководством среди всех инициатив Банка ВТБ". На данном этапе система позволяет собирать с дочерних финансовых компаний Группы ВТБ консолидированную отчетность по основным направления бизнеса. Это процентная и валютная позиции, ликвидность, кредитно-гарантийный портфель и портфель по ценным бумагам. Также ИС позволяет головной организации строить отчетность по всей Группе, анализировать тренды по ценным бумагам, кредитному портфелю практически до уровня сделок, оценивать влияние тех или иных сделок на изменение показателей, строить прогнозы на основе динамики этих параметров. С сентября Банк ВТБ начал постепенно отказываться от старых отчетов.
По словам директора ДИТ Банка ВТБ – старшего вице-президента Дмитрия Назипов, "на данный момент создана и внедрена информационная система, являющаяся унифицированным автоматизированным решением по сбору и подготовке отчетности по Группе компаний ВТБ. Проделанная работа позволила заложить прочный и долговременный фундамент для дальнейшего развития и оптимизации технологий управления финансами Группы".
Планы на будущее
В настоящий момент система охватывает не все дочерние предприятия, а только основные (14 организаций), которые обеспечивают более 90% бизнеса Группы ВТБ. В дальнейшем предполагается охватить все дочерние компании. Также планируется расширить область финансовых показателей, добавить возможность формирования и анализа новых отчетов – например, по клиентам, продуктам, по точкам продаж. Для этого был инициирован второй проект, над которым совместно с АТ Consulting уже ведутся работы. Основные задачи следующего этапа – упомянутое расширение в сторону новых отчетов, новых видов информации, а также загрузка детальных данных. Это позволит в любой ситуации получить точные данные, проследить, как и почему изменились те или иные показатели. При этом обеспечение детализации информации – сложная задача, связанная с легитимностью и юридическими вопросами передачи данных между странами и между дочерними предприятиями. По движению агрегированной информации нет серьезных ограничений и каких-либо законодательных требований. Но работа с детальными данными ограничена законами о банковской тайне, о персональных данных и др. Все это необходимо учесть в новой методологии.
На сегодняшний день рабочая группа проекта совместно со специалистами АТ Consulting разрабатывает концепцию развития системы. "До конца текущего года мы планируем согласовать окончательную версию в Банке ВТБ и дочерних организациях, с тем чтобы в начале следующего начать техническую реализацию нового этапа", – говорит Светлана Федоренко. Первые результаты ожидается получить уже в середине 2010 года, но только в 2012-м – завершить основные работы по проекту.