Разделы

Цифровизация Инфраструктура

Рецепт HP: как резервное копирование экономит бюджет

Важность сохранности данных осознают почти все компании. Некоторые из них приобрели отдельные компоненты системы резервного копирования, другие делают апгрейд. Но лишь единицы используют комплексную систему резервного копирования и архивирования.

В России до сих пор мало кто серьезно относится к резервному копированию. Во многих компаниях данные вообще никак не защищены. В ряде крупных организаций даже нет систем хранения данных – информация разбросана по сотням разрозненных серверов. Зачастую администраторы таких серверов осуществляют резервное копирование подручными средствами, но делают это нерегулярно и далеко не всегда.

Последствия отсутствия

Большая проблема с сохранностью информации стоит перед предприятиями, имеющими филиалы. В них данные либо не резервируются вообще, либо это делается локально и копии хранятся рядом с рабочими данными. Поэтому при пожаре или наводнении копии теряются вместе с исходной информацией. Кроме того, такой кустарный метод резервного копирования сильно зависит от человеческого фактора. Если увольняется ИТ-администратор, то новому сотруднику бывает трудно разобраться в политике резервирования и правильно восстановить информацию из копии.

В других компаниях ИТ-руководители думают, что при наличии ленточных библиотек и программного обеспечения резервного копирования данные в безопасности. Менеджер спокоен до тех пор, пока не происходит авария (техногенная или программная) и организация теряет критичные данные. После этого оказывается, что для восстановления работоспособности приложения требуются не минуты, не часы, а дни. А иногда восстановить информацию не удается совсем.

Часть организаций для резервирования используют те же массивы, на которых хранятся продуктивные данные. Здесь допускаются сразу две ошибки. Во-первых, это очень дорого. Разрастающиеся копии увеличивают ИТ-бюджет и нагрузку на рабочую систему хранения. Во-вторых, безопасность данных ставится под угрозу, так как авария на массиве может уничтожить и резервные копии. Кроме того, всегда лучше разделять администрирование хранения и резервирования, чтобы одна и та же ошибка не отразилась на самих данных и их копии.

В некоторых организациях решают обеспечить непрерывность бизнес-процессов за счет полной доступности ИТ-инфраструктуры. Строится резервный датацентр (или серверная) и информация зеркалируется. Однако после первого же крупного программного сбоя выясняется, что на второй площадке отразилась та же испорченная база.

Таких историй тысячи и, к сожалению, даже если что-то подобное случилось в соседней организации, руководство компании не считает нужным инвестировать в правильную систему защиты. Поэтому чаще всего компании обращаются за помощью после собственных аварий, когда потери исчисляются миллионами, не говоря уже о репутационных издержках. А иногда защищать становится просто нечего. По данным аналитической компании Gartner, три из пяти компаний, полностью потерявших данные, прекращают свою деятельность.

Программные решения

Одним из способов решения проблемы является использование системы резервирования и архивирования. Резервирование – это копирование продуктивных данных, необходимое для восстановления в случае потерь или сбоев. Архивирование – выведение информации, которая может понадобиться в будущем, за пределы основных систем хранения.

Комплексная система резервного копирования и архивирования (BURA – BackUp, Recovery and Archiving) состоит из программных и аппаратных компонентов. Современные программные решения резервирования обладают широким функционалом и позволяют управлять резервным копированием как малого офиса, так и крупных корпораций с несколькими датацентрами и сотнями филиалов. Также они поддерживают множество операционных систем, приложений и сред виртуализации; интегрируются с технологиями мгновенных снимков и клонов на дисковых массивах. При резервировании важны скорость восстановления (RTO – Recovery Time Objective) и точки восстановления, то есть промежутки времени, через которые делается резервирование (RPO – Recovery Point Objectives). Эти параметры и определяют политику резервного копирования, от них зависит стоимость решения.

Функционал для архивирования может быть как частью программного обеспечения резервного копирования, так и отдельным приложением. У создания архивов две основные задачи: экономия на хранении и соответствие требованиям регулирующих органов. Экономия достигается за счет того, что данные с дорогой системы хранения переезжают либо на дисковые библиотеки с дешевыми емкими дисками, либо на ленточные накопители. Кроме того, архивы гораздо дешевле резервировать, поскольку данные внутри архива обычно не меняются, а либо добавляются, либо удаляются.

Администраторы настраивают политики архивирования, в соответствии с которыми данные переезжают с рабочих устройств. Например, письма пользователей старше 30 дней или документы, к которым не обращались более 3 месяцев. Таким образом снижается нагрузка на продуктивные серверы, упрощается и ускоряется их резервное копирование и восстановление. При этом доступ к архивированным данным можно сделать прозрачным для пользователя за счёт установки ссылок на архивные объекты, например, в почтовом клиенте или на файловом сервере. В новейших приложениях есть встроенные системы аналитического поиска, позволяющие быстро и эффективно находить различные объекты даже в архивах неструктурированных данных очень большого размера (большие данные).

Огромное количество бесценной информации находится на рабочих станциях и мобильных компьютерах пользователей, поэтому их тоже надо защищать наряду с серверами. Где бы не находился пользователь, изменения регулярно (обычно – раз в сутки) отправляются в ЦОД компании или в «облако». И при поломке жесткого диска или потере ноутбука пользователь может восстановить все свои зарезервированные данные.

Аппаратные компоненты

Аппаратные компоненты включают в себя ленточные библиотеки, дисковые библиотеки с дедупликацией и дисковые файловые NAS-системы. Ленточные библиотеки пользуются заслуженной популярностью в качестве самого недорогого средства копирования. Существуют различные форматы лент, но самым распространенным является открытый стандарт LTO, поддерживаемый крупнейшими ИТ-производителями. Использование этого стандарта наиболее удобно, так как имеется преемственность поколений, возможность выбора поставщика, есть конкуренция по цене. Если же компания выбирает один из проприетарных стандартов, то она становится полностью зависима от единственного производителя.

В настоящий момент существует уже шестое поколение приводов LTO. Один картридж вмещает до 6.25 ТБ (с учетом сжатия) и может записывать со скоростью до 1.44 ТБ/час. На рынке можно найти широкий спектр ленточных устройств – от отдельных приводов (используются в малых офисах) до огромных библиотек, содержащих сотни приводов и десятки тысяч слотов. Такие библиотеки хороши для долгосрочных архивов (картриджи LTO-6 могут хранить данные до 30 лет), а также для записи больших приложений. А вот для быстрого восстановления и одновременной записи множества приложений ленты не подходят вследствие физических ограничений. Для этого рекомендуется использовать дисковые библиотеки.

Дисковые библиотеки с дедупликацией предназначены для оперативного резервного копирования и быстрого восстановления критичных данных. Поскольку это дисковый массив, скорость записи и чтения очень велика. Можно моментально восстанавливать отдельные файлы и таблицы, а резервные копии виртуальных машин запускаются за минуты. При этом дедупликация устраняет до 95% повторяющихся данных, которые всегда присутствуют при резервировании. Это позволяет в 20 раз сократить потребность в дисковой емкости, что существенно экономит ИТ-бюджет.

Эмуляция ленточных приводов помогает распараллеливать резервирование на сотни и тысячи потоков, одновременно сохраняя множество приложений и сокращая окно резервного копирования до считанных часов и даже минут. Компания может выбрать маленькую четырехдисковую библиотеку или систему, принимающую данные со скоростью более 100 ТБ/час и хранящую десятки петабайт. Если выбирается решение уровня датацентра, рекомендуется использовать многокотроллерные библиотеки, не имеющие единой точки отказа. Однако не все решения могут это обеспечить.

Еще один аппаратный компонет – дисковые хранилища NAS. Они могут вместить десятки петабайт данных и обычно используются для архивов, хранения видео-аудио контента, графической информации. Чаще всего применяются емкие медленные диски, хотя могут быть задействованы и быстрые носители. Данные между ними перемещаются в зависимости от требований.

Резервирование в облако

Особняком стоят сервисы по копированию в облако (BaaS – Backup as a service). Такие услуги обычно предоставляются сервис-провайдерами для малых и средних организаций, а также частных лиц. Компания может резервировать и архивировать файлы, приложения, почтовые сервисы и виртуальные машины, выбирать регулярность копирования, сроки хранения (от дней до десятилетий), типы носителей, политики доступа и возможности внесения изменений, количество копий и так далее. А шифрование ключами различной длины позволяет защитить данные от постороннего доступа.

Обычно использование облачных сервисов для копирования является дополнительным средством защиты данных. Изначально же резервирование делается на локальных носителях, что ускоряет процесс и не ставит компанию в зависимость от доступности каналов связи.

Построение комплексной системы

Крупные организации для эффективной и экономной защиты данных должны использовать все перечисленные решения. Им следует иметь как минимум два ЦОДа с репликацией или с зеркалированием данных. При этом в каждом ЦОДе необходимо присутствие системы резервного копирования. В особых случаях используются три и более площадок – несколько основных и одна резервная. Это значительно повышает сохранность данных в случае крупных аварий.

Отдельно следует обратить внимание на используемую систему хранения, так как данные часто теряются именно вследствии ее неполадок. Популярные классические двухконтроллерные массивы не обладают необходимой надежностью. При высокой нагрузке и выходе из строя одного контроллера, второй не может справиться со всем потоком данных и приложения аварийно прекращают работу. Поэтому лучше использовать массивы среднего уровня, имеющие четыре и более контроллера. Они гораздо надежнее и могут масштабироваться по производительности и расти вместе с бизнесом.

В соответствии с политиками управления жизненным циклом информации (ILM – Information Lifecycle Management) часть информации уходит в архив, где она распределяется по дисковым или ленточным библиотекам. Оставшиеся продуктивные данные также распределяются по степени важности и в соответствии с ними настраивается частота резервирования. С самых важных данных постоянно делаются мгновенные снимки средствами массива (Snap Shots), например, раз в час или в полчаса. Менее важные данные скидываются раз в сутки на дисковую библиотеку и обычно записываются лишь измененные данные (incremental copy). А раз в неделю делается полная копия такой информации. Оставшиеся данные, для которых не актуальна скорость восстановления, записываются на ленточную библиотеку. Либо раз в неделю, например в пятницу, запускается процесс полного резервирования всех данных на ленту. Затем эти данные извлекаются из библиотеки и в целях безопасности вывозятся на внешнюю площадку (если у компании нет резервного ЦОДа).

У небольших компаний обычно нет необходимости, а главное возможности реализации всех этих решений. Следует выбрать самые важные компоненты, а вторую площадку заменить резервированием в облако. Также существует практика, когда старое оборудование, выведенное из эксплуатации, вывозится на вторую площадку и запускается как резервное. Здесь надо иметь в виду, что зачастую такое оборудование уже снято с поддержки и надежность его крайне низка. Оно создает чувство ложной уверенности, что данные под защитой. И когда на основной площадке происходит авария, старое оборудование резервного сайта может подвести. Тогда компания окажется без ИТ-сервисов, и, скорее всего, потеряет часть данных. Поэтому к такой практике надо подходить осторожно, обязательно обеспечив старое оборудование сервисной поддержкой.

Поскольку самостоятельно разработать и реализовать грамотную концепцию резервного копирования мало кому под силу, рекомендуется обращаться к ИТ-интеграторам и вендорам. У них есть специалисты и методики, позволяющие провести оценку ИТ-инфраструктуры и бизнес-процессов организации, разработать, внедрить, а затем поддерживать весь этот программно-аппаратный комплекс. Также необходимо максимально полно использовать сервисные возможности поставщика, поскольку самостоятельно провести инсталляцию и затем осуществлять обслуживание такой системы крайне сложно.

Администратор резервного копирования не всегда занимается регулярной проверкой копий, чтобы убедиться в их целостности и осуществляет их тестовое восстановление. Без таких действий даже самая совершенная система резервирования не дает гарантии сохранности данных. Поэтому подобные процедуры нужно обязательно включить в регламент, тем более что современное программное обеспечение позволяет делать это автоматически.

Серьезно следует подойти и к выбору поставщика. Существует множество вендоров, предлагающие решения по защите данных. Кто-то делает хорошее ПО бэкапа, кто-то - дисковые библиотеки с дедупликацией, а у кого-то лучше получаются ленточные хранилища. Если подбирать компоненты у разных поставщиков, то есть вероятность столкнуться с трудностями при интеграции разрозненных решений в единый комплекс. А это приведет к урезанию функционала и дополнительным сложностям при эксплуатации.

Все это не является большой проблемой до тех пор, пока не произойдут изменения в системе резервного копирования или ИТ в целом, что может привести к проблемам с бэкапом. Чаще всего компания не может самостоятельно устранить неполадки и обращается к вендорам. При этом зачастую оказывается, что новая версия ПО резервирования одного поставщика частично несовместима с текущими драйверами библиотеки другого вендора. Либо поставщик ПО ссылается на проблемы «железа», а последний, наоборот, указывает на софт. Поэтому следует выбрать такого поставщика, который обладает самым полным набором решений и сервисов в данной сфере.

Построив правильную систему резервного копирования и архивирования, организация практически полностью исключает риск потери информации, а также минимизирует возможные сроки простоя ИТ-инфраструктуры. И хотя затраты на все это будут существенными, они несопоставимы с возможными потерями бизнеса от недоступности данных.

Алексей Поляков