Сервер - статьи

       

Отказоустойчивость как мера эффективности


Николай Печерица, "Экспресс электроника", #05/2005

Наряду с огромными преимуществами электронное представление информации принесло и немало потенциальных трудностей: помимо возможности получить мгновенный доступ к любым накопленным данным всегда существует вероятность столь же быстро их потерять. Впрочем, этой проблеме лет не меньше, чем самим компьютерам, а потому сегодня существует целый набор методов и средств, способных обезопасить данные самого разного объема и важности. Итак, что используют современные корпорации для защиты своих информационных систем?

Практически любое нынешнее серьезное компьютерное оборудование реализует идеи отказоустойчивости, то есть свойства сохранять работоспособность и данные при сбое питания или поломке. Так, например, современные серверы и дисковые массивы могут использовать резервные блоки питания, вентиляторы, дублирующиеся контролеры (чаще всего для внешнего - сетевого - взаимодействия), процессоры, а также технологии виртуального и реального зеркалирования памяти (оперативной и постоянной).

Тем не менее перечисленные решения обеспечивают надежность на уровне не более 99%, что соответствует времени простоя до 3,7 дней в год. И это, согласитесь, весьма неплохой показатель. Вообще же приемлемое время недоступности информационных сервисов зависит от требований бизнеса и для каждого предприятия определяется индивидуально. Оно варьируется от нескольких минут до нескольких часов, и обычно общая цифра фиксируется в соглашении об уровне сервиса (Service Level Agreement - SLA). Но для таких сфер, как банки и финансы, телекоммуникации, промышленность или научные исследования, показателя SLA на уровне 3,7 дней в год бывает недостаточно.

Именно поэтому все чаще находят применение решения, которые принято классифицировать, как катастрофоустойчивые. Они, в отличие от отказоустойчивых, сохраняют работоспособность не только в случае повреждения отдельных компонентов системы, но и при множественной поломке, а также при выходе из строя всей подсистемы (узла).

Создание катастрофоустойчивых решений базируется на тех же принципах, что и отказоустойчивых систем, только конструкторы оперируют не аппаратными компонентами и их составляющими, а вполне самостоятельными компьютерными единицами - хранилищами данных, серверами, телекоммуникационным оборудованием и т.
д. В результате решения, выполненные на основе подобных концепций, гарантируют практически любой требуемый уровень готовности информационный системы. Один из наиболее эффективных способов создания катастрофоустойчивых систем - вынесение основного хранилища данных за пределы центрального элемента вычислительной системы. Как правило, для этого применяются сети хранения данных (SAN). В них носители информации (обычно монолитные массивы дисковых носителей) объединены в собственную сеть, обособленную от ЛВС. Такие сети могут быть разнесены по площади, занимающей несколько километров, чем достигается дополнительное повышение надежности системы, связанное со снижением угроз от разрушений, землетрясений, наводнений и других стихийных бедствий. Технология SAN наиболее приемлема для создания катастрофоустойчивых систем и потому, что обладает широкими возможностями в плане масштабирования. Это объясняется реализацией SAN-решений на выделенной сети, что позволяет свободно добавлять системы хранения данных без реконфигурирования приложений, обслуживаемых ими. Однако сети хранения имеют ряд недостатков, поскольку SAN функционирует по принципу двухточечного соединения между сервером-хранилищем и дисками, при повреждении сервера сеть теряет свою целостность. Предотвратить ситуацию помогает резервирование каналов связи, обычно используемое в катастрофоустойчивых системах. Впрочем, и этого для достижения удовлетворительных показателей SLA бывает недостаточно. Ведь прокладка сетевого кабеля, наращивание и обслуживание сети хранения требует вложения дополнительных средств, а их, кстати, придется выделять на поддержание работы системы постоянно. Кроме того, отнесенное на некоторое расстояние SAN-хранилище само по себе является объектом самых разных угроз, и если происшествие все же случается, способно поставить под удар всю систему. И не случайно сегодня системы резервного копирования приобретают все большую актуальность. В общей системе хранения данных (СХД) резервное копирование представляет собой служебную подсистему и является обязательным компонентом, обеспечивающим высокую доступность.


Это позволяет восстановить работоспособность информационных сервисов даже в тех случаях, когда данные повреждены. Создание централизованной системы резервного копирования дает возможность сократить совокупную стоимость владения IT-инфраструктурой за счет оптимального использования аппаратуры и сокращения расходов на администрирование. Такая система имеет многоуровневую архитектуру, включающую:

  • сервер управления резервным копированием (одновременно он может выполнять функции сервера копирования данных);
  • один или несколько серверов копирования данных, к которым подключены устройства резервного хранения данных;
  • компьютеры-клиенты с установленными на них программными агентами резервного копирования;
  • консоль администратора системы резервного копирования. В этой схеме администратор системы ведет список клиентов резервного копирования, устройств записи и носителей данных, а также составляет расписание резервного копирования. Вся информация содержится в специальной базе, которая хранится на сервере управления резервным копированием. В соответствии с расписанием или по команде оператора сервер управления дает программному агенту, установленному на компьютере-клиенте, инструкцию приступить к копированию данных согласно выбранной политике. Агент начинает сбор данных, подлежащих резервированию, и их передачу на указанный сервером управления сервер копирования, сохраняющий в свою очередь полученные сведения на подключенное к нему устройство резервного хранения. Информация о процессе (какие файлы копировались, на какие носители и т. п.) сохраняется в базе сервера управления, чтобы можно было быстро найти данные, если возникнет необходимость их восстановления. Для того чтобы сохраненные данные не были противоречивыми, их нельзя изменять в процессе сбора и копирования. Поэтому до начала процедуры приложения компьютера-клиента должны завершить все транзакции, сохранить содержимое кэш-памяти на диске и приостановить работу. Соответствующие действия инициируются по команде программы-агента. Система резервного копирования относится к числу служебных и созданная ею нагрузка на вычислительные средства не является полезной с точки зрения предоставления информационных сервисов.


    Значит, эту нагрузку желательно снизить. Подобная задача распадается на два этапа: сокращение так называемого "окна резервного копирования" (времени, в течение которого компьютер-клиент выполняет резервное копирование) и уменьшение трафика соответствующих данных в корпоративной ЛВС. Внедрение системы резервного копирования в составе систем хранения позволяет сократить "окно" благодаря интеграции со средствами создания PIT-копий, реализованными в современных дисковых массивах: с данных практически мгновенно делается моментальный "срез", и резервное копирование выполняется уже с этого среза, а сервер продолжает работу. Снизить нагрузку на локальную сеть помогут технологии LAN-free backup и Serverless backup, предоставляемые сетями хранения данных, что является еще одним подтверждением особой эффективности этой технологии для катастрофоустойчивых систем. Если предприятие располагает резервным центром (РЦ) обработки данных или планирует его построить, то для системы резервного копирования необходимо предусмотреть интеграцию с таким центром. Переход к использованию РЦ влечет изменения политики защиты и хранения данных, условий эксплуатации и зачастую сопровождается модернизацией существующей системы резервного копирования. В частности, вычислительные средства РЦ позволят выполнять обязательное тестирование резервных копий данных на работоспособность, разгрузив вычислительные средства основного вычислительно центра и упростив всю процедуру. Можно и организовать хранение дубликатов резервных копий в РЦ, а не в стороннем удаленном хранилище.

    Содержание раздела







    Forekc.ru
    Рефераты, дипломы, курсовые, выпускные и квалификационные работы, диссертации, учебники, учебные пособия, лекции, методические пособия и рекомендации, программы и курсы обучения, публикации из профильных изданий