Краткое введение в отказоустойчивость

Last Updated: 2021-10-26
4.6
(23)
Краткое содержание: Отказоустойчивость означает способность системы продолжать работать без перебоев, даже если один или несколько ее компонентов выйдут из строя. В этой статье мы более подробно расскажем об отказоустойчивости.

Определение отказоустойчивости

Отказоустойчивость относится к свойству, которое позволяет системе продолжать правильно работать даже при выходе из строя некоторых ее компонентов. Другими словами, отказоустойчивость означает, как операционная система (ОС) реагирует и допускает сбои и отказы оборудования или программного обеспечения.

Способность ОС восстанавливать и допускать сбои может быть реализована с помощью программного обеспечения, оборудования или комбинированного решения, в котором используются балансировщики нагрузки. Некоторые компьютерные системы используют несколько дублирующих систем отказоустойчивости для корректной обработки отказов, что называется отказоустойчивой сетью.

Отказоустойчивые вычисления включают несколько уровней устойчивости:

  • Tон самый низкий уровеньВозможность реагировать на сбой питания.
  • Шаг вверхили усиление уровняВозможность немедленно использовать систему резервного копирования в случае отказа системы.
  • Повышенный уровень:Когда диск выходит из строя, зеркальные диски немедленно заменяют его. Этот уровень предлагает функциональность, несмотря на частичные сбои системы или ожидаемую деградацию, а не немедленную поломку и потерю функциональности.
  • Высокий уровеньНесколько процессоров совместно проверяют данные и вывод для обнаружения ошибок, а затем немедленно их исправляют.

В отказоустойчивых системах используются резервные компоненты, которые автоматически заменяют вышедшие из строя компоненты, чтобы гарантировать отсутствие перебоев в работе.

  • Аппаратные системы имеют такую же или эквивалентную операционную систему резервного копирования. Отказоустойчиво, что сервер с таким же отказоустойчивым сервером отражает все операции в резервной копии и работает параллельно. Устраняя единую точку отказа, отказоустойчивость оборудования в избыточной форме может сделать любой компонент или систему более безопасными и надежными.
  • Программные системы, поддерживаемые другими экземплярами программного обеспечения. Например, если пользователи непрерывно реплицируют базу данных клиентов, и если первая база данных закрывается, операции в первичной базе данных могут быть автоматически перенаправлены на вторую.
  • Если альтернативные источники могут автоматически переходить на смену во время сбоев питания, резервное питание может помочь избежать сбоев системы и гарантировать, что услуги не будут потеряны.

ВинаTтерпимостьTметоды

  1. РепликацияОн предоставляет несколько идентичных экземпляров одной и той же системы или подсистемы, направляет задачи или запросы ко всем экземплярам параллельно и выбирает правильные результаты на основе арбитража.
  2. Безотказные вычисленияЭто позволяет компьютерным программам продолжать выполнение, несмотря на ошибки, которые могут применяться в различных контекстах.
  3. Восстановление пастырстваЭто легкий метод, который позволяет программам восстанавливаться после фатальных ошибок.
  4. Автоматический выключатель:Этот шаблон проектирования - метод предотвращения катастрофических отказов в распределенных системах.

ТребованияОтказоустойчивости

Ниже приведены основные требования к характеристикам отказоустойчивости:

  1. Нет единой точки отказаЕсли система выйдет из строя, она должна продолжать работать без перебоев во время ремонта.
  2. Изоляция неисправности отказавшего компонентаs:В случае отказа система должна быть способна изолировать неисправность соответствующего компонента. Это требует добавления специальных механизмов обнаружения сбоев, которые существуют только для локализации сбоев. Восстановление после состояния отказа требует классификации отказов или неисправных компонентов.
  3. Локализация неисправностей для предотвращенияРаспространениенеудачиНекоторые механизмы отказов могут вызвать отказы системы из-за распространения отказов на остальную систему. «Незаконный передатчик» является примером такого отказа, который приводит к законному обмену данными в системе и вызывает полный отказ системы. Злонамеренный передатчик или отказавший компонент необходимо изолировать, чтобы защитить брандмауэр системы или другие механизмы.
  4. Наличие режимов реверсии.

DisadvantagesОтказоустойчивости

  • Расходы.
  • Низкие компоненты.
  • Помехи при обнаружении неисправности в другом компоненте.
  • Помехи при обнаружении неисправности одного и того же компонента.
  • Снижение приоритета устранения неисправностей.
  • Сложность теста.

ПримерыОтказоустойчивости

Иногда отказоустойчивость оборудования требует, чтобы поврежденные части были удалены и заменены новыми частями, пока система все еще работает. Такие системы, реализованные с использованием единой резервной копии, называются одноточечной устойчивостью и представляют подавляющее большинство отказоустойчивых систем.

Отказоустойчивость успешна в компьютерных приложениях. Tandem Computers строят весь свой бизнес на таких компьютерах, которые используют допуск одной точки для создания своих непрерывных систем, которые собираются годами.

Отказоустойчивая архитектура может также включать компьютерное программное обеспечение, такое как репликация через процессы.

Форматы данных также могут быть спроектированы для естественного ухудшения. Например, HTML разработан для обеспечения прямой совместимости, что позволяет веб-браузерам, которые их не понимают, не делая документ непригодным для использования, игнорировать новые объекты HTML.

Насколько полезен был этот пост?

Нажмите на звездочку, чтобы оценить!

Средний рейтинг 4.6 / 5. Подсчет голосов: 23

Голосов пока нет! Будьте первым, кто оценит этот пост.

Предыдущая статья

Что нового в Bitwar HEIC Converter for Mac V2.0.0 Резюме: Отказоустойчивость означает способность системы продолжать работать без перебоев, даже если один или несколько из ...

Следующая статья

Quick Fix: The Volume Does Not Contain A Recognized File System Error Резюме: Отказоустойчивость означает способность системы продолжать работать без перебоев, даже если один или несколько из ...

О восстановлении данных Bitwar

3 шага по восстановлению более 500 видов удаленных, отформатированных или утерянных документов, фотографий, видео, аудио, архивных файлов после различных сценариев потери данных.

Узнать больше

Горячие статьи

    Похожие статьи