Размещая инфраструктуру в облаке или пользуясь облачными инструментами, важно понимать, за какие аспекты работы ответственность несёт провайдер (в нашем случае Linx), а за какие Клиент.
Данная статья призвана зафиксировать границы ответственности при использовании услуги Аварийное восстановления (DRaaS).
Границы ответственности расписаны в виде RACI матрицы. По некоторым задачам даны дополнительные пояснения.
В статье используются следующие условные обозначения:
R (Responsible) – выполняет непосредственные работы для достижения результата по задаче.
A (Accountable) – утверждает необходимость выполнения задачи и несёт итоговую ответственность за результат. На одну задачу должен быть назначен только один Accountable
C (Consulted) – консультирует и предоставляет нужную информацию, необходимую для успешного выполнения задачи
I (Informed) – должен быть проинформирован о выполнении задачи
vCAV - VMware Cloud Director Availability
ВМ - виртуальная машина
ИС - информационная система, работающая поверх ВМ
|
Задача |
Клиент |
Linx |
Комментарии |
|---|---|---|---|
|
Задачи, которые могут быть выполнены Клиентом с помощью инструмента vCAV |
|||
|
R, A, C, I |
C |
Только Клиент понимает степень критичности своих ВМ, чтобы принять решение, какие из них защищать от аварийных событий, на каких типах ресурсов их нужно будет запускать, к каким сетям подключать. |
|
|
Изменить параметры репликации ВМ или удалить задание по репликации |
R, A, C, I |
C |
В зависимости от изменения требований к инфраструктуре Клиент принимает решение об корректировке того, как с какими параметрами и куда требуется реплицировать ВМ, а также какие задания нужно удалить. |
|
R, A, C, I |
C |
После успешной постановки ВМ на репликацию и первой синхронизации данных, клиент может провести тестовое или боевое переключение |
|
|
R, A, C, I |
C |
||
|
Поддерживать в актуальном состоянии план аварийного восстановления (DRP) |
R, A, C, I |
C |
В ИС, инфраструктуре, процессах, а также в назначении ВМ Клиента периодически происходят изменения. Вместе с этими изменениям очень важно актуализировать DRP, чтобы в случае аварии минимизировать потерю данных и время простоя. |
|
Тестировать исполнения плана аварийного восстановления. |
R, A, C, I |
C |
|
|
Мониторить состояние репликации ВМ |
R, A, C, I |
C |
В консоли самообслуживания vCAV Клиент может видеть актуальный статус репликации, а также настроить почтовые оповещения о событиях и возможных ошибках. |
|
Инициировать и контролировать исполнение плана аварийного восстановления. |
R, A, C, I |
C |
Принять решение о том, что требуется переключаться на резервную площадку, а также проконтролировать, что все ИС успешно запустились, может только Клиент. |
|
Административные задачи по предоставлению и поддержанию работоспособности услуги. |
|||
|
Предоставить Клиенту доступ к vCAV |
C, I |
R, A, C |
|
|
Обеспечить работоспособность vCAV |
I |
R, A, C |
|
|
Обеспечить решение инцидентов, связанных с ошибками в работе инструмента vCAV |
C, I |
R, A |
|
|
Обеспечить работоспособность канала выхода в Интернет для трафика репликации |
I |
R, A, C |
|
|
Задачи по смежным услугам и функциональности не входящим в услугу Аварийное восстановление (DRaaS) |
|||
|
Обеспечить работоспособность канала точка-точка для трафика репликации от резервной площадки до места стыка Клиент-Linx |
C, I |
R, A |
|
|
Обеспечить работоспособность канала точка-точка для трафика репликации от места стыка Клиент-Linx до основной площадки |
R, A |
C, I |
|
|
Обеспечить работу ИС, работающих внутри ВМ |
R, A, C, I |
C |
|
|
Обеспечить работу ИС Клиента на новых публичных IP адресах после аварийного переключения |
R, A, C, I |
C |
В зависимости от того, как построена инфраструктура Клиента и работа с ИС, он может решить, как лучше действовать в случае аварии: - перенаправлять трафик и административно запросы пользователей на белые IP адреса резервной площадки (быстро) - либо обновлять DNS записи и ждать, когда они обновятся на серверах |
Опишите вашу задачу, и мы поможем вам ее решить