Матрица распределения ответственности (DRaaS): Руководство и рекомендации

База знаний

Введение

Размещая инфраструктуру в облаке или пользуясь облачными инструментами, важно понимать, за какие аспекты работы ответственность несёт провайдер (в нашем случае Linx), а за какие Клиент.

Данная статья призвана зафиксировать границы ответственности при использовании услуги Аварийное восстановления (DRaaS).

Границы ответственности расписаны в виде RACI матрицы. По некоторым задачам даны дополнительные комментарии. Там, где применимо, название задачи ссылается на статью в базе знаний с инструкцией по её выполнению.

Условные обозначения

В статье используются следующие условные обозначения:

R (Responsible) – выполняет непосредственные работы для достижения результата по задаче.

A (Accountable) – утверждает необходимость выполнения задачи и несёт итоговую ответственность за результат. На одну задачу должен быть назначен только один Accountable

C (Consulted) – консультирует и предоставляет нужную информацию, необходимую для успешного выполнения задачи

I (Informed) – должен быть проинформирован о выполнении задачи

vCAV - VMware Cloud Director Availability

ВМ - виртуальная машина

ИС - информационная система, работающая поверх ВМ

Задачи по предоставлению и поддержанию работоспособности услуги.

Задача	Клиент	Linx	Комментарии
Обеспечить работоспособность инфраструктуры на резервной площадке, необходимые для работы vCAV и ВМ во время тестовых и плановых переключений.	I	R, A	Под ифраструктурой подразумевается: Cloud Director, vCenter, vSphere, физические серверы, СХД, сеть, ЦОД.
Обеспечить работоспособность vCAV	I	R, A
Обеспечить работоспособность канала выхода в Интернет для трафика репликации.	I	R, A
Предоставить Клиенту доступ к vCAV	C, I	R, A
Обеспечить решение инцидентов, связанных с ошибками в работе инструмента vCAV	C, I	R, A

Тяните вбок для
перемещения

Задачи, которые могут быть выполнены Клиентом с помощью инструмента vCAV

Задача	Клиент	Linx	Комментарии

Поставить ВМ на репликацию	R, A	C	Только Клиент понимает степень критичности своих ВМ, чтобы принять решение, какие из них защищать от аварийных событий, на каких типах ресурсов их нужно будет запускать, к каким сетям подключать.
Мониторить состояние репликации ВМ	R, A	C	В консоли самообслуживания vCAV Клиент может видеть актуальный статус репликации, а также настроить почтовые оповещения о событиях и возможных ошибках.
Изменить параметры репликации ВМ или удалить задание по репликации	R, A	C	В зависимости от изменения требований к инфраструктуре Клиент принимает решение об корректировке того, как с какими параметрами и куда требуется реплицировать ВМ, а также какие задания нужно удалить.
Протестировать аварийное восстановление ВМ на резервную площадку	R, A	C	После успешной постановки ВМ на репликацию и первой синхронизации данных, клиент может провести тестовое или боевое переключение
Настроить план аварийного восстановления (DRP)	R, A	C
Поддерживать в актуальном состоянии план аварийного восстановления (DRP)	R, A	C	В ИС, инфраструктуре, процессах, а также в назначении ВМ Клиента периодически происходят изменения. Вместе с этими изменениям очень важно актуализировать DRP, чтобы в случае аварии минимизировать потерю данных и время простоя.
Тестировать исполнение плана аварийного восстановления.	R, A	C
Инициировать и контролировать исполнение плана аварийного восстановления.	R, A	C	Принять решение о том, что требуется переключаться на резервную площадку, а также проконтролировать, что все ИС успешно запустились, может только Клиент.

Тяните вбок для
перемещения

Задачи по смежным услугам и функциональности не входящим в услугу Аварийное восстановление (DRaaS)

Задача	Клиент	Linx	Комментарии
Обеспечить работоспособность канала точка-точка для трафика репликации от резервной площадки до места стыка Клиент-Linx	C, I	R, A
Обеспечить работоспособность канала точка-точка для трафика репликации от места стыка Клиент-Linx до основной площадки Клиента	R, A	C
Обеспечить работу ИС, работающих внутри ВМ	R, A	C
Обеспечить работу ИС Клиента на новых публичных IP адресах после аварийного переключения	R, A	C	В зависимости от того, как построена инфраструктура Клиента и работа с ИС, он может решить, как лучше действовать в случае аварии: - перенаправлять трафик и административно запросы пользователей на белые IP адреса резервной площадки (быстро) - либо обновлять DNS записи и ждать, когда они обновятся на серверах

Тяните вбок для
перемещения