Заготовка под хабр
Aug. 10th, 2017 09:02 pmВ поисках идеального бекапа.
Третьего дня Gartner нарисовал очередной квадрат - Magic Quadrant for Data Center Backup and Recovery Software 2017.
https://go.veeam.com/2017-gartner-magic-quadrant-ru
Скачать весь отчет можно с veeam - https://go.veeam.com/2017-gartner-magic-quadrant-ru
Прочитать что и как в этом квадрате можно тут http://www.vmgu.ru/news/gartner-magic-quadrant-for-backup-software-veeam-leadership
Вдоволь потыкав в кнопки разных бекапов, мне вдруг захотелось чего то идеального, чтоб просто работало, и делало то, что мне нужно. Но не так, как хотелось собрать недавно тов. amarao-san, чтобы оно само себя на себя же и бекапило, у меня нет таких задач, а совсем иначе.
Нужно же оказалось следующее –
Tl/dr – унылая спискота про бекапы, читать не надо.
Чего же мне хотелось от ПО для бекапа.
А) Среда виртуализации
1. Полноценная работа с современными средами виртуализации – Vmware, Hyper-V. Полноценная – это то, что называется hotadd, network copy и так далее.
1.1 Опционально – работа с такими средами виртуализации, как KVM и Nutanix Acropolis
2. Безагентский разбор NTFS/ReFS из бекапа/снапшота, и такое же восстановление.
2.1 Ext2/3/Zfs прочая – опционально
3. Безагентский бекап, разбор и восстановление AD с уровнем гранулярности «до свойств объекта». С удобным сравнением «что сейчас и что было».
4. Безагентский бекап, разбор и восстановление Exchange 2010/2013/2016.
5. Безагентский бекап, разбор и восстановление MS SQL.
6. Для пунктов 3,4,5 – контроль цеслостности, в смыслы application aware – чтобы логи образались, в AD ставился штамп «забекаплено», и так далее.
7. Что касается «других SQL» - то тут возникает вопрос с VSS. В MS оно есть, и можно скомандовать всем сразу – ХАЛЬТ! ИХ ВЕРДЕ ШИССЕН! – и приложение сразу ЯВОЛЬ! В опенсорсе этого нет, так что остается только забрать заранее подготовленные файлы. В оракле есть этот, как его ..
Б) Работа с физической средой и СХД
1. Работа с данными с физического сервера по FC – то , что называется кое-где SAN TRANSPORT
2. Работа с хранилищем, используя все, что умеют современные среды виртуализации и хранилища – это всякие там vaai, vvol, vadp, снапшоты lun, и иные array agent backup
3. Вообще современные СХД умеют не только SAN/NAS(SMB), а еще и всякое NFS / iSCSI и не только. Конечно, хотелось бы получать такие презентованные (некому виртуальному серверу или физическому хосту) данные прямо с СХД, без участия системы вирутализации.
4. То же самое касается и презентованных RDM дисков (которые по факту на СХД. Обоих двух - Physical compatibility RDMs and Virtual compatibility RDMs) . Чтобы ПО могло их забрать с СХД по FC или выделенной сети СХД, а не тащила с самого сервера.
5. Мониторинг и управление уровнем нагрузки на СХД. Вплоть до мониторинга Latency источника и приемника данных, а не только числа одновременно запускаемых задач.
В) Разделение нагрузок и сервера управления
Проще говоря, возможность разделять задачи бекапа (хранения) от например дедупликации и записи на кассеты. То, что называется media server.
Г) Работа с кассетами.
1. Прямое копирование сразу на кассеты
2. Возможность выбора, на какой привод будем писать, и создание групп приводов.
3. Внятная настройка lifecycle policy для кассет.
Д) Работа с физическим сервером и кластерами
Что касается физических и виртуализированных серверов, то тут в первую очередь нужна гибкость работы. В частности - возможность иметь несколько расписаний – как для всего диска, так и для отдельных каталогов на нем, и все это одновременно.
Например, раз в неделю забирать весь диск, для 2-3 каталогов собирать все каждые 3 часа, а для остальных – два раза в день. Причем желательно делать это штатно, а без упаковки с бубнами, где powershell чередуется с командной строкой, и все это висит в Task scheduler
Е) Прочее
1. Вменяемая дедупликация. Конечно, в 2012R2 / 2016 есть и встроенная дедупликация – но для NTFS. Для новой стильной и молодежной ReFS – увы, но пока нет.
1.1 Собственным сжатием сейчас вообще никого не удивить.
2. Работа по тонкому WAN – в стиле Riverbed Steelhead, но подешевле и вообще искаропки
Раз
https://habrahabr.ru/company/croc/blog/267883/
два
http://habrahabr.net/thread/13803
3. Управляемость и широкое логирование, если что-то пошло не так
4. Автоматические проверки как забекапилось
5. Возможность сделать скрипт на десяток строк на чем угодно (но лучше powershell/bash), который возьмет свежий архив, вытащит оттуда специально положенный тестовый файл, и сравнит с эталонным.
6. Расширенная работа с репозиториями. Чтобы можно было собрать группу из дисков и работать с ней как с группой.
7. Разбиение файлов на блоки по N. Чтобы не было сборок по 2-3-5 Тб одним файлом.
Причем с индексацией блоков, чтобы для вытаскивания отчета на 300 кб не пришлось поднимать с кассет пару терабайт. Особенно актуально в связке с пп. Д.
Ж) Документация и саппорт
1. Внятная и актуальная (!!!) информация по тому, что и как. По текущей и (-1) версии пролукта, а не только по (-2) в лучшем случае.
И что было, и что стало.
2. Открытый и индексируемый форум.
3. Служба поддержки с качественными кадрами, которые и в инструкцию ткнут, и вопрос смогут прочитать.