11 дек. 2025 г.·8 мин

Оценка эффективности компрессии и снапшотов FlashArray//X

Оценка эффективности компрессии и снапшотов FlashArray//X: методика теста на датасете, замеры, учет накладных расходов и красные флаги в расчетах поставщика.

Что считать «эффективностью» в компрессии и снапшотах

Когда говорят про «эффективность» FlashArray//X, часто показывают один красивый коэффициент. На практике важнее понять, что именно он должен доказать: экономию емкости прямо сейчас, прогноз роста на 3-5 лет или итоговую стоимость владения с учетом расширений.

Один и тот же коэффициент может означать разные вещи, если не зафиксированы условия. «5:1» легко получить на архивных файлах, но почти не увидеть на уже сжатых данных (медиа, бэкапы, шифрованные контейнеры). Снапшоты зависят не от размера тома, а от того, сколько данных меняется со временем (churn) и как долго вы храните точки восстановления.

Синтетические тесты опасны тем, что редко повторяют вашу структуру данных: реальные базы, профили пользователей, почтовые хранилища, виртуальные диски, логи. Синтетика дает «красивые» числа, но не показывает рост емкости снапшотов при ежедневных изменениях, пересборке индексов или массовых обновлениях.

Перед закупкой полезно заранее договориться, на какие вопросы должен ответить тест:

сколько физической емкости нужно на старт и через 12, 36 и 60 месяцев;
как меняется производительность при включенной компрессии и активных снапшотах;
какие целевые RPO/RTO вы подтверждаете (частота снапшотов, глубина хранения, время восстановления);
какой риск «неожиданного» роста из-за churn, клонов, тестовых сред и нерегулярных массовых операций.

Если цели зафиксированы, тестовые цифры перестают быть рекламой и становятся основой модели емкости и понятного плана расширения.

Термины и единицы измерения, чтобы не спорить о словах

В споре про «эффективность» чаще всего расходятся не цифры, а определения. Перед тестом договоритесь о терминах и о том, какие счетчики вы снимаете.

Логическая емкость (logical, host) - это то, что «видит» хост: размер LUN/тома и объем записанных данных по мнению ОС. Физическая емкость (physical, array) - сколько реально занято флешем на массиве с учетом всех технологий экономии и служебных накладных расходов. В отчетах держите рядом обе цифры и всегда указывайте момент времени.

Экономия на массиве обычно складывается из нескольких эффектов, и их нельзя смешивать в одну «магическую компрессию»:

Thin provisioning: том может быть выдан на 10 ТБ, но пока записали 2 ТБ, физически занято близко к 2 ТБ.
Дедупликация: одинаковые блоки хранятся один раз (особенно заметно при VDI, клонах, одинаковых ОС).
Компрессия: сжимает содержимое блоков; эффект зависит от типа данных (тексты, БД, логи часто сжимаются лучше, чем медиа, бэкапы и шифрованные данные).
Zero elimination: нулевые блоки почти не занимают место, поэтому тесты с «пустыми» файлами часто дают нереальные коэффициенты.

Со снапшотами важно помнить: снапшот не дублирует весь том. Он хранит только отличия (changed blocks) относительно базовой точки. Поэтому рост емкости определяют churn и срок хранения цепочки. Если запись идет в те же области тома, старые версии блоков начинают накапливаться, и снапшоты быстро «толстеют».

Наконец, есть накладные расходы: метаданные, служебные области, резерв под сборку мусора (GC) и внутренние перестройки. На маленьком тесте они могут быть незаметны, а при высокой заполненности становятся критичными. В методике заранее зафиксируйте, что вы считаете «полезной» емкостью, а что - полной физической занятостью массива.

Как собрать тестовый датасет, похожий на прод

Точность оценки зависит не от «красивых» процентов, а от того, насколько тестовые данные повторяют прод по структуре и по тому, как они меняются. Если в тесте один тип файлов или один сценарий записи, результат почти наверняка будет завышен или занижен.

Начните с карты прод-данных: какие системы дают основной объем, какие дают основной churn, какие требования к хранению снапшотов. Затем снимите простые характеристики: распределение размеров файлов (много мелких или мало крупных), доля однотипных копий, частота перезаписи блоков (особенно у логов и баз).

Практичный набор «корзин», из которых обычно получается реалистичный микс:

офисные файлы и общие папки;
базы данных и их бэкапы;
VDI или образы виртуальных машин;
изображения и медиа;
логи и телеметрия.

Данные лучше разделить по «сжимаемости». Минимум три подвыборки: хорошо сжимаемые (текст, CSV, «сырой» дамп), плохо сжимаемые (частично сжатые форматы) и почти несжимаемые (архивы, JPEG/MP4, зашифрованные файлы). Так вы увидите, где массив дает выигрыш, а где нет, и не смешаете результаты.

Правило минимальной статистики простое: не тестируйте «один том и один день». Нужны несколько томов или датасторов и несколько циклов изменений, чтобы увидеть поведение снапшотов.

Например, для отдела из 300 пользователей можно взять 2-3 ТБ файловых данных, 1 ТБ VDI-образов и 1 ТБ данных базы, а затем 3-5 дней имитировать типичные изменения: ежедневные обновления образов, рост логов, ночной бэкап и удаление старых снапшотов по политике хранения.

Требования к объему и структуре теста, чтобы цифры не «плавали»

Частая ошибка в тестах FlashArray//X - слишком маленький или «стерильный» набор данных. Тогда коэффициенты дедупликации и компрессии выглядят то «волшебно», то наоборот хуже реальности. Чтобы результат был устойчивым, тест должен быть достаточно большим и похожим на ваш прод.

Объем: сколько данных нужно

Цель простая: в СХД должны «закрепиться» закономерности, а не случайности. Для большинства задач стоит целиться в десятки ТБ логических данных, а не в 1-2 ТБ. Минимум имеет смысл брать такой, чтобы было заметно и повторение (одинаковые ОС, VDI, типовые базы), и «уникальность» (логи, архивы, медиа), а тест пережил несколько циклов изменений и удаления данных.

Если у вас прод 200 ТБ, тест в 5 ТБ почти всегда дает шумные цифры. Чаще лучше 20-40 ТБ логики, даже если физически после экономии это будет меньше.

Структура и churn: что должно быть внутри

Набор данных должен смешивать разные типы блоков: много мелких файлов, несколько больших образов, базы, логи. Не «готовьте» данные так, чтобы они идеально сжимались (например, не заполняйте нулями и не архивируйте заранее).

Вторая ось - churn, доля ежедневных изменений. Запланируйте реалистичную текучку: условно 2-5% в день для файловых и почтовых нагрузок или 10-20% в день для VDI и активных логов. Именно churn обычно определяет, сколько места начнут «есть» снапшоты при хранении 7, 14 или 30 дней.

Для повторяемости зафиксируйте контрольные точки: контрольные суммы (хеши) исходных файлов или хотя бы ключевых наборов (образы, дампы БД) до старта и после серии снапшотов. Это помогает ловить ситуации, когда тестовые данные незаметно меняются, а вы сравниваете разные наборы.

Пошаговая методика теста на FlashArray//X (без «магии»)

Чтобы оценка была честной, заранее договоритесь: какие метрики смотрим (физическое занятое, логическое, Data Reduction, прирост от снапшотов), на каком интервале и при какой нагрузке. Дальше запускайте один и тот же сценарий на каждом прогоне.

Шаги теста

Зафиксируйте стартовую точку. Массив должен быть «чистым»: без старых томов, снапшотов и мусорных данных. Запишите версию Purity, параметры томов (размер, thin/thick), политики компрессии/дедупликации и уже занятые служебные резервы.
Запишите датасет и снимите первые цифры. Залейте данные одним непрерывным прогоном. Зафиксируйте логически записанное, физически занятое и скорость записи. Обязательно отметьте время: часть оптимизаций происходит не мгновенно.
«Прогрейте» типовой работой и повторите замеры. Выполните операции, похожие на прод: повторные чтения, перезапись части блоков, создание/удаление небольших объектов. Снимайте показатели в одинаковых окнах (например, через те же 2-4 часа после записи).
Добавьте churn и расписание снапшотов. Запустите сценарий изменений (например, 5-15% в сутки) и делайте снапшоты с частотой, близкой к реальной (каждые 15 минут, час, день). Отдельно фиксируйте рост емкости, занятой снапшотами, и то, как меняется скорость роста при активной перезаписи.
Сведите итоги в одинаковых точках времени. Сравнивайте не «лучший момент», а одинаковые этапы: сразу после записи, после прогрева, после N часов churn и N снапшотов. В отчете держите рядом емкость и производительность, чтобы высокая компрессия не скрывала просадки по задержкам.

Главное правило: любые «красивые» цифры засчитываются только если они получены на одном и том же датасете, с одинаковым расписанием снапшотов и одинаковым временем ожидания фоновой оптимизации.

Как измерять компрессию и дедупликацию: метрики и время замера

Подберем СХД и серверы

Подберем серверы и СХД под тест и дальнейшее внедрение в вашей организации.

Подобрать решение

Договоритесь о метриках заранее и снимайте их в один и тот же момент времени для одного и того же набора томов, иначе цифры будут «скакать».

Минимальный набор до и после заливки:

логически записано (logical used);
физически занято (physical used);
Data Reduction (общий коэффициент экономии);
отдельно Dedupe Ratio и Compression Ratio (если доступны);
состояние «после оптимизации» vs «в процессе», если система еще перерабатывает данные.

Чтобы отделить дедупликацию от компрессии без догадок, сделайте два прогона на сопоставимом объеме. В первом используйте максимально уникальные данные (где повторяющихся блоков почти нет): вклад дедупликации будет минимальным, и вы увидите почти чистую компрессию. Во втором добавьте намеренно повторяющиеся данные (например, 10-20 копий одного шаблона VM или одинаковые библиотеки) и сравните, как изменился именно Dedupe Ratio.

Сравнивайте по типам данных. Текстовые логи и офисные документы часто дают заметную компрессию, а JPEG/MP4/ZIP почти не сжимаются. Для баз данных картина зависит от схемы, паттерна записи и того, включено ли сжатие на уровне приложения.

Время замера критично. Не опирайтесь на цифры сразу после заливки: фоновые процессы оптимизации могут догонять нагрузку. Снимайте показатели сразу, затем повторите через 24 часа и еще раз через 72 часа при стабильной нагрузке. Если коэффициент резко «улучшается» только ночью или «проваливается» после рабочего дня, это сигнал: в модели емкости нужно учитывать реальный режим записи, а не лабораторный снимок.

Как проверить снапшоты: рост емкости, churn и сроки хранения

Снапшоты обычно занимают место не «полным объемом тома», а только за счет изменений после точки снимка. Поэтому проверка сводится к одному вопросу: сколько физической емкости добавляет ваш churn при выбранной частоте и сроках хранения.

Практическая методика: измеряем «стоимость 1% изменений»

Возьмите 1-2 тома с типичной структурой данных и заполните их до стабильного уровня (например, 60-80%). Дальше работайте измерениями «до/после», фиксируя физическое потребление.

Сделайте базовый снапшот (S0) и зафиксируйте физическую занятость массива.
Сымитируйте churn: измените ровно X% данных на томе. Важно именно переписывать существующие блоки, а не только дописывать в конец.
Сделайте снапшот (S1) и снова зафиксируйте физическую занятость.
Повторите цикл 5-10 раз и посчитайте среднюю «цену 1% churn» в ГБ.
Запустите два профиля хранения: «часто и коротко» (например, каждый час на 48 часов) и «реже, но долго» (например, раз в день на 30 дней), затем сравните наклон роста.

Если при 1% churn физический рост то появляется, то пропадает без понятной причины, тест слишком короткий или данные слишком «игрушечные».

Клоны и тестовые среды: параллельные копии

Проверьте, что будет, если команда берет снапшот и поднимает из него 3-5 клонов для теста. На старте клоны должны стоить почти ничего, но дальше их «разводит» churn каждой среды. Простой сценарий: один клон почти не меняется, второй активно обновляет данные, третий компилирует и собирает артефакты. Через сутки сравните физический рост каждого.

Удаление и возврат места

Отдельно замерьте, когда освобождается емкость после удаления снапшотов и клонов. Возврат может быть не мгновенным из-за фоновых процессов. В расчетах это лучше учитывать как задержку, а не как «место вернется сразу».

Красные флаги в чужих расчетах: «снапшоты бесплатные», рост считается от логического объема, churn берется «по умолчанию 1%», клоны приравниваются к снапшотам без учета их собственной активности, а также обещается мгновенный возврат места без оговорок.

Как свести результаты в модель емкости и не потерять накладные расходы

Поддержка инфраструктуры 24/7

Дадим сопровождение 24/7 и сервис по Казахстану после внедрения и запуска.

Подключить поддержку

Чтобы результаты теста превратить в понятную модель емкости, держите рядом три уровня:

Raw - физическая емкость накопителей.
Usable - то, что остается после защиты данных и служебных резервов.
Effective - сколько логических данных вы реально сможете разместить с учетом дедупликации, компрессии и снапшотов.

Удобнее собирать таблицу по группам томов и не смешивать разные нагрузки. Для VDI, баз данных и файловых данных коэффициенты могут отличаться в разы. Если усреднить все в одну цифру, модель будет выглядеть красиво, но в эксплуатации начнет расходиться.

Простая схема расчета (что добавить к цифрам теста)

Возьмите measured reduction из теста (дедупликация + компрессия) и применяйте его только к тем томам, где вы реально видели такой профиль данных. Дальше добавьте то, что часто забывают:

защита данных (RAID/erasure) и запас под rebuild;
служебные резервы массива (свободное место под стабильную работу, метаданные, внутренние операции);
снапшоты и клоны (учитывайте churn и срок хранения, а не «размер снапшота»);
буфер под сезонность и «плохие недели»;
тонкое выделение (не путайте thin provisioning с компрессией).

Практичная формула в логике такая: сначала считаете usable из raw минус защита и резервы, затем оцениваете effective как (usable * коэффициент данных) минус ожидаемый churn снапшотов за срок хранения.

Сверка по независимым источникам

Не опирайтесь на один экран в консоли. Сверьте показания массива (физическое, логическое, отдельно по снапшотам) с тем, что видит гипервизор или ОС (занято в гостевых ФС, прирост данных в сутки). Если эффект высокий «на массиве», а на уровне хостов картина другая, значит смешались метрики или период замера.

Принцип простой: любая «эффективность» должна быть привязана к конкретному набору томов, периоду и политике снапшотов. Тогда модель емкости будет устойчивой, а не презентационной.

Красные флаги в расчетах поставщика: на что смотреть в презентации

Самая частая ошибка в презентациях - красивые коэффициенты без привязки к вашим данным и режиму работы. Если цифра выглядит слишком ровной, спросите: на каком датасете ее получили, сколько было перезаписи (churn) и как долго наблюдали.

Что должно насторожить сразу

Обещание фиксированного коэффициента («всегда 4:1») без профиля данных - риск. Один и тот же массив даст разные результаты на VDI, файловых шарах и базах с шифрованием.

Еще один флаг - когда «effective» собирают из лучших значений, но для разных условий одновременно. Например, дедупликацию берут с теста на однотипных VM, компрессию - с другого теста на архивных данных, а снапшоты - с короткого окна. В реальной эксплуатации такая цифра обычно не встречается.

Снапшоты: где чаще всего «рисуют» экономию

Фраза «снапшоты почти бесплатны» верна только при малых изменениях и коротком хранении. Проверьте, есть ли у расчета явная модель: сколько данных меняется в день, как часто снимаются снапшоты, сколько дней они живут, есть ли клонирование для тестов.

Полезный вопрос: «Что будет с емкостью, если ежедневно меняется 5% данных и снапшоты хранятся 30 дней?» Если ответа нет, расчет не готов к продакшену.

Игнорирование накладных расходов

Часто не учитывают резервы под эксплуатацию: свободное место для стабильной работы, рост метаданных, запас под ребилды и пиковую запись. Также редко проговаривают, что коэффициенты могут падать со временем, когда данные становятся менее похожими, а churn растет.

Отдельный флаг - сравнение с другим решением в разных условиях (разный профиль записи, разные политики компрессии, разные параметры теста). Если условия не выровнены, сравнение превращается в маркетинг.

Если хотите быстро отсеять «рисованные» цифры, попросите одну таблицу: входные допущения (тип данных, churn, retention снапшотов, окно наблюдения) и исходные метрики, а не только итоговый «effective».

Чеклист перед тем, как верить цифрам

Перед тем как принимать «коэффициент экономии» от поставщика, попросите повторяемый протокол. Если нет описанного датасета и шагов теста, цифры почти всегда будут красивыми, но плохо переносимыми на ваш прод.

Описание теста должно быть воспроизводимым: объем, типы данных (VM-диски, базы, файловые данные), churn и длительность. Пример формулировки, которой обычно достаточно: «10 ТБ виртуальных дисков, 2 ТБ SQL, churn 5% в день, 14 дней, ежедневные снапшоты, 7 точек хранения».

Проверьте, что зафиксированы емкости, влияющие на закупку: raw и usable, а также физическое потребление (physical) и логическая емкость (logical). Отдельно уточните, что именно включено в «защиту данных» и «накладные расходы»: RAID/erasure, spare, метаданные, snapshots, репликация (если есть).

Дальше разделяйте эффекты. Просите отдельные цифры по компрессии/дедупликации для активных томов и отдельно по снапшотам и клонам. Общий «5:1» без разложения легко скрывает то, что снапшоты «съели» половину экономии.

Проверьте горизонт. Измерение через сутки часто завышает эффект. Нормально, если результаты подтверждены минимум 1-2 неделями, либо эквивалентным прогоном с тем же churn и расписанием снапшотов.

И самое важное - допущения. В расчете должны быть явно прописаны рост данных, retention снапшотов, количество сред (prod, test, dev), что именно клонируется и как часто. Если допущения не названы, модель емкости нельзя проверить, а значит ей нельзя доверять.

Пример сценария теста: смешанная нагрузка и понятный вывод

Отчет с исходными метриками

Соберем выгрузки по датам, настройкам и нагрузке, чтобы результат можно было повторить.

Получить отчет

Хороший тест должен быть похож на «обычный день» в вашей инфраструктуре, а не на лабораторный идеал. Ниже пример сценария, где есть и повторяемость (полезна для дедупликации), и «живые» изменения (важны для снапшотов).

Представьте три пула данных на отдельных томах: виртуализация (VM), файловые шары и база данных. Объем исходной записи на хостах: 30 ТБ VM (много одинаковых ОС), 20 ТБ файлов (смесь документов, архивов и медиа), 10 ТБ база (таблицы, индексы, журналы). Тип данных лучше зафиксировать заранее: если значительная часть файлов уже сжата (ZIP, видео), «чуда» по компрессии не будет.

Чтобы задать реалистичный churn, добавьте «события дня»:

VM: еженедельные патчи ОС плюс ежедневные обновления приложений (1-3% изменений в день).
Файлы: ежедневные отчеты и обмен документами плюс раз в неделю крупная выгрузка (0,5-2% в день, пики до 5%).
База: ежедневные загрузки и перестроение индексов (2-8% в день, зависит от вашей модели).

Снапшоты задайте так, как планируете в проде: например, каждый час на VM и базу, раз в день на файловые шары; хранение 24 часа для часовых и 14 дней для суточных. Тест должен идти минимум 5-7 дней, иначе вы не увидите накопление и «разгон» емкости.

Как читать результат: отдельно смотрите data reduction и рост потребления из-за снапшотов. Если общий коэффициент высокий, но емкость «ползет» быстрее ожидаемого, это часто означает высокий churn или тяжелые индексы/журналы. Хороший признак - после 2-3 дней график роста стабилизируется и прогноз на 2 недели не выводит систему в опасную зону заполнения.

Что попросить у поставщика по итогу: пересчитать модель емкости по вашим фактическим метрикам (отдельно VM, файлы, база), с вашим расписанием снапшотов и реальными процентами churn, и показать два сценария - «обычный» и «пиковый» (патчинг, закрытие периода, массовая выгрузка).

Следующие шаги: как организовать PoC и закрепить результаты

PoC имеет смысл только тогда, когда входные условия похожи на прод. Начните с фиксации двух вещей: состава данных (какие типы файлов, какие БД, какой процент уже сжатых форматов) и расписания снапшотов (частота, retention, сколько клонов, сколько тестовых восстановлений). Это и будет ваш «контракт реальности».

Перед стартом согласуйте, что именно станет результатом PoC, а не красивым слайдом. Удобно заранее утвердить структуру отчета и формат исходных замеров.

Минимальный пакет договоренностей для PoC

Зафиксируйте на 1 странице:

входные параметры: размер и структура тестового датасета, профиль изменений (churn), расписание снапшотов и срок хранения;
методика: когда делаются замеры (после прогрева, после ночи снапшотов, после серии восстановлений);
метрики: физическая и логическая емкость, коэффициенты дедупликации и компрессии, рост емкости от снапшотов;
границы применимости: какие типы данных не включены и почему;
критерии приемки: какие цифры подтверждают расчет, а какие требуют пересчета.

Если у вас VDI и файловые шары, добавьте в тест неделю «жизни» пользователей и 2-3 контрольных восстановления. Тогда цифры по снапшотам будут ближе к реальности, чем при статичном копировании.

Как закрепить результаты и не потерять их через месяц

В итоговом документе приложите сырые данные: выгрузки метрик по датам, список допущений, версию ПО и настройки. Запланируйте повторный прогон, если меняется профиль данных (например, растет доля already-compressed файлов) или retention.

Если нужна нейтральная проверка и интеграция в ваш контур, заранее разделите роли: заказчик формулирует входные условия и критерии приемки, поставщик обеспечивает стенд и доступ к метрикам, интегратор (например, GSE.kz) отвечает за методику, сбор замеров и итоговую модель емкости. Контакты и профиль услуг GSE.kz можно посмотреть на gse.kz.

FAQ

Что вообще считать «эффективностью» в компрессии и снапшотах?

Считайте эффективностью не один «красивый» коэффициент, а ответ на конкретный вопрос: сколько физической емкости нужно на старт и как она изменится через 12, 36 и 60 месяцев при ваших политиках снапшотов и реальном churn. Один и тот же показатель может означать разную экономию, если не фиксировать тип данных, период наблюдения и режим записи.

Почему нельзя просто поверить обещанию вроде «всегда 4:1»?

Потому что без условий коэффициент ничего не доказывает. На архивных и повторяющихся данных легко получить высокие цифры, а на уже сжатых, медиа или зашифрованных контейнерах компрессия почти не даст эффекта, и итоговая «эффективность» станет другой. Всегда привязывайте число к датасету, churn и сроку хранения снапшотов.

В чем разница между logical и physical емкостью и почему это важно?

Логическая емкость — то, что «видит» хост (размер тома и записанные данные по мнению ОС). Физическая — сколько реально занято на массиве с учетом дедупликации, компрессии, thin provisioning, снапшотов и служебных накладных расходов. В отчетах держите рядом обе цифры и обязательно указывайте момент времени, иначе сравнение будет нечестным.

Как понять, что тестовые цифры не завышены из-за нулей и thin provisioning?

Zero elimination и thin provisioning могут сделать тест «волшебным», если вы заполняете том нулями или создаете большие, но почти пустые файлы. В таких случаях логическая запись растет, а физическое потребление почти нет, и коэффициент выглядит нереально высоким. Для честного теста записывайте «живые» данные и переписывайте существующие блоки, а не только дописывайте в конец.

Почему снапшоты растут не от размера тома, а от churn?

Снапшот не копирует весь том, он хранит изменившиеся блоки относительно базовой точки. Поэтому место растет от churn и от того, как долго вы храните цепочку точек восстановления, а не от «размера LUN». Если данные часто переписываются в одних и тех же областях, старые версии блоков быстро накапливаются, и снапшоты начинают «толстеть».

Как собрать тестовый датасет, чтобы он был похож на прод?

Соберите микс, похожий на прод: виртуальные диски/образы, файловые данные, БД и логи, плюс часть плохо сжимаемых данных (ZIP, JPEG/MP4, шифрованные файлы). Разделите наборы по «сжимаемости», чтобы видеть, где есть выигрыш, а где его почти нет. Тест «один том и один день» обычно дает шумные результаты, поэтому планируйте несколько циклов изменений.

Какой минимальный объем теста имеет смысл, чтобы цифры были устойчивыми?

Ориентируйтесь на десятки ТБ логических данных, если прод измеряется сотнями ТБ, иначе показатели будут «плавать» из-за случайностей. Важно, чтобы в данных были и повторяющиеся блоки (для дедупликации), и уникальные (логи, медиа), и чтобы тест пережил несколько циклов записи/перезаписи и удаления снапшотов. Малая и «стерильная» заливка часто показывает цифры, которые в эксплуатации не повторяются.

Когда и какие метрики нужно измерять, чтобы сравнение было честным?

Снимайте показатели в одинаковых точках: сразу после записи, после «прогрева» типовой работой и после заданного числа часов/дней churn со снапшотами. Фиксируйте logical used, physical used, общий Data Reduction, а также отдельно dedupe и compression (если доступны), и отмечайте, завершилась ли фоновая оптимизация. Без одинакового окна времени можно случайно сравнить «в процессе» и «после оптимизации» и получить ложные выводы.

Как practically проверить «стоимость» снапшотов и клонов в емкости?

Сделайте базовый снапшот, затем перепишите ровно X% данных (важно именно переписывать существующие блоки), снова снимите снапшот и измерьте прирост physical used. Повторите цикл 5–10 раз и получите среднюю «стоимость 1% churn» в ГБ, после чего прогоните два режима retention: часто и коротко, реже и долго. Отдельно проверьте клоны из снапшота: на старте они почти бесплатны, но дальше их разносит собственный churn каждой тестовой среды.

Какие «красные флаги» в расчетах поставщика стоит искать в первую очередь?

Настораживают фиксированные коэффициенты без профиля данных и churn, а также сбор «effective» из лучших значений, снятых в разных условиях. Еще флаг — фразы вроде «снапшоты бесплатные» без модели retention и без учета клонов и массовых операций (пересборка индексов, патчи, крупные обновления). Попросите одну таблицу входных допущений и сырые метрики по датам; если этого нет, расчет трудно проверить и ему нельзя доверять.