30 июл. 2025 г.·6 мин

Сравнение серверных SSD по TBW и DWPD: как сопоставить модели

Сравнение серверных SSD по TBW и DWPD: как читать паспорта, учитывать прошивки и HCL, чтобы выбрать совместимую и надежную модель.

Зачем сопоставлять модели серверных дисков между брендами

Два SSD одинакового объема могут вести себя в сервере совершенно по-разному. Один держит ровную скорость при длительной записи и не уходит в «тормоза», другой резко проседает после заполнения кеша. Где-то критична задержка, где-то важнее стабильность на фоне мелких операций, а где-то на первом месте ресурс.

Сравнение усложняет то, что у производителей разные SKU и названия. Плюс есть ребрендинг и OEM-поставки: внутри может быть похожая платформа, но с другой прошивкой, другим набором функций и иной политикой поддержки. Поэтому на бумаге модели выглядят «похожими», а на практике отличаются по поведению, логам, реакции на команды контроллера и требованиям к обновлениям.

Неверная замена - это не только вопрос скорости. Чаще всего риски такие:

ускоренный износ из-за неподходящего класса выносливости;
таймауты и «выпадения» из RAID (ложные fault, degraded);
проблемы с поддержкой, если диск вне списка совместимости;
неожиданные простои из-за несовместимой прошивки или режимов питания.

Иногда «аналог» действительно достаточен - например, для тестового стенда или второстепенного сервиса, где есть запас по производительности и простой допустим. Для продакшена (БД, виртуализация, критичные сервисы) обычно разумнее добиваться точной совместимости: совпадения по классу (read intensive или mixed use), форм-фактору и интерфейсу, а также по требованиям HCL и версии прошивки.

TBW и DWPD простыми словами: как не ошибиться в цифрах

При сравнении серверных SSD по TBW и DWPD легко попасть в ловушку: числа выглядят точными, но без контекста описывают разные сценарии.

TBW (Total Bytes Written) - это общий объем данных, который производитель «разрешает» записать на диск за гарантийный срок. TBW почти всегда привязан к конкретной модели, ее емкости, типу памяти и методике тестирования. Поэтому корректно сравнивать TBW напрямую можно только между дисками одинакового объема и одного класса (например, read intensive против mixed use).

DWPD (Drive Writes Per Day) переводит выносливость в более понятную меру: сколько раз в день можно полностью перезаписать весь объем диска в течение гарантии. Прикидка простая:

DWPD = TBW / (емкость диска в TB * количество дней гарантии)
TBW = DWPD * емкость * дни гарантии

Срок гарантии здесь критичен. Один и тот же DWPD при 3 и 5 годах означает разный TBW. И наоборот: одинаковый TBW при разной гарантии даст разный DWPD. Поэтому сравнение «диск A на 3 года» и «диск B на 5 лет» без пересчета почти всегда вводит в заблуждение.

Почему «больше TBW» не всегда лучше именно для вас? Потому что выносливость - не единственный риск. Для файлового сервера с редкой записью важнее стабильная работа, совместимость с контроллером и предсказуемая задержка, чем максимальный DWPD. Для базы данных с постоянными журналами записи важны и высокий DWPD, и то, как диск держит длительную запись без просадок.

Пример: если диск 3.84 TB имеет 1 DWPD на 5 лет, это примерно 3.84 TB записи в день. Если по мониторингу у вас около 1 TB записи в день, вы, скорее всего, переплачиваете за класс выносливости, который не используете. В такой ситуации выгоднее вложиться в совместимость и поддержку.

Какие данные собрать перед сравнением: не только TBW и DWPD

Цифр ресурса недостаточно. Два накопителя могут выглядеть одинаково на бумаге (емкость и TBW близки), но не встанут в сервер или начнут давать ошибки из-за формата секторов, шифрования или несовпадения точного парт-номера.

Сначала зафиксируйте базовую «геометрию» и интерфейс: SSD или HDD, SATA/SAS/NVMe, форм-фактор (2.5", M.2, U.2/U.3), высота (например, 7 мм или 15 мм), наличие салазок и тип разъема. Эти вещи чаще всего ломают замену «один в один», даже если ресурс и скорость подходят.

Дальше соберите идентификаторы и паспортные данные. У одного и того же бренда могут быть похожие названия, но разные комплектации и совместимость.

Удобно держать на каждую модель одну карточку с полями:

точное обозначение: model name, part number (PN), option kit, FRU, SKU;
ресурс и гарантия: TBW/DWPD, срок гарантии, условия (что считается записью);
производительность: IOPS и задержка с указанием профиля (random/sequential, read/write, queue depth);
профиль нагрузки: read-intensive, mixed-use или write-intensive;
спецтребования: SED/шифрование, формат секторов 512e или 4Kn, поддержка sanitize/secure erase.

Отдельно запишите энергопотребление (idle и под нагрузкой) и требования к охлаждению. В плотных стойках лишние 2-3 Вт на диск могут поднять температуру корзины и привести к троттлингу.

Небольшой пример: в сервере стоят 4Kn NVMe U.2, а замену выбирают только по TBW и емкости и берут 512e. Диск определяется, но RAID или гипервизор начинает ругаться на формат, и миграция затягивается. Если заранее собрать эти параметры, таких сюрпризов становится заметно меньше.

Шаг за шагом: как сопоставить модели в одной таблице

Чтобы сравнение серверных SSD по TBW и DWPD было практичным, удобнее свести все в одну таблицу и сначала убрать варианты, которые физически не подойдут. Так вы не утонете в «похожих» моделях, которые отличаются критичными мелочами.

Отфильтруйте по базовым параметрам: интерфейс (SATA, SAS, NVMe), форм-фактор (2.5", U.2, M.2, E1.S/E3.S), высота корпуса, тип разъема.
Приведите выносливость к одному виду на срок гарантии. Удобная формула:

TBW = DWPD × емкость (TB) × 365 × лет гарантии.

Например, 1.92 TB диск с 1 DWPD на 5 лет: 1 × 1.92 × 365 × 5 = 3504 TBW. Так вы сравниваете «ресурс на гарантию», а не разрозненные числа из карточек.

Добавьте ограничения, которые часто ломают совместимость: 4Kn или 512e (особенно важно для некоторых контроллеров и старых ОС), наличие power-loss protection, рабочие температуры и требования к воздушному потоку.
С производительностью будьте аккуратнее: сравнивайте результаты в сопоставимых условиях (очередь, блоки, тип нагрузки, заполнение), а не «максимум» из рекламной строки. Во многих задачах важнее стабильность задержек, чем пик IOPS.

Чтобы быстро принимать решения, удобно сразу присваивать статус:

подходит точно;
под вопросом;
не подходит.

Тогда таблица становится инструментом выбора, а не справочником.

Прошивки: что нужно знать, чтобы диск работал стабильно

Поддержка и сервис 24-7

Подключим 24-7 техническую поддержку и сервисную сеть, чтобы инциденты решались быстрее.

Подключить поддержку

Прошивка (firmware) - это встроенное ПО SSD. Она управляет записью, очисткой блоков, энергосбережением, обработкой ошибок и тем, как диск общается с контроллером сервера. «Серверная» прошивка обычно настроена на предсказуемую задержку, корректные таймауты и аккуратную работу с командами RAID, поэтому два внешне похожих SSD могут вести себя по-разному.

Проблемы начинаются там, где версии firmware отличаются даже у одинаковой модели и объема. На практике это проявляется в странных SMART-показателях, внезапных reset, росте media errors и, самое неприятное, в таймаутах под нагрузкой. Из-за них RAID-контроллер может пометить диск как degraded или failed, хотя сам SSD физически еще жив.

Как проверить прошивку и понять, что обновлялось

Проверьте версию firmware в ОС и сопоставьте ее с документами поставки и спецификацией. Полезно запросить у поставщика release notes именно для этой линейки.

Минимум, который стоит собрать:

модель и part number;
текущая версия firmware на каждом диске;
дата поставки и партия (если есть);
модель RAID/HBA и версия его firmware;
логи ошибок и таймаутов за последние недели (если замена делается «по симптомам»).

Когда критична «вендорская» прошивка и почему не всегда стоит прошивать самим

У некоторых платформ производитель сервера тестирует SSD с конкретной прошивкой и добавляет их в матрицу совместимости. В таких случаях поставка дисков с «одобренной» версией снижает риск сюрпризов после ввода в эксплуатацию.

Самостоятельная перепрошивка тоже может быть рискованной: можно получить несовместимость с RAID или бэкплейном, а также потерять поддержку, если обновление сделано не утвержденной утилитой или не по регламенту.

Пример: в кластере баз данных два диска одной модели, но с разными firmware. Под пиковыми транзакциями один начинает отвечать дольше, контроллер фиксирует таймауты, и массив уходит в деградацию. Часто проблема решается не сменой бренда, а выравниванием прошивок и проверкой совместимости.

HCL и совместимость: как правильно читать списки

HCL (Hardware Compatibility List) - это перечень компонентов, которые производитель сервера или контроллера проверил в конкретной конфигурации. Он часто важнее, чем «подходит по характеристикам»: даже если SSD совпадает по формату и TBW/DWPD, он может вести себя нестабильно из-за прошивки, таймингов, power-loss protection или особенностей работы с очередями команд.

Совместимость обычно фиксируется не «в целом с сервером», а по цепочке: сам сервер, бэкплейн, RAID/HBA, версии BIOS и BMC. Поэтому при замене важно понимать, где именно возможен конфликт.

Как читать запись в HCL

В хорошей записи важны детали, а не бренд. Сверяйте:

точный part number (PN) и ревизию;
емкость, интерфейс и форм-фактор;
требуемую или допустимую версию firmware;
модель RAID/HBA и режим (RAID, HBA, passthrough);
ограничения вроде «только для boot» или «нельзя смешивать».

Если диска нет в списке

Отсутствие в HCL не всегда означает «не будет работать». Чаще это «не тестировали» и «не гарантируют». Практичные варианты: запросить результаты валидации, подобрать ближайший PN из HCL или провести пилот на одном сервере с мониторингом логов.

Отдельно проверьте смешивание партий и ревизий в одном массиве. Даже одинаковые модели с разной прошивкой или другим NAND-степпингом могут отличаться по задержкам и износу. В RAID это иногда приводит к неожиданным rebuild-таймам и «сыплющимся» предупреждениям.

Как TBW/DWPD и прошивка связаны с RAID и реальной нагрузкой

TBW и DWPD описывают выносливость, но в RAID они работают не в вакууме. Контроллер распределяет записи, перестраивает данные при сбоях и держит очередь команд. Если прошивка SSD ведет себя иначе, чем ожидает контроллер, вы получаете не просто меньший ресурс, а риск нестабильного массива и просадок скорости.

Один из частых конфликтов - таймауты. При ошибке чтения SSD может слишком долго пытаться «лечить» блок (долгий error recovery). Для одиночного диска это терпимо, а для RAID плохо: контроллер ждет ответ, видит задержку, сбрасывает команду и помечает диск как проблемный.

Смешивание SSD разных серий и даже партий тоже добавляет нестабильности. Причина обычно в «мелочах»: разные алгоритмы SLC-кэша, разные задержки под нагрузкой, отличия firmware. В итоге один диск начинает отставать, растут очереди, появляются reset/timeout, а RAID уходит в degraded чаще, чем должен.

Реальная нагрузка меняет картину износа. База данных и VDI дают много мелких записей и высокий write amplification. Файловый сервер чаще упирается в чтение и метаданные. Системные разделы могут казаться «легкими», но из-за логирования и обновлений создают постоянный фон.

Полезно закладывать запас: держать 10-20% свободной емкости, иметь hot spare той же серии (и по возможности с близкой прошивкой), не смешивать «похожие» модели в одном массиве и заранее понимать, сколько времени массив будет жить в degraded при замене.

Если что-то идет не так, смотрите логи контроллера и ОС: media errors, timeout, reset, переходы в degraded и частоту реконструкций. Эти признаки часто выдают несовместимость или неудачное сочетание прошивки и RAID еще до реального отказа диска.

Пример из практики: замена дисков без остановки бизнеса

Проверка совместимости перед закупкой

Проверим part number, 4Kn или 512e и требования контроллера, чтобы не получить degraded массива.

Проверить HCL

В одном проекте у заказчика (офисная ИТ-служба, критичный документооборот) начали выходить из строя SSD в сервере с RAID. Диски менялись «на горячую», но исходная модель уже не поставлялась, а простой даже на час был нежелателен.

Задача была не «найти любой SSD того же объема», а подобрать замену так, чтобы массив не начал сыпать ошибками и не просел по ресурсу. Здесь пригодилось сравнение серверных SSD по TBW и DWPD, но только вместе с проверкой HCL и прошивок.

Как приняли решение

Сначала разделили варианты на два уровня.

«Точный эквивалент» - совпадают форм-фактор и интерфейс (например, 2.5" SATA или U.2), класс диска (read intensive или mixed use), DWPD близко к исходному (обычно допустима разница до 10-15%), а гарантия по сроку не хуже.

«Условный эквивалент» - ресурс подходит под расчет нагрузки, но есть отличия по PN, прошивке или нет подтверждения в HCL.

Дальше проверили совместимость по HCL сервера и RAID-контроллера. Если интерфейс совпадает, но PN другой, это не значит «точно не будет работать». Это значит, что риски выше: контроллер может ругаться на non-certified, не показать SMART как нужно или вести себя нестабильно под нагрузкой.

Чтобы не гадать, сделали пилот: поставили один диск, посмотрели логи RAID и поведение под нагрузкой, и только после этого утвердили закупку партии.

Как оформили для закупки

Свели решение в короткую таблицу выбора:

Вариант	Интерфейс	Ресурс (DWPD/TBW)	Гарантия	HCL	Прошивка и риск
A (предпочтительно)	Совпадает	Не ниже исходного	5 лет	Есть	Минимум сюрпризов
B (допустимо)	Совпадает	Близко к исходному	5 лет	Нет, PN отличается	Нужен пилот и фиксация версии прошивки
C (только временно)	Совпадает	На грани	3 года	Нет	Риск ускоренного износа, только чтобы закрыть срочную замену

Так заказчик заменил диски поэтапно без остановки сервиса, а выбор был понятен и ИТ, и закупке: что берем, почему берем и какой риск принимаем.

Частые ошибки при подборе аналогов и почему они дорого обходятся

Самая дорогая ошибка - считать, что «любой SSD одинаковый, главное объем». В сервере диск работает под постоянной нагрузкой, в связке с RAID, очередями команд и требованиями к отказоустойчивости. Поэтому оценка по TBW/DWPD имеет смысл только вместе с совместимостью и прошивками.

Чаще всего ошибаются так:

берут потребительский SSD вместо серверного из-за цены и емкости;
сравнивают TBW между моделями с разной гарантией и разным профилем нагрузки;
игнорируют 4Kn и 512e, из-за чего ломаются установка, миграция или проседает производительность;
не проверяют требования RAID-контроллера и получают таймауты и постоянные ребилды;
смешивают ревизии и прошивки «одинаковой» модели, а проблемы всплывают редко и тяжело диагностируются.

В продакшене цена ошибки редко ограничивается покупкой «другого диска». Чаще тратятся дни на диагностику, а сервисные окна растягиваются.

Быстрый чеклист перед покупкой или заменой

Инфраструктура под ключ с поддержкой

Спроектируем серверную конфигурацию и обеспечим поддержку на всем сроке эксплуатации.

Оставить заявку

Перед заменой зафиксируйте условия задачи: где стоит диск (сервер или СХД), какая роль (журналы БД, виртуализация, кэш), что важнее - ресурс записи, задержки или предсказуемость работы в RAID.

Короткий чеклист:

Совпадает «механика»: интерфейс, форм-фактор, высота, лоток/крепление, требования по питанию и охлаждению именно в вашем шасси.
Ресурс сопоставим: TBW/DWPD пересчитаны на срок гарантии и сопоставлены с вашей реальной записью.
Совместимость подтверждена по спискам: проверены HCL для сервера и RAID/HBA, а также допустимые версии прошивок. Если модели нет в HCL, вы заранее понимаете, что берете риск.
Прошивки и обслуживание спланированы: кто обновляет, каким инструментом, в какое окно, и что делать при откате.
Правила замены понятны: без смешивания партий без необходимости, сначала 1-2 диска в пилоте, потом массовая замена.

Практичный пример: если вы меняете SSD под хранилище виртуальных машин, сначала поставьте один диск, проверьте скорость ребилда RAID, ошибки в логах и задержку под нагрузкой. Это занимает часы, но экономит дни простоя.

Следующие шаги: как безопасно внедрить выбранную модель

Даже если по TBW/DWPD диск выглядит идеальным аналогом, безопасное внедрение решают «мелочи»: ревизия, прошивка, режимы питания, поведение в RAID и реакция на ошибки.

Начните с короткого пилота и фиксируйте результаты. Лучше потратить 1-2 дня на проверку, чем потом разбирать деградации массива.

Мини-план внедрения

Поставьте 1-2 диска в тестовый сервер или в не критичный узел. Прогоните типовую нагрузку (чтение, запись, смешанный профиль). Проверьте логи контроллера и S.M.A.R.T.
Сверьте фактическую прошивку диска и контроллера с тем, что допускает HCL. Если прошивка отличается, заранее решите, кто и как будет обновлять, и где лежат проверенные пакеты.
Подготовьте план замены: порядок дисков, окна обслуживания, наличие hot spare, правила ребилда, пороги тревог. Отдельно запишите, что делать при росте ошибок или падении производительности.
Сделайте пробную замену на одном массиве и замерьте время ребилда, температуру, частоту ошибок и скорость записи под реальной нагрузкой.
Зафиксируйте спецификацию для закупки: точные P/N, емкость, форм-фактор, интерфейс, требуемая прошивка и ограничения из HCL (сервер, RAID-контроллер, backplane).

Если инфраструктура сложная и важна единая ответственность за совместимость (HCL, прошивки, контроллеры), в таких задачах обычно помогает системный интегратор. Например, GSE.kz как производитель и интегратор серверной инфраструктуры может быть полезен там, где нужно заранее зафиксировать совместимую конфигурацию и дальше поддерживать ее на протяжении эксплуатации.

FAQ

Зачем вообще сопоставлять серверные SSD между брендами, если объём и интерфейс одинаковые?

Потому что одинаковая ёмкость и даже похожие цифры TBW/DWPD не гарантируют одинаковое поведение в сервере. Разные прошивки, формат секторов, таймауты обработки ошибок и поддержка со стороны RAID/HBA могут привести к просадкам, деградации массива или «выпадениям» дисков.

В чём разница между TBW и DWPD простыми словами?

TBW — это суммарный объём записи за гарантийный срок, а DWPD — сколько раз в день можно перезаписывать весь диск на протяжении гарантии. Для сравнения удобнее DWPD, но только если вы учитываете одинаковый срок гарантии и одинаковый класс нагрузки.

Как правильно пересчитать TBW и DWPD, чтобы сравнение было честным?

Используйте пересчёт к одному виду через гарантию: TBW = DWPD × ёмкость (TB) × 365 × годы гарантии. Так вы сравниваете не «красивые числа из разных карточек», а ресурс в одном и том же временном окне.

Почему нельзя сравнивать DWPD, не глядя на срок гарантии?

Потому что гарантия — часть формулы ресурса. Диск с 1 DWPD на 3 года и 1 DWPD на 5 лет — это разный TBW, а значит, разный запас по износу в реальной эксплуатации.

Какие параметры важны кроме TBW/DWPD при подборе замены?

Проверьте форм-фактор и «механику» (2.5", U.2/U.3, M.2, высота), интерфейс (SATA/SAS/NVMe), формат секторов (512e/4Kn), наличие power-loss protection, требования к охлаждению и энергопотребление. Часто именно эти параметры ломают замену «один в один», даже если TBW/DWPD подходят.

Чем опасна путаница 4Kn и 512e при замене диска?

Это разные форматы логических секторов. В некоторых конфигурациях диск может определяться, но RAID, гипервизор или ОС начнут конфликтовать с форматом, из-за чего миграция затянется или появятся ошибки.

Насколько критична прошивка SSD и почему из‑за неё бывает деградация RAID?

Прошивка задаёт поведение SSD под нагрузкой, таймауты, обработку ошибок и взаимодействие с контроллером. Даже одинаковая модель с разными версиями firmware может давать разные задержки, странные SMART-метрики и таймауты, которые RAID трактует как отказ диска.

Как правильно читать HCL и что в нём важнее всего?

Сверяйте не только «бренд и модель», а точный part number, допустимую версию прошивки, режим работы (RAID/HBA/passthrough) и ограничения вроде “только для boot” или “нельзя смешивать”. Если диска нет в HCL, это чаще означает «не тестировали и не гарантируют», а не «точно не будет работать».

Можно ли ставить в один RAID диски разных серий или партий, если характеристики похожи?

Лучше не смешивать без необходимости, особенно в одном RAID. Отличия в прошивке, NAND-ревизии и алгоритмах кеширования могут дать разные задержки, из-за чего массив чаще уходит в degraded и дольше перестраивается.

Как безопасно внедрить новую модель SSD без простоя и сюрпризов?

Сделайте пилот на 1–2 дисках: проверьте логи RAID/ОС на таймауты и reset, оцените температуру, задержки и время rebuild под типовой нагрузкой. Если нужна единая ответственность за совместимость, прошивки и поддерживаемую конфигурацию, это обычно удобнее делать с системным интегратором и производителем, который может заранее зафиксировать корректные P/N и параметры, как это практикует GSE.kz.