22 сент. 2025 г.·8 мин

Серверы для аналитики и BI: подбор под отчеты и витрины

Серверы для аналитики и BI: разберем профили нагрузок в квази-госсекторе и подскажем, как выбрать CPU, RAM, диски и сеть для отчетов и витрин данных.

Серверы для аналитики и BI: подбор под отчеты и витрины

Что обычно идет не так с серверами под BI и аналитику

Главная причина, почему инфраструктура под BI вдруг начинает тормозить, проста: сервер подбирали под красивую демо-таблицу, а не под реальную нагрузку. В итоге отчеты открываются по минуте, фильтры зависают, а пользователи перестают доверять цифрам, потому что «вчера было быстрее».

Чаще всего упираются в три вещи: память, диски или процессор. Не хватает RAM, данные постоянно вытесняются из кэша. Диски не успевают читать и писать во время загрузок, и дневные отчеты начинают ждать ночные обновления. Или не хватает CPU, когда много людей одновременно запускают тяжелые запросы и расчеты.

Проблему усиливает разница ожиданий. Бизнесу нужны быстрые отчеты днем, а ИТ планирует обновление витрин ночью. Если эти цели не развести заранее, получится конфликт: ночные загрузки «съедают» ресурсы, утром дашборды медленные, а свежесть данных под вопросом.

Для квази-госсектора Казахстана есть еще один практичный момент: данные почти всегда растут быстрее плана. Добавляются источники, требования по хранению истории, показатели для проверок и аудита. Если сервер берут «впритык», через год приходится докупать ресурсы. А это уже другие партии, согласования и риск несовместимых конфигураций.

Перед закупкой стоит ответить на несколько вопросов, чтобы не переплатить и не промахнуться с ресурсами:

  • Сколько пользователей одновременно открывают отчеты в пиковые часы и какие отчеты самые тяжелые.
  • Какой целевой SLA: «отчет до 5 секунд» или «можно подождать 30-60 секунд».
  • Когда и как обновляются витрины: только ночью или есть дневные подгрузки.
  • На сколько лет планируется срок службы железа и какой ожидаемый рост данных.
  • Что важнее: скорость выдачи отчетов, скорость загрузок, или баланс.

Практический пример: если ведомственная аналитика днем обслуживает 50-100 сотрудников, а ночью идет загрузка из нескольких систем, одна «универсальная» конфигурация часто разочаровывает. В таких случаях лучше сразу планировать раздельные роли (запросы и загрузки) или хотя бы заложить запас по памяти и дискам. Поэтому нередко смотрят на серверы класса GSE S200, где проще заранее предусмотреть масштабирование под рост витрин и параллельные запросы.

Типовая схема: DWH, витрины, ETL и BI-сервер

Чтобы выбрать серверы под аналитику, полезно представить цепочку как набор ролей, а не как «одну большую систему». Так проще понять, что именно должно быть быстрым и где обычно возникает конфликт задач.

В типовой схеме чаще всего есть четыре слоя:

  • ETL/ELT: забирает данные из источников, чистит и загружает по расписанию.
  • DWH (хранилище): хранит историю и «сырье» в удобной для обработки структуре.
  • Витрины данных: готовые наборы под отчеты и показатели.
  • BI-сервер: визуализация, дашборды, права доступа, кэш и публикация отчетов.

Узкие места возникают не «везде сразу», а в конкретных местах. Ночью чаще упираются в загрузки: ETL делает много записи на диск и нагружает CPU преобразованиями. Днем в фокусе чтение и параллельность: пользователи открывают отчеты, фильтры, детализацию, и витрины получают много одновременных запросов. BI-сервер при этом может «съесть» память под кэш и внезапно стать причиной тормозов, даже если база данных еще держится.

Один сервер на все задачи часто заканчивается тем, что ночные загрузки мешают утренним отчетам, а тяжелый отчет одного отдела замедляет остальных. В квази-госсекторе это особенно заметно: есть жесткие окна обновления и фиксированные SLA на отчетность.

На практике роли разделяют так:

  • ETL и DWH часто разводят, чтобы запись не мешала чтению.
  • Витрины выносят отдельно, если отчетов много и они «горячие».
  • BI-сервис держат на отдельном узле, если пользователей много и нужен стабильный отклик.

Если планируется рост, удобнее сразу закладывать возможность разнести роли на отдельные узлы, не меняя логику всей системы.

Профили нагрузок: какие бывают и почему это важно

Сервер под BI редко живет в одном режиме. Днем он отвечает на десятки и сотни пользовательских запросов, ночью пересчитывает витрины, а иногда еще принимает разовые запросы аналитиков. Если смешать эти режимы, легко купить конфигурацию, которая «сильная на бумаге», но медленная в реальности.

Интерактивные отчеты и дашборды - это много коротких запросов. Важны быстрая реакция и стабильные задержки: пользователи замечают не среднюю скорость, а подвисания в пиковые минуты. Обычно помогают CPU с хорошей производительностью на одно ядро, достаточная RAM под кэш и быстрые диски.

Пакетные расчеты и регламентные витрины - длинные задачи в ночные окна. Здесь важны параллельность, высокая пропускная способность дисков и предсказуемость. Если окно не закрывается, утром «падает» весь процесс.

Ад-хок запросы аналитиков - непредсказуемые пики. Один запрос может запустить тяжелую агрегацию по большой таблице. Поэтому нужен запас по CPU/RAM и понятные ограничения (очереди, приоритеты), чтобы эксперименты не ломали интерактивные отчеты.

Отдельно стоит понять, где именно выполняются вычисления: в базе данных (джойны, агрегации, оконные функции) или в BI-инструменте. Чем больше логики в СУБД, тем выше требования к серверу базы. Чем больше расчетов в BI, тем сильнее нагружается BI-сервер, особенно по памяти.

Если добавляются ML-модели или прогнозирование, требования расширяются: обычно нужно больше RAM и быстрые диски для обучающих выборок, больше ядер для параллельных расчетов, а иногда и GPU.

Как собрать требования без сложных терминов

Начинать лучше не с моделей CPU и названий дисков, а с того, как люди реально пользуются отчетами. Тогда быстрее становится понятно, что важнее: скорость ответов, стабильная ночная загрузка или запас на рост.

Сначала зафиксируйте пользователей и их привычки. Важно не «сколько всего сотрудников», а сколько работают одновременно и в какие часы. Если пик в 10:00-12:00, значит именно в это время система должна держать максимальную нагрузку без резких просадок.

Дальше определите, какие отчеты «болят». Согласуйте понятные пороги: что должно открываться за 5 секунд, что допустимо за 30 секунд, а что может считаться пакетной задачей на 5 минут. Это сразу влияет на конфигурацию: быстрые интерактивные отчеты и тяжелые перерасчеты требуют разных акцентов.

Удобно собрать требования в короткую карточку:

  • Пиковая одновременность и часы пик (например, 60 пользователей с 10:00).
  • Критичные отчеты и целевое время ответа (5/30/300 секунд).
  • Объем данных сейчас и прогноз на 12-36 месяцев (например, 12 ТБ -> 25 ТБ).
  • Окно обновления витрин (например, 4 часа ночью).
  • Ограничения по поддержке и регламентам (24/7, SLA, закупочный цикл).

В квази-госсекторе Казахстана часто важны регламенты, длинные циклы закупки и предсказуемая поддержка на месте. Поэтому имеет смысл закладывать запас на 2-3 года и заранее уточнять, как будет организован сервис и ремонт. Если рассматриваете локальных производителей с сетью поддержки, например GSE.kz, эти вопросы обычно проще согласовать в рамках внутренних правил.

CPU: как выбрать под запросы, расчеты и параллельность

CPU становится узким местом не только из-за одного тяжелого отчета, а из-за конкуренции: одновременно идут пользовательские запросы, обновления витрин и фоновые расчеты. Поэтому важно понять, что будет чаще: короткие интерактивные запросы или долгие пакетные перерасчеты.

Если отчеты должны открываться быстро и «живьем» фильтроваться на совещаниях, обычно важнее сильное ядро и более высокая частота. Если ночью крутятся сложные агрегации и загрузки, а днем много параллельных запросов, чаще выигрывает большее число ядер.

Параллельность и конкуренция запросов

Конкуренция запросов - это когда несколько задач одновременно претендуют на одни и те же ядра. Типичный пример: утром один отдел строит своды, другой тянет детализацию, а параллельно идет обновление витрин. В такой ситуации «много ядер средних» часто лучше, чем «мало быстрых», но только если память и диски не отстают.

Сокеты, NUMA и запас на рост

NUMA проще представить как «две половины» двухсокетного сервера: ядрам быстрее работать со своей локальной памятью и медленнее - с памятью другого сокета. Поэтому иногда один сокет с более быстрым CPU дает более ровный отклик, чем два сокета с более медленными, особенно для чувствительных к задержкам запросов.

Практичные ориентиры:

  • Для интерактивных отчетов важнее частота и низкие задержки.
  • Для витрин, расчетов и большого числа пользователей добавляйте ядра.
  • Держите запас по CPU минимум 20-30% под новые отчеты и рост данных.
  • Проверьте лицензирование BI и СУБД: по ядрам, сокетам или пользователям.
  • Если рассматриваете двухсокетные платформы (в том числе серверы уровня GSE S200), заранее уточните, как ваше ПО работает с NUMA.

Память: сколько RAM нужно для витрин и быстрой выдачи

Спецификация дисков и RAID
Уточним RAID слои хранения NVMe и разделение логов temp и бэкапов под вашу СУБД.
Согласовать спецификацию

В аналитике часто упираются в RAM раньше, чем в CPU. Отчеты и дашборды любят повторяемые запросы, фильтры и агрегации. Все это работает быстрее, когда нужные страницы данных и индексы уже в кэше базы, а не читаются с диска.

Понять, нужно ли держать данные «горячими» в памяти, можно по поведению пользователей. Если в рабочее время одни и те же витрины и справочники используют десятки людей (финансы, закупки, кадры), кэш дает заметный эффект. Если отчеты редкие и каждый раз разные, RAM все равно важна, но чудес не будет.

Признаки нехватки памяти обычно видны даже без глубоких метрик:

  • появляется swap (система выгружает память на диск);
  • скорость проваливается именно в часы пиковых отчетов;
  • один и тот же отчет то быстрый, то внезапно медленный;
  • растет число чтений с диска при похожей нагрузке.

По запасу: не планируйте память «впритык». После установки ОС и сервисов оставьте заметный резерв под кэш и добавьте запас на 12-18 месяцев роста (новые показатели, детализация, история). Иначе витрина «подросла», кэш перестал помещаться, и система снова упирается в диски.

Отдельный сервер под кэш или семантический слой имеет смысл, когда BI-платформа активно кэширует результаты, а база одновременно занята загрузками ETL. В таком случае часто проще развести роли по узлам, чем бесконечно добавлять память в один перегруженный сервер.

Диски и хранилище: быстрые запросы и стабильные загрузки

В BI скорость нередко упирается в диски. Пользователь открывает дашборд, и если сервер долго читает данные или «думает» на временных файлах, отчет будет тормозить даже при хорошем процессоре.

Есть два ключевых показателя. IOPS - сколько мелких операций чтения/записи выполняется в секунду. Пропускная способность - сколько данных проходит за секунду. Для интерактивных отчетов чаще болят задержки и IOPS, для ночных загрузок - пропускная способность и стабильная запись.

Поэтому SSD, а лучше NVMe, обычно дают заметный эффект: быстрее открываются отчеты, меньше пауз на сортировках и агрегациях, стабильнее идут загрузки. Емкость важна, но «большой, но медленный» массив часто проигрывает меньшему, но быстрому.

Хорошая привычка - разделять нагрузки хранения, чтобы они не мешали друг другу:

  • таблицы и витрины - на самом быстром слое;
  • журналы транзакций - отдельно, с упором на стабильную запись;
  • временные файлы (temp, sort, spill) - на быстром диске;
  • бэкапы - отдельно, можно на более емком и недорогом уровне.

RAID выбирают под риск и характер записи. Для баз данных часто берут RAID10, когда важны скорость и предсказуемая задержка. RAID5/6 может быть уместен там, где важнее емкость, но он чувствительнее к тяжелой записи и восстановлению.

Если данные растут, помогает многоуровневое хранение: «горячее» для текущих витрин, «теплое» для редких периодов и «архив» для регуляторного хранения. В квази-госсекторе часто держат последние 12-18 месяцев в быстром слое, а старые периоды - в более емком, но с понятным временем ответа.

Сеть, надежность и восстановление: что проверить заранее

Пилот под ваши нагрузки
Проверим 3-5 ключевых отчетов на реальных данных и зафиксируем целевые тайминги.
Заказать пилот

Серверы под BI могут тормозить не только из-за CPU. Сеть и слабая схема восстановления тоже часто становятся причиной, особенно когда утренние отчеты идут через удаленные источники, а ночные загрузки затягиваются до рабочего времени.

Быстрый ориентир по сети

10GbE обычно достаточно, если BI рядом с DWH, объемы загрузок умеренные, а резервные копии уходят ночью и не забивают канал. Переход на 25/40GbE чаще нужен, когда растут витрины, много параллельных пользователей, есть активная репликация или частые тяжелые бэкапы.

Типичные сетевые узкие места: выгрузки из источников (особенно файловые реестры), репликация между узлами, перенос бэкапов в хранилище, доступ аналитиков к большим наборам данных. Простой признак проблемы: диски и CPU недогружены, а время запросов скачет.

Восстановление без сюрпризов

Надежность начинается с базы: два блока питания, дублирование сети, диски с защитой от отказа и понятная схема замены. Это не «роскошь», а способ не останавливать отчеты из-за одной детали.

RPO и RTO можно объяснить так: RPO - сколько данных вы готовы потерять (например, 15 минут или 1 день). RTO - за сколько времени система должна вернуться в работу (например, 1 час или 8 часов). Эти цифры сразу показывают, нужна ли репликация, запасной узел и как часто делать копии.

Важно помнить: бэкап и отказоустойчивость - разные вещи. Бэкап помогает вернуть данные «вчерашнего дня», но не спасает от простоя прямо сейчас. Отказоустойчивость держит сервис доступным при поломке, но не заменяет резервные копии.

Перед закупкой проверьте:

  • есть ли отдельный канал или окно для бэкапов и репликации;
  • выдержит ли сеть утренние отчеты и параллельные загрузки;
  • продумано ли дублирование питания, сети и дисков;
  • согласованы ли RPO/RTO с владельцами отчетности;
  • протестировано ли реальное восстановление, а не только «наличие бэкапа».

Пошагово: как подобрать конфигурацию под отчеты и витрины

Подбор сервера под BI проще, когда вы отталкиваетесь от реальных сценариев: как люди работают днем и что происходит ночью. Для квази-госсектора это особенно критично: утром отчеты должны открываться быстро, а регламентные задачи - укладываться в окно.

5 шагов, которые дают понятный результат

  1. Выберите 3-5 самых важных отчетов и витрин. Для каждого зафиксируйте целевое время отклика (например, 3-5 секунд на типовые фильтры) и самые тяжелые действия (детализация, выгрузка, пересчет).

  2. Оцените одновременную работу: сколько пользователей в пике, и сколько задач параллельно выполняется на сервере (обновления, расчеты, публикации). Отдельно зафиксируйте ночное окно: сколько часов есть на загрузку и перестроение витрин.

  3. Решите, как разнести роли. Если витрины и загрузки конфликтуют, чаще выигрывает разделение: отдельный узел под DWH/ETL и отдельный под BI-сервис. Один мощный узел подходит, когда пользователей мало, а ночные загрузки короткие.

  4. Набросайте конфигурацию под профиль. Быстрые ответы обычно требуют больше RAM и быстрых дисков. Массовые загрузки и расчеты - больше CPU и устойчивой записи на хранилище. Сеть важна, если данные приходят из разных систем или используется отдельное СХД.

  5. Заложите запас на 1-3 года: рост данных, новые витрины, больше пользователей. Сразу определите, как будете масштабироваться: добавлять RAM/диски, ставить второй сервер или переходить к кластеру.

После этого проверьте совместимость с вашим ПО (СУБД, BI-платформа, драйверы), а также требования по поддержке и запасным частям.

Мини-проверка перед финальной спецификацией

  • Что «больнее»: утренний пик отчетов или ночная загрузка.
  • Уложится ли регламент в окно при росте данных.
  • Есть ли резервирование: диски, блоки питания, план восстановления.
  • Можно ли расширить сервер без полной замены.

Если вы выбираете инфраструктуру для организаций Казахстана, заранее уточняйте требования по локальному происхождению и сервису. Серверы GSE S200 нередко рассматривают именно из-за доступности поддержки и предсказуемой поставки в регионе.

Пример сценария для квази-госсектора: от отчетов к витринам

Представим организацию квази-госсектора в Казахстане: 200-500 пользователей открывают отчеты утром (9:00-11:00), а ночью идет перерасчет витрин данных и загрузка из источников. Данные типичные: финансы (платежи, бюджет, проводки), кадры (штат, начисления), закупки (планы, договоры, поставки). Источников несколько, частота обновления разная.

Чтобы серверы под аналитику не «падали» в пики, полезно заранее разделить роли, даже если физически это будет один сервер на старте.

Где важнее RAM, а где диски

Задачи обычно делятся на три типа, и у каждой свой узкий момент:

  • BI-выдача и интерактивные отчеты: важны RAM и CPU, чтобы держать горячие наборы в памяти и обрабатывать много одновременных запросов.
  • Ночной ETL и перерасчет витрин: важны быстрые диски и стабильная запись, потому что идут массовые вставки, пересчеты и сортировки.
  • Хранилище истории (несколько лет): важнее емкость и предсказуемая скорость, чтобы рост данных не «съедал» место и не тормозил витрины.

На практике часто делают упор на RAM для слоя витрин и BI, а диски (и их количество) подбирают с запасом под ночные загрузки и рост истории. Емкость лучше считать не «впритык», а с учетом новых витрин и расширения периодов хранения (например, +30-50% на 12-18 месяцев).

План пилота: что измерять

Перед закупкой можно провести пилот на одном узле, чтобы цифрами подтвердить конфигурацию. Обычно измеряют:

  • время открытия 10-20 ключевых отчетов в утренний пик;
  • длительность ночного перерасчета витрин и загрузки из источников;
  • максимальную одновременную нагрузку без деградации;
  • использование RAM, CPU и дисков (очереди записи, IOPS);
  • рост объема витрин за месяц и прогноз на год.

Если пилот показывает, что отчеты «задумываются» при свободных дисках, значит упор нужен на RAM/CPU. Если ночью не укладываетесь в окно, чаще всего проблема в дисковой подсистеме или в конкуренции ETL и BI за одни и те же ресурсы.

Частые ошибки при выборе серверов под BI

Быстрая оценка нагрузки
Поможем собрать понятные требования: пик пользователей SLA окно обновления и прогноз роста.
Оценить нагрузку

Проблемы часто начинаются не с BI-софта, а с того, что сервер подбирают по одному параметру. Например, берут максимум ядер и ждут, что отчеты будут летать, а затем удивляются, что скорость почти не меняется.

Типовые ошибки:

  • Много CPU и мало RAM. Для витрин и интерактивных запросов память часто важнее. Если наборы не помещаются в кэше, система уходит в диск, а процессор простаивает.
  • Диски выбирают только по объему. Для DWH важны задержки и IOPS. Бывает, что загрузка должна занимать 30 минут, а занимает 4 часа из-за медленного хранилища и очередей на запись.
  • Смешивают ночной ETL и дневные интерактивные отчеты без правил приоритета. В итоге днем подвисания, ночью регламент не укладывается.
  • Не закладывают запас под временные таблицы, сортировки и рост логов. Это особенно больно в конце квартала.
  • Тестируют на маленьких выборках. На боевых данных появляются блокировки, конкуренция за память и медленные джойны.

Простой способ поймать эти ошибки до закупки:

  • Прогоните 2-3 самых тяжелых отчета параллельно с типовой загрузкой витрины.
  • Измерьте, что упирается первым: RAM, диск, CPU или сеть.
  • Проверьте запас места под temp и логи на 6-12 месяцев роста.
  • Разведите нагрузки по времени или по узлам, если отчеты критичны днем.

Сбалансированная конфигурация важнее «самого мощного» компонента, независимо от того, рассматриваете ли вы GSE S200 или другой класс оборудования.

Чек-лист перед закупкой и следующие шаги

Перед закупкой серверов под аналитику полезно собрать несколько фактов на одной странице. Это экономит деньги и снижает риск сюрпризов после запуска.

Что стоит зафиксировать:

  • Сколько пользователей будет одновременно в BI и когда бывают пики (утро, конец дня, закрытие месяца).
  • Какие отчеты и дашборды критичны и какое время отклика приемлемо.
  • Объемы данных сейчас и прогноз роста на 12-24 месяца.
  • Как часто обновляются витрины данных и какое есть окно на загрузки.
  • Требования по доступности: возможны ли остановки ночью, нужен ли план восстановления.

Дальше проверьте базовые вещи:

  • CPU: хватит ли ядер для параллельных запросов и фоновых загрузок.
  • RAM: поместятся ли рабочие наборы и кэши, чтобы не упираться в диски.
  • Диски: есть ли быстрый слой под активные таблицы и отдельное место под ETL/стейджинг.
  • Сеть: достаточно ли пропускной способности между BI, DWH и хранилищем.
  • Резервирование: RAID, блоки питания, запас по ресурсам, чтобы пережить отказ.

Чтобы уточнить цифры, попросите у команды данных не «описание системы», а измеримые примеры: 5-10 самых тяжелых запросов, длительность ночных загрузок, статистику одновременности и несколько реальных таймингов.

Перед большой закупкой полезен короткий пилот на реальных данных. Критерии успеха простые: время отклика по критичным отчетам, длительность обновления витрин, стабильность под пиком и отсутствие редких, но сильных просадок.

Дальше обычно достаточно согласовать целевую архитектуру (где DWH, где витрины, где BI) и определить ответственность за поддержку и мониторинг. Если нужен «железный» базис под BI и витрины, можно отдельно рассмотреть серверы GSE S200 и, при необходимости, услуги системной интеграции и 24/7 поддержки от GSE.kz.

FAQ

Почему BI сначала работает быстро, а через несколько месяцев начинает тормозить?

Чаще всего сервер подбирают по демо-нагрузке, а в реальности одновременно работают десятки пользователей, данные растут, а ночные загрузки конфликтуют с дневными запросами. Итог — кэш не помещается в RAM, диски не успевают, а CPU уходит в конкуренцию задач, поэтому время отклика начинает «прыгать».

Какие цифры нужно собрать перед закупкой сервера под BI и витрины?

Начните с пика одновременности и понятного SLA по времени ответа для 3–5 ключевых отчетов. Затем зафиксируйте ночное окно на ETL/пересчет витрин и прогноз роста данных на 1–3 года — эти три вещи обычно точнее всего задают требования к CPU, RAM и дискам.

Когда стоит разделять ETL/DWH/витрины и BI по разным серверам?

Разносите роли, если ночные загрузки регулярно «заезжают» на утро или если один тяжелый отчет замедляет всех остальных. Даже минимальное разделение BI-сервиса и базы с витринами часто дает более стабильный отклик, чем попытки «усилить один большой сервер».

Что важнее для BI: больше ядер или более высокая частота CPU?

Для интерактивных дашбордов обычно важнее скорость на одно ядро и предсказуемые задержки, потому что запросов много и они короткие. Для ночных перерасчетов и массовых загрузок важнее больше ядер и параллельность, но только если память и диски не становятся узким местом.

Как понять, что системе не хватает RAM, и как закладывать запас?

Если витрины и индексы помещаются в кэш, отчеты заметно ускоряются, потому что меньше чтения с диска. Планируйте память с запасом: после ОС и сервисов должен оставаться резерв под кэш базы и под рост витрин, иначе система начнет уходить в диск и будет то быстрой, то медленной.

Какие диски и хранилище обычно нужны для быстрых отчетов и стабильных загрузок?

NVMe/SSD чаще всего дают быстрый эффект именно в BI: уменьшаются задержки на чтении, сортировках и временных файлах. Хороший базовый подход — не гнаться только за емкостью, а обеспечить быстрый слой для активных витрин и предсказуемую запись для журналов и загрузок, иначе ночные регламенты начинают растягиваться.

Когда сеть становится узким местом для BI и DWH?

Если диски и CPU выглядят недогруженными, а время запросов при этом заметно скачет, часто виновата сеть: источники данных, перенос бэкапов или репликация «подъедают» канал. Для большинства сценариев рядом стоящих BI и DWH хватает 10GbE, но при активной репликации, больших бэкапах и росте витрин может понадобиться более высокая пропускная способность.

Что такое RPO и RTO и как это влияет на выбор инфраструктуры под аналитику?

RPO — сколько данных вы готовы потерять, RTO — за сколько времени система должна вернуться в работу. Эти два числа помогают решить, достаточно ли только резервных копий или нужен запасной узел/репликация, потому что бэкап сам по себе не гарантирует быстрый возврат сервиса в рабочее состояние.

На что смотреть в лицензиях и совместимости ПО при выборе CPU и платформы?

Проверьте лицензирование вашей СУБД и BI-платформы заранее: оно может считаться по ядрам, сокетам или пользователям, и это напрямую влияет на «выгодность» конфигурации. Отдельно уточните, как система ведет себя на двухсокетных платформах и с NUMA, чтобы не получить неожиданно неровный отклик при похожих на бумаге характеристиках.

Как правильно провести пилот и не ошибиться с конфигурацией под рост?

Запускайте параллельно типовую ночную загрузку и 2–3 самых тяжелых отчета, а затем измеряйте время отклика, длительность регламента и пики по RAM/дискам/CPU. Если планируется рост и важна локальная поддержка в Казахстане, имеет смысл сразу выбирать платформу, которую легко расширять и обслуживать на месте, например серверы класса GSE S200, чтобы не упереться через год в замену целиком.