Гибридные диски для Enterprise СХД. Опыт использования Seagate EXOS +5







Пару месяцев назад компания «Рэйдикс» получила возможность поработать со свежими накопителями Seagate EXOS, разработанными для задач корпоративного класса. Их отличительная особенность заключается в гибридном устройстве накопителя — в нем совмещены технологии обычных жестких дисков (для основного хранилища) и твердотельных накопителей (для кэширования горячих данных).

У нас уже был положительный опыт применения гибридных дисков от Seagate в составе наших систем — пару лет назад мы внедряли решение для частного ЦОДа совместно с партнером из Южной Кореи. Тогда на тестах использовался бенчмарк Oracle Orion, и полученные результаты не уступали All-Flash массивам.

В этом материале мы посмотрим как устроены накопители Seagate EXOS с технологией TurboBoost, оценим их возможности для задач корпоративного сегмента, и проверим производительность на смешанной нагрузке.

Задачи корпоративного сегмента


Существует более-менее устойчивый круг задач, который можно обозначить как задачи хранения данных в корпоративном (или enterprise) сегменте. К ним традиционно относят: функционирование CRM-приложений и ERP-систем, работу почтовых и файловых серверов, операции резервного копирования и виртуализации. С точки зрения СХД, реализация таких функций характеризуется потоком смешанной нагрузки, с явным преобладанием случайных запросов.

Помимо этого, в enterprise-сегменте активно развиваются такие ресурсоемкие направления как многомерная аналитика OLAP (Online Analytical Processing) и обработка транзакций в режиме реального времени (OLTP, Online Transaction Processing). Их особенность заключается в том, что они в большей степени опираются на операции чтения, чем на операции записи. Создаваемая ими нагрузка — интенсивные потоки данных с небольшим размером блока — требует высокой производительности от системы.

Роль всех перечисленных функций стремительно возрастает. Они перестают быть вспомогательными блоками в процессах создания ценности и переходят в раздел ключевых составляющих продукта. Для многих форм бизнеса это становится важным компонентом формирования конкурентного преимущества и рыночной устойчивости. В свою очередь, это значительно повышает требования к ИТ-инфраструктуре компаний: техническое оснащение должно обеспечивать максимальную пропускную способность и минимальное время отклика. Для обеспечения необходимой производительности в таких ситуациях выбирают All-Flash системы или системы гибридного хранения с функцией SSD-кэширования или тиринга.

Помимо этого возникает еще один характерный для enterprise-сегмента фактор — жесткие требования по экономической эффективности. Вполне очевидно, что приобретение и обслуживание All-Flash массивов могут позволить себе далеко не все корпоративные структуры, поэтому многим компаниям приходится немного уступать в производительности, но приобретать гораздо более выгодные по цене решения. Эти условия сильно смещают рыночный фокус в сторону гибридных решений.

Принцип гибрида или технология TurboBoost


Принцип использования гибридных технологий сейчас уже хорошо знаком широкой аудитории. Он говорит о возможности использования разных технологий для получения дополнительных выгод в итоговом результате. В гибридных СХД сочетаются сильные стороны твердотельных накопителей и классических жестких дисков. На выходе мы получаем оптимизированное решение, где каждый компонент работает со своей задачей: HDD используется для хранения основного объема данных, а SSD — для временного содержания «горячих данных».

По данным агентства IDC, в регионе EMEA около 45.3% рынка составляют гибридные СХД. Такая популярность определяется тем, что при сравнительной производительности стоимость таких систем существенно ниже, чем у решений на базе SSD, а цена за каждый IOps отстает на несколько порядков.

Этот же гибридный принцип может быть реализован непосредственно на уровне накопителя. Компания Seagate первой воплотила эту идею в виде SSHD (Solid State Hybrid Drive) носителей. Такие диски приобрели относительную популярность на потребительском рынке, но в b2b-сегменте они встречаются не так часто.

Текущее поколение этой технологии в компании Seagate идет под коммерческим названием TurboBoost. Для корпоративного сегмента компания использует технологию TurboBoost в линейке дисков Seagate EXOS, которые имеют повышенные показатели надежности и оптимальное сочетание производительности и экономичности. Собранная на основе таких дисков СХД будет по итоговым характеристикам соответствовать гибридной конфигурации, при этом кэширование «горячих» данных происходит на уровне накопителя и выполняется за счет возможностей прошивки.

В дисках Seagate EXOS для локального SSD кэша используется встроенная eMLC (Enterpise Multi-Level Cell) NAND-память объемом 16 ГБ, которая характеризуется значительно большим ресурсом перезаписи, чем MLC потребительского сегмента.

Совместная полезность


Получив в свое распоряжение 8 накопителей Seagate EXOS 10E24000 объемом 1.2 ТБ, мы решили проверить их продуктивность в составе нашей системы на базе RAIDIX 4.7.

Внешне такой диск выглядит как стандартный HDD: металлический кейс 2,5-дюймового формата с фирменной этикеткой и стандартными отверстиями для крепежа.



Накопитель оборудован SAS3 интерфейсом 12 Гбит/с, позволяющим эффективно работать с двумя контроллерами системы хранения. Также стоит отметить, что этот интерфейс обладает большей глубиной очереди, чем SATA3.



Отметим, что с точки зрения управления такой диск в СХД представляется единым носителем, в котором пространство хранения не разделяется на области HDD и SSD. Это исключает необходимость использования программного SSD-кэша и упрощает конфигурацию системы.

В качестве прикладного сценария для готового решения рассматривалась работа с нагрузкой от типовых корпоративных приложений.

Главная ожидаемая выгода от создаваемой СХД — эффективность работы на смешанных нагрузках с преобладанием операций чтения. Программно-определяемые СХД RAIDIX отличаются высокой производительностью при работе с последовательной нагрузкой, а накопители Seagate с технологией TurboBoost помогают оптимизировать работу со случайными запросами.

Для выбранного сценария это выглядит следующим образом: эффективность работы со случайной нагрузкой от баз данных и других прикладных задач будет гарантироваться SSD-элементами, а специфика программного обеспечения позволит сохранить высокую скорость обработки последовательной нагрузки от восстановления БД или загрузки данных.

При этом, вся система выглядит привлекательной по соотношению цены и производительности: недорогие (относительно All-Flash) гибридные накопители хорошо сочетаются с гибкостью и экономичностью программно-определяемой СХД, построенной на стандартном серверном оборудовании.

Тестирование производительности


Тестирование проводилось при помощи утилиты fio v3.1.

Последовательность минутных fio-тестов по 32 потока с глубиной очереди 1.
Смешанная нагрузка: 70% чтения и 30% записи.
Размер блока от 4k до 1MB.
Нагрузка на зону размером 130 Гб.
Серверная платформа AIC HA201-TP (1 шт.)
CPU Intel Xeon E5-2620v2 (2 шт.)
RAM 128GB
SAS адаптер LSI SAS3008
Накопители Seagate EXOS 10E24000 (8 шт.)
Уровень массива RAID 6


Результаты тестов










Система на базе RAIDIX 4.7 с 8 накопителями Seagate EXOS 10e2400 показывает суммарную производительность до 220 000 IOps на чтение/запись блоком 4k.

Заключение


Накопители с технологией TurboBoost открывают новые возможности для пользователей и производителей систем хранения данных. Использование локального SSD-кэша значительно повышает производительность системы при несущественном увеличении затрат на приобретение накопителей.

Проведенные тесты накопителей Seagate в СХД под управлением RAIDIX показали уверенно высокий уровень производительности на смешанном паттерне нагрузки (70/30), моделирующем приблизительные требования прикладных задач в корпоративном сегменте. При этом была достигнуты показатели в 150 раз превышающие предельные значения HDD накопителей. Здесь стоит отметить, что расходы на приобретения СХД по такой конфигурации составляют около 60% от стоимости сопоставимого All-Flash решения.

Ключевые показатели


  • Уровень годовых отказов диска составляет менее 0.44%
  • На 40% дешевле All-Flash решения
  • В 150 раз быстрее HDD
  • До 220 000 IOps на 8 накопителях

Вы можете помочь и перевести немного средств на развитие сайта



Комментарии (16):

  1. Todesengel
    /#20151696

    В 150 быстрее HDD

    В 150 чего?

  2. KorP
    /#20151742

    Последовательность минутных fio-тестов

    Мне кажется, что тестить целую минуту — это слишком много.

    • KorP
      /#20151768

      Нагрузка на зону размером 130 Гб.

      Специально, что бы в кэш умещалось аккуратненько? :))

      • raidixteam
        /#20152108

        Да, специально что бы в кэш попадало, т.к. тестировали именно возможность SSD-кэширования. Бьём в одну область, чтобы проверить работу кэша дисков и сравнить его с работой кэша в СХД. Тут есть подробности по этому вопросу.

        • KorP
          /#20152142

          сравнить его с работой кэша в СХД

          И с какой СХД вы это сравнивали?

    • raidixteam
      /#20152090

      Проводится серия тестов, каждый из которых длится одну минуту. Это делается для того, чтобы «прогреть» кэш

      • KorP
        /#20152136

        Так а смысл то в чём? Показать что кэш есть и он как то работает?
        Вы запустите тест, приближённый к реальной ситуации, так, что бы данных было больше, чем кэш и что бы они использовались не минуту. Иначе возьмите для сравнения 2x120Gb SSD в зеркало хоть коньсьюмерские и сравните. Иначе не понятно какой смысл сравнивать кэш с HDD.

        • raidixteam
          /#20152580

          Смысл был протестировать производительность SSD-части гибридных дисков, при условии 100% попадания в кэш, и как эти диски будут вести себя в RAID-6 в рамках СХД

          • KorP
            /#20152596

            Ну т.е. тест ни о чём. А вроде кажетесь такими серьёзными ребятами.

  3. KorP
    /#20152148

    До 220 000 IOps на 8 накопителях

    А на вашем графике всего 185k

    • raidixteam
      /#20152586

      220 000 IOps — это смешанная нагрузка 70/30 блоком 4k

  4. KoPBuH
    /#20153532

    Коллеги уже высказались, но вставлю и я 5 копеек.
    Сначала вы описываете типы нагрузки, а потом оп, и делаете просто синтетические тесты.
    Хотелось бы посмотреть живые примеры. Те же бэкапы. Когда кеш будет заниматься записью на медленную часть.
    Ведь вопрос не в том, как быстро работает кеш, а в том, успеет ли забэкапиться/развернуться система за определенное время.

  5. reallord
    /#20154624

    Да, очень странное тестирование. Очень синтетическое, четко чтобы протестить только SSD часть этих дисков.

  6. ustas33
    /#20155246

    Сейчас Intel® SSD D3-S4510 такого же объема стоят тех же денег, как и SFF SAS диски.
    Смысл ставить SSHD?
    Apache pass DIMM + SATA SSD один из самых оптимальных вариантов для SDS или HCI.

  7. raidixteam
    /#20166492

    Ключевой задачей этих тестов было понимание максимальной производительности гибридных дисков при 100% cache hit и сравнение ее с максимальной производительностью гибридного пула с использованием кэша на чиcтых SSD.

    Этим тестом мы опровергли гипотезу о том, производительность кэша на дисках даже в лучшем случае будет отставать от производительности кэша на отдельном накопителе.

    Конечно, при реальном использовании результат будет иным и он будет зависеть от конкретного паттерна нагрузки, локальностей данных, алгоритмов вытеснения и префетча.