Samsung выпустил «неубиваемые» SSD +19




SSD-накопитель PM1733 с обработкой аппаратных сбоев по типу RAID-5/6

SSD-накопители работают на порядок быстрее HDD, но страдают из-за ненадёжных контроллеров. Samsung пытается это исправить. Компания запустила в массовое производство две первые модели SSD с рядом новых технологий: 96-слойная 3D флеш-память с четырьмя битами на ячейку QLC V-NAND, поддержка PCIe 4.0 (скорость чтения 8 ГБ/с) и самое главное — более надёжные контроллеры, которые продолжают работу после многих сбоев, раньше считавшихся фатальными.

«Гарантированная работа даже при возникновении ошибок на уровне микросхемы означает внедрение первых в отрасли "неубиваемых" (never-dying) SSD-накопителей», — заявляется в пресс-релизе Samsung.

Инновационный технологический стек реализован в SSD-накопителях PM1733 и PM1735 для дата-центров. Возможно, в будущем более надёжные контроллеры внедрят и в недорогие SSD-накопители для масс-маркета. Всего на основе PM1733 и PM1735 компания Samsung планирует выпустить 19 моделей SSD.



Известно, что максимальная ёмкость SSD будет 32 (30,72) терабайта, а в модель PM1733 для упрощения миграции поставят два порта PCIe, как указано ниже на фотографии с конференции Samsung Tech Day в Сан-Хосе (см. надпись на стенде).



Полные технические характеристики PM1733 и PM1735 пока не объявлены, но компания рассказала о трёх ключевых инновациях в этих SSD, кроме перехода на PCIe 4.0 с соответствующим ростом производительности.

Fail-In-Place


Технология Samsung Fail-In-Place (FIP) позволяет SSD надёжно обрабатывать аппаратные сбои, которые в противном случае стали бы фатальными для SSD, вплоть до полного отказа NAND.

Накопитель самой большой ёмкости PM1733 на 30,72 ТБ может более или менее нормально продолжать работать даже после потери любого из 512-ти NAND блоков ячеек флеш-памяти.

Для справки, в 96-слойной вертикальной флеш-памяти QLC V-NAND на кристалл послойно напыляют проводящие и изолирующие слои, которые образуют проводники затворов и сами затворы. Затем в этих слоях формируют множество отверстий на всю глубину слоёв. На стенки отверстий наносят структуру полевых транзисторов — изоляторы и плавающие затворы. Таким образом формируют столбец кольцеобразных полевых транзисторов с плавающими затворами.

Ранее Samsung позиционировала их как 90+ слоёв, а не 96, потому что каждый такой чип состоит из двух установленных друг на друга 48-слойных кристаллов 3D NAND. Специалисты предполагали, что в месте стыка двух кристаллов происходит разрушение слоёв или компания отключает эти слои в связи с высоким уровнем отказа ячеек в них.


96-слойная 3D NAND из двух 48-слойных кристаллов 3D NAND (International Memory Workshop 2018)

За прошедший год технологический процесс наверняка усовершенствовался. Кроме того, Samsung начала массовое производство памяти с ячейкой QLC, которая будет хранить четыре бита данных.

И поверх всего этого установлен контроллер, который выдерживает выход из строя целых блоков ячеек памяти. Накопитель будет сканировать повреждённые или потерянные данные, восстанавливать их и перемещать на всё ещё работающие флеш-чипы, а также продолжать работать с высокой пропускной способностью и QoS. По сути, это похоже на массив RAID-5/6, который переходит в деградированный режим вместо отключения всего массива (при выходе из строя одного диска RAID 5 надёжность тома сразу снижается до уровня RAID 0).

Конечно, если с накопителем случилась такая неприятность, разумно будет его заменить, но благодаря технологии FIP замену можно выполнить в удобное для оператора время, не сталкиваясь с простоем из-за немедленного отказа.

Впрочем, внедрение Fail-In-Place не меняет того факта, что у PM1733 и PM1735 сохраняется прежний рейтинг выносливости на количество перезаписей в день Drive Writes Per Day (DWPD). Он равен 1 и 3, соответственно. То есть весь объём накопителя предполагается перезаписывать 1 или 3 раза в день. В этом случае соблюдается гарантированный срок службы SSD в пять лет.

Общая продолжительность жизни всё ещё сопоставима с предыдущим поколением накопителей, но риск преждевременной смерти за исключением нормального износа NAND значительно уменьшен.

Виртуализация


Кроме того, в накопителях PM1733 и PM1735 реализована технология виртуализации. Samsung внедрила дополнительные функции виртуализации NVMe на основе Single-Root I/O Virtualization (SR-IOV), что позволяет одному контроллеру SSD NVMe предоставлять множество виртуальных контроллеров (до 64 в случае дисков Samsung). Каждый виртуальный контроллер может быть назначен на другую виртуальную машину, работающую на хост-системе, и обеспечить дисковое пространство для этой виртуальной машины без нагрузки на процессор — так же, как если бы весь диск был назначен на одну виртуальную машину через PCIe. Ёмкость каждого SSD-накопителя можно гибко распределить между различными пространствами имён, которые, в свою очередь, могут быть подключены к соответствующему виртуальному контроллеру.



Машинное обучение


Третья технология Samsung — это машинное обучение V-NAND. Компания не раскрывает точных подробностей о том, как они используют машинное обучение, но говорит, что оно используется для прогнозирования и анализа характеристик флеш-ячеек, в том числе путём обнаружения изменений в характеристиках электрических схем.

В 3D NAND всё труднее становится применять стандартные стратегии программирования ячеек, чтения и исправления ошибок. Недостаточно одного только отслеживания циклов P/E для каждого блока, ведь между слоями в верхней и нижней части 3D-стека могут быть значительные различия, также как между разными микросхемами. Samsung наверняка не единственная, кто пытается применить машинное обучение для решения этих проблем. Новая функция обеспечит стабильную производительность и повышенную надёжность современных накопителей на TLC V-NAND, но её важность резко возрастет в случае с накопителями QLC V-NAND.

Поставки первых дисков PM1733 и PM1735 уже начались. Обе модели сделаны на одной технологической платформе. PM1733 расклассифицирован как DWPD 1 и предлагает объём до 30,72 ТБ, а у PM1735 специально уменьшенная ёмкость, чтобы гарантировать DWPD 3 с резервированием отдельных блоков ячеек по типу RAID 5/6, как было описано выше. Обе модели доступны в форм-факторах U.2 или подключаемых модулей PCIe. Форм-фактор U.2 предоставляет несколько дополнительных вариантов ёмкости, в то время как у подключаемых модулей интерфейс PCIe 4.0 x8, который обеспечивает на 25% более высокую скорость последовательного чтения (в других рабочих нагрузках PCIe 4.0 x4 достаточно быстр, чтобы не быть узким местом).

Вы можете помочь и перевести немного средств на развитие сайта



Комментарии (50):

  1. Stepler
    /#20650585

    Виртуализация может начать новую гонку, если сейчас контроллер SSD NVMe предоставляет до 64 виртуальных, то сколько будет через год (?).

  2. staticmain
    /#20650611

    32 терабайта. Тут домой 1ТБ SSD купить уже великая проблема, а эти диски вообще как квартира в Нью-Йорке будут стоить.

    • SergeyMax
      /#20650625

      Терабайтник же вроде меньше десятки нынче стоит?

      • staticmain
        /#20650645

        Те, которые нонейм или по старой технологии — 10. Samsung/seagate 550 МБ/сек — 20круб.

        • SergeyMax
          /#20650651

          Не знаю насчёт самсунга и старой технологии, но например в три раза более быстрый Intel 660p — 8500 рублей…

          • xDiezz
            /#20650863

            660p сложно назвать быстрым на реальных тестах. Это провальная линейка от интел, в отличие от 760p

            • SergeyMax
              /#20651613

              Он может быть действительно не самый быстрый, но после того, как я заменил свой SATA3 SSD со скоростью чтения/записи порядка 550 МБ/с на NVMe со скоростью чтения 3200 МБ/с, и не заметил никакой разницы — я стал относиться к тестам чуть менее внимательно.

              • HardWrMan
                /#20653969

                Потому, что после 200МБ/с скорости интерфейса уже следует обращать внимание на IOPSы.

            • iproger
              /#20652229 / +1

              У него проседают скорости после нескольких минут непрерывной записи или чтения?

          • skrimafonolog
            /#20653641

            Не знаю насчёт самсунга и старой технологии, но например в три раза более быстрый Intel 660p — 8500 рублей…


            Цена ниже в новых моделях не просто так.
            В связи с большей плотностью упаковки.

            А увеличение плотности — это заодно и снижение надежности.

            То есть если вам положить 2 диска:

            Один дешевле с «четверной упаковкой»
            И один дороже с «двойной упаковкой»

            одного размера, то что вы, как неискушенный пользователь выберите?

            Ну или как пользователь искушенный, но кому достаточно работы диска в пару лет?

            Конечно, тот, что дешевле.

            О том и речь в статье — объемы выросли, цена упала, но и надежность упала.
            А сейчас пришла пора о надежности подумать.

        • JamboJet
          /#20651549

          Терабайт «ноунейма» (Londisk на aliexpress) в августе назад стоил ~5тр за SATA и ~6тр за NVME.

      • burzooom
        /#20652957

        Такая цена в украинских магазинах, samsung evo 970 pro 1tb m2 за эквивалент 13 000 рублей

    • denisromanenko
      /#20650877

      Написано же что это максимальная поддерживаемая ёмкость. Конечно будет куча подвидов с разными размерами.

    • denisromanenko
      /#20650895

      Терабайтный самсунг NVMe на том же ситилинке стоит 12 тысяч.

      Понятно, что деньги не маленькие, но и не такие уж огромные — если работа требует быстрый доступ сразу к терабайту данных — цена вполне нормальная.

      А для домашних целей SSD 256 + 1 Tb HDD (новый и быстрый) перекрывают потребности с лихвой даже для игр.

      • Garbus
        /#20653333 / +1

        Не стоит забывать вариант — ноутбук, где по большому счету имеет смысл только ССД. И устойчивый к сбоям диск более чем желателен.

      • VIkrom
        /#20653463

        Новым (и не очень) играм тоже желателен SSD. Battlefield установленный на HDD очень долго загружает карту в сравнении с SSD.

        • denisromanenko
          /#20653513

          Тут наверное еще проблема в умении программистов, создавших игру — у меня все игры на HDD, и тот же бэтмен аркхем найт, где огромный бесшовный город с кучей деталей — прогружает карту буквально за 10 секунд от старта игры.


          Кстати, новые HDD работают намного быстрее таких же sata-3, но выпущенных 5-6 лет назад. Уж не знаю с чем это связано, но запуск+отклик системы на свежей хдд тошибы примерно такой же, как на трехлетнем ссд

          • yatanai
            /#20655175

            2 варианта? Увеличили количество блинов или более умные контроллеры. Учитывая что недавно я вытащил из одного мёртвого HDD (год прожил) ОЗУ на 512Мб, я ничему уже не удивлюсь.

  3. wormball
    /#20650833 / +4

    «Неубиваемый» и «QLC» в одном предложении слегонца настораживают.

    • NetBUG
      /#20650883

      Вот и пытаются взаимно компенсировать

      • Может объем будет падать помаленьку, но само устройство будет работать дальше

        • Alexsandr_SE
          /#20652583

          Только недолго. Износ ячеек памяти будет более-менее равномерным и данная технология будет сигналом к срочной замене.

          • Так в чем тогда сокральный смысл живучих контроллеров, если вопрос живучести памяти и живучести самого устройства, в случае проблем с памятью остается открытым.

          • ClearAirTurbulence
            /#20654763

            Даже консьюмерские SSD довольно живучи. Широко известный тест:
            techreport.com/review/27909/the-ssd-endurance-experiment-theyre-all-dead

            Да, они сдохли, но на них перед этим столько записали, сколько дома обычно не пишут.

            • skrimafonolog
              /#20654799

              Даже консьюмерские SSD довольно живучи


              А теперь посмотрите какой там тип флеш-памяти.
              Но с современными QLC не все так радужно.

    • panvartan
      /#20650901

      Вы путаете неубиваемость и бессмертие.

    • KorDen32
      /#20651017

      Вначале тоже хотел это написать, потом дошло:
      — у нас дохнут контроллеры, но MLC живуч.
      — хорошо, выпустим неубиваемые супер-зарезервированные контроллеры, а для капитализма у нас есть QLC.

      • crea7or
        /#20654217

        Флешпамять правда живучее чем пишут/говорят. Это как со светодиодами. Лампы светодиодны дохнут не из-за смерти диодов в абсолютном большинстве случаев, а потому что конденсаторы высохли в драйверах. Я так больше десятка оживил разных. Очень неприятно когда высокотехнологические устройства дохнут из-за конденсатора за 3 рубля.

        • usrsse2
          /#20655653

          Не знаю, у меня всегда диоды сгорают (чернеют). Ставлю перемычку вместо светодиода, лампочка еще какое-то время работает.

  4. lingvo
    /#20651271

    Для меня неубиваемая электроника — это та, которая не дохнет, если на нее подать +12В вместо +3.3В или поменять местами + и -. А все остальное — фигня.


    Подождем реальных тестов на надежность.

    • karavan_750
      /#20651495

      Исходя из вашего мнения о неубиваемости, каких тестов вы ожидаете?
      Прожарку ssd в микроволновке?

      • prs123
        /#20651805

        Там в соседнем посте Galaxy Fold царапают и ломают. Думаю, человек здесь тоже хотел увидеть что-то схожее

        • karavan_750
          /#20651849

          Вспоминается древний анек об испытаниях японской пилы бригадой сибирских лесорубов.

      • lingvo
        /#20652141 / -2

        Веселые минусовщики. Вы вообще слово неубиваемая понимаете? Это от слова убивать если что. То есть неубиваемая означает, что вы специально (или чаще всего случайно)пытаетесь что-то убить, а оно все равно выживает.
        То есть это испытание за пределами нормальных условий эксплуатации для конкретного прибора, при которых оно обычно безвозвратно ломается.
        Да и испытание в микроволновке, если что, хотя на самом деле это обычно испытания на что-то, что может произойти вследствие воздействия неожиданных для данного применения факторов или фактора воздействия «дурака».


        Вообще в оригинальном тексте записано never-dying и это больше означает «неумирающий» чем неубиваемый. И смысл совсем другой.

  5. old_bear
    /#20652053 / -1

    SSD-накопители работают на порядок быстрее HDD, но страдают из-за ненадёжных контроллеров.

    Вот ведь, а я то уж думал, что проблема в попытках несколько бит в одной ячейке NAND-а хранить. А виноваты то оказывается контролёры — ненадёжные какие-то.

    • hjornson
      /#20652531

      Судя по контексту статьи — там все же имелось в виду не то что сами контроллеры дохнут, а то что контроллер не может обрабатывать отказ ячеек в массиве.

      И тут стоит вспомнить знаменитую серию самсунгов 7200.11. Там дело было как раз в контроллере.

  6. Crazyvlad
    /#20652739

    Интересно, а в чем идея?
    В продуктиве рейд 6 или аналог используется. Все равно диск с отказами придётся менять ASAP и тут его внутренний рейд не поможет совсем.
    По ощущениям, это сделано для уменьшения количества брака… Или уменьшения отказов в гарантийный период.

  7. nApoBo3
    /#20652783 / +4

    ИМХО попытка сделать хорошую мину при плохой игре. Мы поставили, мягко говоря, весьма сомнительную память, но зато у нас теперь больше pci линий( сомнительно, что данная память сможет их загрузить ) и мы прикрутили кучу сложных технологии, чтобы компенсировать недостатки памяти, но продвигать будем как достижение, а не как попытки дотянуть брак хотя бы до второго сорта.
    Несколько лет назад все ssd были быстрыми, некоторые лучше, некоторые хуже. Обидно видеть, что индустрия пошла по пути шулера, с их slc кэшем и многие ssd под длительной нагрузкой стали настолько медленным, что скоро их hdd обгонят.

    • burzooom
      /#20652967 / +1

      ссд рулят в основном не из-за гигабайт\с, (ну довели скорость до 5-6 гб\с ииии… и что?) а из-за высокой скорости доступа к фрагментам файлов, разбросанных по диску

      • nApoBo3
        /#20653085 / -1

        Тут вылезает одна интересная деталь, если диск заполнен, то у ssd очень проседает скорость записи( которая и так не фантан у подобных моделей со сложной организацией памяти ), а когда диск не заполнен фрагментация файлов будет весьма не большой.

        • burzooom
          /#20653125

          вот у меня к примеру и ссд, и хдд заполнены до отвала, но тормозит почемуто из-за этого только хдд. А главное — это нештатная ситуация. SDD на 500 гб не справляется с ролью «оперативной постоянной памяти» (и так 150 гб на сис.раздел ушло), и нужно апдейтить до 1тб. Как и хдд, нужно купить вместо 2тб подешевевшие 8 и забыть на лет пять про отсутствие места

    • atbuhw
      /#20658203

      Я полностью согласен, только то же самое можно (и да, я так сам тоже считаю) сказать и про всю индустрию ssd в целом. «Мы поставили ненадёжную NAND-память вместо надёжной hdd, но зато прикрутили кучу сложных технологий (TRIM, принципиально ломающий возможность восстановления ошибочно удалённых данных; wear leveling, из-за которого диск „если сдохнет, так уж сдохнет“, чтобы вообще ничего нельзя восстановить было), чтобы компенсировать ненадёжность памяти, и хотя бы один конкретный файл можно было сохранить хотя бы больше 1000 раз.»