Зачем бизнесу СХД и как ее выбрать
Система хранения данных (СХД) — это комплекс устройств для управления, хранения и резервирования большого массива данных. С помощью СХД организации могут надежно и безопасно разместить информацию, не нарушая законодательство о защите персональных данных.
Вот какие задачи решает бизнес с помощью СХД:
- Хранение информации. В СХД компании могут разместить всю необходимую корпоративную информацию: базы данных, рабочие файлы, проекты, документы, счета, архивы, аудио- и видеофайлы, а также резервные копии.
- Совместное использование данных. Доступ к данным есть одновременно у десятков или даже сотен сотрудников. Специалисты разных подразделений могут работать над общими задачами и не терять время на обмен необходимыми документами — это ускоряет бизнес-процессы и повышает эффективность командной работы.
- Организация данных. Все данные в СХД можно структурировать. Например, выполнить кластеризацию, то есть сгруппировать их по определенному критерию. Так процесс чтения и поиска данных ускоряется, поэтому СХД способны обрабатывать множество запросов с минимальной задержкой. Это позволяет, например, онлайн-магазинам или системам бронирования не терять клиентов из-за долгой загрузки сайта или приложения.
- Защита данных. Вся информация в СХД надежно защищена от сбоев в работе оборудования. С помощью функции резервного копирования можно создавать и хранить копии не только файлов, архивов или документов, но и всей системы. Это помогает бизнесу избежать потери важной информации. В случае сбоя достаточно откатиться на последнюю рабочую версию системы или восстановить нужную программу. А функция шифрования и контроля доступа защищает данные от злоумышленников.
- Управление данными. Оно включает множество процессов. Например, миграция отвечает за перенос данных между различными устройствами, системами или форматами, когда нужно заменить оборудование на новое или переехать в облако. В процессе дедупликации происходит проверка и удаление дубликатов данных, чтобы оптимизировать хранение. Также в СХД есть функция кеширования для ускорения доступа и функция сжатия данных для экономии места на диске.
Небольшие компании могут использовать СХД, чтобы обеспечить доступ к данным для своего веб-сайта, CRM-системы или платежного шлюза. А в крупных корпорациях их применяют, чтобы обрабатывать и анализировать большие массивы информации, организовывать документооборот, управлять цепочками поставок.
Как устроена система хранения данных
СХД состоит из взаимосвязанных компонентов, каждый из которых выполняет определенные задачи. Во многих СХД применяют принцип избыточности — ключевые элементы дублируются, чтобы повысить производительность и надежность системы.
Накопители. Именно на них размещают все данные компании. В СХД применяют разные типы носителей информации:
- Жесткие диски Они подходят для длительного «холодного» хранения больших объемов данных: информация на них может сохраняться более десяти лет. А если произойдет сбой, данные можно восстановить, даже если поврежден один из компонентов диска. Кроме того, HDD диски стоят дешевле SSD.
- Твердотельные накопители SSD. Они работают быстрее жестких дисков и потребляют меньше энергии. SSD оптимальны для загрузки приложений, сложных вычислений или хранения «горячих» данных, к которым часто обращаются пользователи.
- Ленточные накопители. Они служат не меньше 20 лет. У магнитных лент высокая емкость, на них можно записывать и хранить огромные объемы информации, поэтому их часто используют для архивирования данных. Кроме того, ленты можно перезаписывать несколько раз. Однако работают ленточные накопители медленно, а доступ к данным ограничен, так как запись на них идет последовательно. Несмотря на недостатки, ленточные накопители еще актуальны: они долговечнее и дешевле, чем HDD и могут хранить информацию десятилетиями. Например, их можно использовать в резервном копировании, когда необходимо держать несколько копий на разных носителях.
Контроллер дискового массива (RAID-контроллер). Диски могут объединять в RAID-массивы (Redundant Array of Independent Disks). Это повышает отказоустойчивость и производительность системы: если один накопитель выйдет из строя, информация не потеряется. Контроллер — важный компонент СХД, который управляет массивом жестких дисков: следит за работой и состоянием дисков, распределяет, резервирует и управляет доступом к данным. В EdgeЦентр мы используем RAID-контроллер на наших серверах в EdgeHosting и EdgeCloud.
Кеш-память (или кеш-накопитель). Нужна, чтобы обеспечить быстрый доступ к файлам, которые чаще всего используют пользователи. Обычно у кеш-накопителя небольшой объем памяти, поэтому его необходимо периодически чистить.
Внешний корпус. Это физическая оболочка, которая служит для защиты размещенных в СХД компонентов. Для крупных компаний и дата-центров обычно используют корпуса форм-факторов 1U, 2U или 3U для монтажа в серверную стойку. Для небольших офисов — башенные корпуса, которые похожи на обычный системный блок. Их можно размещать горизонтально или вертикально. При выборе корпуса исходят из размеров, количества и типа дисков, расположения разъемов, типа подключения и других факторов.
Блоки питания. Нужны, чтобы обеспечить электропитание для всех компонентов СХД и гарантировать их непрерывную работу. Блок питания лучше выбирать с запасом мощности, чтобы при необходимости можно было добавить новые накопители.
Типы систем хранения данных для компаний разного масштаба
СХД классифицируют по методу подключения, архитектуре, производительности и функциональности. От этих характеристик зависит, какую систему выбрать небольшой фирме, многофилиальной организации или крупному предприятию.
По способу организации доступа
DAS (Direct Attached Storage). Это хранилище данных, которое подключено напрямую к одному серверу или рабочей станции через интерфейсы, например SATA или USB. Такая система не зависит от сети и способна передавать данные на высокой скорости. Ее легко настроить и эксплуатировать.
Однако у DAS есть недостатки: она не подходит для совместной работы, так как подключается только к одному устройству. Кроме того, она недостаточно надежна: в случае сбоев сервера данные могут быть потеряны.
DAS оптимальна для фрилансеров и небольших компаний, где не нужна сложная инфраструктура и совместный доступ к данным.
NAS (Network Attache Storage). Это сетевые системы хранения данных: устройства подключены к локальной сети, а доступ к файлам осуществляется через сетевые протоколы NFS, SMB, FTP. Благодаря этому NAS могут одновременно использовать сотрудники различных подразделений и филиалов компании.
Данные в NAS хранятся только в файловом формате. Кроме того, производительность NAS определяется качеством сети: при слабом соединении скорость работы падает. Емкость хранилища зависит от числа отсеков — для бизнеса их нужно не меньше четырех. Если понадобится увеличить объем, можно добавить новые диски.
SAN (Storage Area Network). Это система, которая объединяет в единую сеть несколько устройств: хранилища данных, контроллеры, коммутаторы. Работает SAN отдельно от общей локальной сети.
У SAN несколько преимуществ: высокая скорость передачи данных благодаря выделенной сети, возможность масштабирования, надежность и отказоустойчивость. SAN больше подойдет средним и крупным компаниям, так как ее внедрение и эксплуатация стоят достаточно дорого.
Облачные СХД. В этом случае физическое оборудование находится у провайдера, а пользователи получают доступ к хранилищу через веб-интерфейс, приложения или API. Все данные в облаке провайдера резервируются, а СХД размещены в охраняемых ЦОД.
Такое решение используют как небольшие компании, так и крупный бизнес. Организация не тратит деньги на покупку и обслуживание своего оборудования. При необходимости объем хранения можно увеличить в панели управления за пару кликов.
По типу работы с данными
Файловые хранилища. Данные в них хранятся в формате файлов и папок, которыми могут управлять пользователи: создавать новые, перемещать, пересылать или удалять. Для передачи данных используют протоколы NFS (Network File System) для UNIX/Linux-систем и CIFS (Common Internet File System) для систем Windows. Такие хранилища подходят для фрилансеров и небольших компаний. С их помощью сотрудники могут совместно работать с документами и обмениваться информацией.
Однако файловые хранилища сложно масштабировать. Когда увеличивается объем данных и усложняется иерархия, то работа системы замедляется. Поэтому такой тип редко используют в дата-центрах, где важна скорость обработки данных.
Блочные хранилища. Данные в них хранятся в виде блоков фиксированного размера, у каждого из которых есть свой адрес. Блоки работают независимо друг от друга, их легко добавлять, чтобы увеличить объем хранилища.
Хранить данные в блоках можно в любом формате. Такие системы подходят, например, для размещения баз данных: в них можно редактировать файлы, разграничивать права доступа для разных категорий сотрудников. Можно выбрать вариант, который больше подойдет для конкретных бизнес-задач.
Объектные хранилища. При таком типе хранения каждая единица информации — это отдельный объект со своим идентификатором и метками. Найти файл можно быстро, так как у каждого есть подробное описание. Это делает управление большими объемами информации удобным и эффективным.
Объектные системы легко масштабировать. У нас в EdgeЦентр есть объектное хранилище S3, которое позволяет быстро увеличить объем данных до десятков петабайт. В нем удобно хранить сайты, резервные копии, документы, статистику, медиаконтент. Вы можете протестировать хранилище: предоставляем бесплатный пилотный доступ и 100 ГБ трафика на 2 недели.
На что обращать внимание при выборе СХД для бизнеса
При выборе подходящей СХД нужно определиться с количеством сотрудников, задачами компании и планами развития. От этого будет зависеть устройство системы и ее стоимость.
Стоит учесть следующие критерии:
- Емкость. Определите, какой объем данных для хранения необходим компании — от этого будет зависеть выбор дисковых накопителей. Фрилансеру или небольшому бизнесу достаточно 1–4 ТБ, а средним и крупным компаниям нужны десятки или сотни терабайт.
- Производительность. Обратите внимание на скорость обработки запросов на чтение и запись, пропускную способность, задержку и количество операций ввода-вывода в секунду (IOPS). Высокая производительность СХД необходима компаниям, которые работают с большим объемом трафика или с приложениями в реальном времени. Например, для маркетплейсов и сферы финансовых технологий подойдет хранилище на SSD с увеличенным значением IOPS — 60 IOPS на 1 ГБ.
- Отказоустойчивость. При выборе СХД проверьте, есть ли у нее встроенные механизмы безопасности, резервного копирования и восстановления, а также возможность горячей замены комплектующих без остановки оборудования.
Если выбираете СХД в облаке, посмотрите SLA провайдера. Высокий уровень отказоустойчивости поможет снизить риск потери важных для организации данных. Надежность и доступность в первую очередь важна бизнесу, который работает с клиентами круглосуточно. Для таких компаний особенно важен уровень надежности ЦОД, в котором провайдер размещает оборудование. Лучше, если это будет Tier III — отказоустойчивость в них достигает 99,982%, а время простоя не более 1,6 часа в год. Подробнее об уровнях ЦОД можно прочитать в нашей статье.
- Масштабируемость. Учитывайте не только текущие потребности бизнеса, но и планы на развитие. Выясните, насколько легко можно масштабировать СХД в будущем. Например, поддерживает ли архитектура различные типы дисков, можно ли добавить новые диски или контроллеры.
- Совместимость. Важно, чтобы СХД была совместима с уже существующей IT-инфраструктурой: серверами, ПО, сетевыми устройствами. Для устаревшей инфраструктуры подобрать современную СХД будет сложно. Например, интерфейс SATA не подойдет для быстрых твердотельных накопителей: он не позволит реализовать их скорость. Также система хранения данных должна поддерживать необходимые протоколы, например NFS, SMB, iSCSI.
- Стоимость покупки и владения. Рассчитайте, что для вас будет выгоднее: купить, обслуживать и регулярно обновлять собственную СХД или арендовать хранилище в облаке с ежемесячной оплатой.
Если вы хотите оптимизировать хранение данных и обеспечить к ним надежный доступ, оставляйте заявку — специалисты EdgeЦентр подберут оптимальный сервис, рассчитают цену и помогут интегрировать облачное хранилище в вашу IT-инфраструктуру.