Решение проблемы оптимизации корпоративных данных
Хаос неструктурированных данных обходится компаниям дороже, чем они предполагают. Об этом еще в марте текущего года заявлял генеральный директор NVIDIA Дженсен Хуанг, подчеркивая, что около 90% всех данных, генерируемых ежегодно, являются неструктурированными. По его словам, до настоящего времени эти данные были «совершенно бесполезны для мира».
Это утверждение подчеркивает серьезность проблемы. Показатель в 90% часто цитируется как отражение огромного объема электронных писем, изображений, видео, аудио и прочих материалов, которые компании создают и хранят, но которые сложно классифицировать или анализировать с помощью традиционных систем.
Очевидно, что если организации не могут использовать почти все генерируемые ими данные, они сталкиваются с существенным разрывом между объемом хранящейся информации и ее реальной ценностью. Причина «бесполезности» неструктурированных данных частично кроется в том, что традиционные инструменты управления и анализа плохо приспособлены для работы с ними. В результате многие компании до сих пор не могут ответить на базовые вопросы: какие данные у нас есть, где они хранятся, как используются и представляют ли какую-либо ценность?
Откладывание проблемы: дорогое удовольствие
Эти вызовы актуальны практически для любого бизнеса. Хорошим примером служит проблема прозрачности данных. Насколько эффективно типичная компания может отличить активные данные от неактивных или определить наиболее ценные, избыточные или устаревшие? Ответ таков: многие организации не способны это сделать, и чтобы обойти проблему, они предпочитают хранить практически все. Когда инфраструктура хранения данных начинает заполняться, они просто добавляют новые мощности. Откладывание решения проблемы управления данными на потом оборачивается огромными расходами на контроль и управление.
Помимо важной информации, организации почти неизбежно сохраняют значительные объемы неактивных или не имеющих ценности данных. Дополнительные затраты возникают из-за того, что эти данные часто размещаются на высокопроизводительных и дорогостоящих корпоративных системах хранения, что со временем может привести к серьезному росту расходов.
Однако проблемы на этом не заканчиваются. Без четкого определения владельцев данных и процессов их обработки и без того сложные задачи управления и соблюдения нормативных требований (комплаенс) становятся еще более острыми. Эта ситуация проблематична в любое время, но сейчас она особенно актуальна, учитывая экстремальную волатильность цен на хранилища. Ситуация требует изменений, и многим компаниям необходим стратегический сдвиг от хранения данных любой ценой к значительно большему фокусу на эффективности и грамотном управлении. В конечном итоге, бесконтрольное распространение неструктурированных данных не приносит никакой выгоды.
Превращая хаос в порядок
По мере роста объемов данных эти проблемы приобретают все большее значение, особенно потому, что ценность данных редко остается неизменной со временем. Во многих случаях период активного использования данных часто составляет всего 30–90 дней, после чего их актуальность начинает снижаться по мере появления новой информации. Многие компании также отмечают, что более 60% хранящихся данных не использовались и не изменялись в течение многих лет, но при этом сохраняются из-за отсутствия прозрачности или четкой политики управления.
Это подчеркивает необходимость управления данными на основе их жизненного цикла, при котором данные постоянно оцениваются и перемещаются, архивируются или удаляются в соответствии с определенными критериями, а не сохраняются бессрочно по умолчанию. Первым шагом к восстановлению контроля над управлением данными и расходами на ИТ-инфраструктуру является более глубокое понимание компаниями того, какие данные существуют в их среде. Также необходимы сведения о связанных метаданных, включая возраст, активность, владельца и другие ключевые теги.
Это позволяет отделить ценные данные от тех, что потеряли актуальность или больше не требуются. Именно это является основой для более уверенного и эффективного управления данными на протяжении всего их жизненного цикла, давая ИТ-командам возможность принимать обоснованные решения относительно хранения, архивирования и удаления. На протяжении всего этого процесса ключевыми факторами являются последовательность подхода и эффективное управление, поскольку в современных условиях, когда данные все чаще распределены между локальными серверами и облаком, фрагментированный подход может быстро стать неэффективным. Надлежащее управление помогает поддерживать порядок, определяя ключевые этапы и ответственность за информационные активы, в то время как последовательные политики управления обеспечивают обработку данных в соответствии как с операционными требованиями, так и с регуляторными обязательствами.
Поскольку сегодня многие компании глубоко зависят от данных, восстановление контроля над ценной информацией и уверенность в возможности архивировать и удалять то, что больше не требуется, должны стать операционным и финансовым приоритетом. При правильном подходе открываются реальные перспективы взаимовыгодного решения, где корпоративные данные не только лучше управляются, но и способствуют достижению финансовых целей.
