Подписчик нашего телеграм-канала поинтересовался, где найти теорию по MDM и CDI. Желательно книги.

Вопрос справедливый: кажется, что полезного в Сети маловато

На вопрос отвечает Михаил Берёзин, технический владелец CDI-платформы «Единый клиент» HFLabs.

«Современной литературы по MDM, системам управления мастер-данными, нет. Самые свежие книги вышли 10 лет назад. Для IT и работы с данными это вечность.

Поисковики тоже не помогают, можно сойти с ума от сотен близких терминов: Data Governance, Data Mesh, Data Fabric…

Каталог Modern Data Stack собрал под сотню инструментов по работе с данными. Кажется, маркетологам проще продавать MDM-системы, придумывая новые названия устоявшимся технологиям. Найти в этой мешанине терминов что-то полезное очень непросто.

И все же я знаю два способа разобраться в MDM».

Изучите основы работы с данными

Михаил советует книгу DAMA DMBOK (Data Management Body of Knowledge). Это свод знаний, где 300 экспертов Международной ассоциации управления данными (DAMA) описали 11 областей отрасли. Авторы сформулировали единые значения терминов и собрали основные принципы управления данными. Только нужно быть готовым, что в русском переводе почти 900 страниц.

Содержание DAMA DMDOK:

    1. Управление данными.

    2. Этика обращения с данными.

    3. Руководство данными.

    4. Архитектура данных.

    5. Моделирование и проектирование данных.

    6. Хранение и операции с данными.

    7. Безопасность данных.

    8. Интеграция и интероперабельность данных.

    9. Управление документами и контентом.

    10. Справочные и основные данные.

    11. Ведение хранилищ данных и бизнес-аналитика.

    12. Управление метаданными.

    13. Качество данных.

    14. Большие данные и наука о данных.

    15. Оценка зрелости управления данными.

    16. Организация управления данными и ролевые ожидания.

    17. Управление данными и управление организационными изменениями.

Читать DAMA DMBOK сложно. Вот выдержка из нее, для примера

DAMA DMBOK даст системное понимание, как устроена работа с данными. Некий «скелет», на который читатель затем нарастит  практический опыт. Хотя приземлять новые знания на уровень MDM-системы придется самостоятельно.

Где искать «мясо» для «скелета», рассказываем дальше.

Разберитесь, как «живые» компании работают с архитектурой данных

Подтягивать практику хорошо на примерах компаний, которые классно работают с данными. Пусть оценка «классно» субъективна, для начала этого достаточно.

Наблюдение — простейший способ понять назначение MDM-систем в разных организациях. И место, которое MDM занимает в  архитектуре корпоративной работы с данными.

Вот за какими компаниями следит Михаил.

  • Корпоративные блоги: Facebook, Uber, Amazon, Google, Netflix, Revolut, Vivid Money, Mail.ru, «Авито», «Циан», «Яндекс».
  • «Хабр», выступления на конференциях: Ataccama, Denodo, DIS GROUP, DBT, Informatica, IBM, Oracle, Snowflake, Segment, «Райффайзен», «Альфабанк», «Тинькофф», «Сбер», «Группа T1».

Что можно делать: следить за новостями компаний, слушать выступления на конференциях, читать блоги — на собственных сайтах или «Хабре». Разбирать внедрения, отслеживать кейсы, изучать документацию, смотреть демо продуктов и релизов. Наконец, искать доклады вендоров и компаний, которые используют MDM-решения. Это кладезь практических сценариев работы.

Самый быстрый способ разобраться в MDM — использовать оба метода одновременно. Изучать и теорию, и практику. Так получишь системные знания и заодно разберешься в практиках внедрения MDM-систем.

Что прочесть об MDM в блоге HFLabs:

А еще можно записаться на базовый офлайн-курс HFLabs «Клиентские данные в энтерпрайзе: от проектирования MDM-системы до Data Governance и аналитики». Подробности — на странице мероприятия в Timepad.