Собрали для вас топ-4 опасных, хотя вроде бы правильных, способов собрать больше данных. Десятки раз сталкивались с такими решениями у заказчиков — и ни разу эти методы не привели к хорошему результату.

❌ Сделать обязательными побольше полей в электронной форме

Наступает момент, когда бизнес замечает: люди регулярно пропускают какие-то поля в важной электронной форме. Например, при регистрации в личном кабинете или заявке на доставку товара. Это неудобно для компании.

Первая мысль, как решить проблему — сделать поля обязательными.

Поле «Улица» для адреса очень любят делать обязательным. И этому совсем не рады 250 тысяч жителей русской Кремниевой долины —Зеленограда. Потому что в Зеленограде нет улиц. Типичный местный адрес: 124123 г. Москва, г. Зеленоград, корпус 1234, кв. 123.

Часто в формах строго требуют номер дома. Но в России существуют адреса, где у домов нет номера. Например, в 30 километрах от МКАД стоит ЖК «Супонево». Его адрес — Звенигород, Супонево, корп 1. Только корпус, без дома.

Это густонаселенный 17-этажный дом, построенный в 2008 году

❌ Принимать только данные, совпадающие с эталонным справочником

Гипотеза такова: качество данных в базе вырастет, если клиенты перестанут опечатываться и вводить фейки. Увы, все работает наоборот.

Некоторые компании принимают только адреса, внесенные в государственные адресные реестры: ФИАС или ГАР. И отсекают таким образом честных клиентов.

Например, в государственном адресном справочнике отсутствует дом 5А стр. 1 на Березовой аллее в Москве. Хотя на самом деле здание с таким адресом существует.

Или вот дом по адресу город Павловский посад, улица Вокзальная, дом 3Б. Его достроили в 1996 году, но в реестр внесли только в 2016-м.

А жителям новостроек посвежее придется еще тяжелее — выше шанс, что система не примет их адрес.

❌ Задать побольше проверок при вводе

Казалось бы, хорошая мысль: качество данных вырастет, если верифицировать их на «настоящесть» с помощью маски. Частный случай: задать минимальное количество букв для каждого поля. Но нет, не работает.

Запрещать имена вроде Терминатор или Чебурашка — вредная затея. Если человек намеренно скрывает данные, он так или иначе обойдет ограничение. Например, вместо очевидного фейка введет Иван Иванов. Вычистить этот фейк сложнее и дороже, чем отловить «Чебурашек».

Требовать ввода в поле «Имя» не меньше трех букв — тоже обычная практика. И вот Ия не может купить сим-карту, а Ян — пройти онлайн-регистрацию на рейс.

❌ Ошибка-бонус: добывать информацию о клиентах из всех доступных источников

Кажется, что больше данных — это хорошо. Поэтому компании парсят соцсети и «серые» базы. А потом страдают.

Качество контактных данных в профиле пользователя соцсети сложно проверить. Профиль может быть устаревшим или вовсе фейковым. В результате, например, тот же маркетинг разорится на смс по непроверенным номерам.

Жадность при сборе данных — вообще больная тема. Настолько, что исполнительный директор HFLabs написал целую статью: «Больше — не лучше: почему непродуманный сбор клиентских данных может навредить бизнесу».

В мае мы проведем очередной поток офлайн-курса «Клиентские данные в энтерпрайзе: от проектирования MDM-системы до Data Governance и аналитики». Команда HFLabs упаковала в три дня все, что узнала за 10 лет работы с данными. Подробности — на странице мероприятия в Timepad.