Как только компания начинает борьбу с дублями клиентов, всплывает проблема «серой зоны». «Серая зона» — это масса карточек, которые вроде бы похожи, но их «похожести» недостаточно для автоматического слияния.

Обычно «серую зону» разбирают вручную дата-стюарды, и дело это дорогое. Поэтому мы придумали, как уменьшить ее без вмешательства человека.

Новый способ сократить «серую зону» — удалить из нее антидубли. Антидубли — это карточки, которые лежат в «серой зоне» и формально могут описывать одного человека. Теперь по неким признакам «Единый клиент» понимает, что речь идет о разных клиентах, и удаляет такие записи из «серой зоны».

«Серая зона» мешает бизнесу

Обойтись без «серой зоны» не получится: например, разбирая обращение в техподдержку, вместе с карточкой клиента полезно изучить и похожие. Но и хлопот с «серой зоной» хватает.

Главная проблема: пока существует «серая зона», компания не знает, скольких клиентов обслуживает. Такое положение не устраивает аналитиков, маркетинг, менеджмент, да и вообще никого.

На количество клиентов часто завязаны ключевые бизнес-метрики. В страховой — среднее количество договоров на одного клиента. В телекоме — среднее количество рублей, полученных с абонента. Не зная количества клиентов, метрики не посчитать.

При этом разобрать дубль вручную — задача нетривиальная. Где-то понадобятся первичные документы, а где-то придется и с клиентом связаться. Ручной разбор — это дорого и долго.

В «серой зоне» нашего заказчика — крупного банка — лежал миллион клиентов. Проверить вручную такое количество карточек почти нереально. Никто не возьмет в штат столько дата-стюардов, сколько понадобится для этой работы.

«Единый клиент» находит антидубли, а затем исключает их из «серой зоны»

Поскольку дата-стюарды — это дорого, мы где можем сужаем «серую зону» без них. Но двигаться в сторону автоматического слияния похожих карточек — опасно. Нельзя объединять «на глазок», последствия могут быть болезненными.

Вполне вероятный исход при неаккуратном слиянии карточек — клиент увидит в онлайн-кабинете чужие счета, полисы, сим-карты. Такие скандалы попадают в прессу.

Но можно зайти с противоположной стороны: автоматически убирать из «серой зоны» тех, кто точно дублями не является. На этом направлении даже ошибка не повлечет опасных последствий. Выбрав вектор, мы взялись за антидубли.

Антидубли — это похожие карточки из «серой зоны», которые точно принадлежат разным людям. Мы добавили в «Единый клиент» новые правила, которые эти самые антидубли ищут. Вот что происходит с найденными карточками:

  1. Они покидают «серую зону» и не мешают считать клиентов.
  2. Уходят из фокуса внимания дата-стюардов.
  3. Не объединяются автоматически, если обе похожи на третью карточку.

Мы вписали антидубли в привычный интерфейс «Единого клиента» Для каждой карточки «Единый клиент» показывает антидубликаты на вкладке «Отклоненные дубли». Если нужно, дата-стюард отменит статус в два клика

Выискивая антидубли «Единый клиент» сравнивает телефоны, адреса, места рождения, паспорта клиентов. Позже я расскажу об этом в деталях — посвящу правилам поиска отдельный пост.

Подключаем антидубли как доработку

«Единый клиент», вооруженный новым набором правил, сузит «серую зону» компании. При этом совсем не нагружая дата-стюардов.

Мы уже внедрили новую технологию в крупном банке.

«Единый клиент» нашел в базе заказчика 53 273 антидубля. Так мы автоматически сократили «серую зону» банка на год работы дата-стюарда.

Подключаем как доработку: предварительно анализируем данные заказчика и полируем алгоритмы поиска. Если интересно, обращайтесь, все расскажем.

Узнать больше об антидублях