HFLabs добавил в CDI «Единый клиент» новый уровень надежности. Теперь бизнес убережется от скандалов из-за слияния клиентских карточек разных людей и утечек личных данных. А еще получит больше полезной информации о клиентах.

Подключив обновление, один из наших заказчиков уменьшил «серую зону» с данными физлиц на 3,5 млн карточек.

Что изменилось в новом алгоритме слияния

Новый механизм ищет противоречия в момент слияния вроде бы похожих карточек. И гарантирует, что «Единый клиент» не объединит данные разных людей.

А еще новшество уменьшит «серую зону», где информация о клиентах пылилась в ожидании ручного разбора. С механизмом проверки на противоречия «Единый клиент» автоматически сольет дубли по десяткам новых правил. Раньше объединять данные по ним было опасно.

Например, до обновления «Единый клиент» не сливал вероятные дубли по правилу «Карточки — дубли, если фамилия, имя и адрес совпадают, а даты рождения не противоречат».

Идея объединить карточки по этому правилу хороша, но есть риск. Например, возьмем три записи о клиентах, где точно есть фамилия, имя и адрес — правило будет смотреть на них. А еще в карточках отмечены два дня рождения и два отчества. По правилу «Карточки — дубли, если фамилия, имя и адрес совпадают, а даты рождения не противоречат» клиент 1 похож на клиента 3 и клиент 2 похож на клиента 3.

Но сливать эти карточки нельзя — это точно разные люди: 50-летний Александр Петрович и 18-летний Александр Иванович

Если бы «Единый клиент» слил карточки, тогда Александр Иванович внезапно увидел бы счет Александра Петровича в банковском личном кабинете.

Или Александр Петрович, владелец скидочной карточки торговой сети, обнаружил, что получил доступ к карте лояльности Александра Ивановича. Это утечка личных данных и репутационный скандал для бизнеса.

Чтобы снизить риски, компании предпочитали отправлять вроде бы похожие карточки в «серую зону», где они ждали дата-стюардов. Но, как рассказывают коллеги, в 19 из 20 случаев предполагаемые дубли оказывались реальными. Ради 5% проблемных карточек дата-стюарды руками подтверждали 95% записей, которые могла бы слить автоматика.

Теперь «Единый клиент» видит данные в примере с тремя Францами так, как показываем на картинке. И автоматически блокирует слияние карточек.

Таких похожих, но на самом деле разных, «Францев» в клиентских базах немного, но раньше их нельзя было найти автоматически

Примеры правил, по которым CDI теперь сливает дубликаты автоматически:

  • «Фамилия, имя, отчество и телефон совпадают, даты рождения похожи».
  • «Фамилия, имя, отчество и адрес совпадают, год рождения совпадает».
  • «Фамилия, имя, даты рождения и телефон совпадают, отчество у одного пустое».
  • «Фамилия, имя и емейл совпадают, отчество у одного пустое, дата рождения хотя бы у одного пустая».
  • «Фамилия, даты рождения и хотя бы один адрес совпадают. Имя и отчество представлены инициалами или инициалы совпадают с полными значениями».

С новым механизмом «Единый клиент» автоматически сливает дубли по десяткам новых правил, уменьшая «серую зону». Подключив обновление, бизнес получит информацию о клиентах, которая раньше ждала решения дата-стюардов. И сэкономит на ручной проверке.

Как получить обновление

Описанная функциональность появляется автоматически, в момент обновления «Единого клиента». Правила поиска противоречащих данных разрабатываем для каждого заказчика индивидуально за деньги. Стоимость зависит от количества правил.

Узнать больше