Очистка фамилии, имени, отчества

По мере роста компании валидация клиентских данных становится всё более важной и, во многих случаях, критической задачей. Пользователи могут представляться, как им вздумается, операторы совершают ошибки при вводе, данные из разнородных источников имеют разную структуру, - все это приводит к тому, что база ФИО хранит множество разнородной информации, слабо пригодной для дальнейшего использования.

Очистка ФИО упростит как ведение отчетности, например, при формировании документации можно автоматически вставлять ФИО в нужных падежах в шаблон договора, так и повысит лояльность клиента к компании, например, письма при адресной рассылке будут иметь правильное обращение по имени, без опечаток и канцелярского «Уважаемый(ая)».

Импорт данных: в поле DATA — исходные данные
Решение: сценарий по очистке ФИО
Результат: очищенные данные с детализацией

Очистка

  • Разделение нескольких ФИО в одной строке.
  • Выделение обращения.
  • Выделение тюркских отчеств.
  • Выделение дополнительной информации из фиксированных разделителей.
  • Добавление пробела между сцепленными компонентами.
  • Замена цифр на буквы.
  • Замена букв другого языка.
  • Выделение инициалов.
  • Проверка компонент ФИО по справочникам.
  • Проверка ФИО по шаблонам.
  • Восстановление полного имени по сокращенному.

Обогащение

  • Восстановление пола по компонентам ФИО.
  • Восстановление пола по тюркскому отчеству.
  • Восстановление пола по обращению.

Результат

  1. Выделенные:
    • фамилия,
    • имя,
    • отчество.
  2. Инициалы.
  3. Пол.
  4. Информация о точности определения ФИО.

Ограничения

  • Написание на русском или английском языках.
  • Справочники по фамилиям, именам и отчествам для народов стран СНГ.

results matching ""

    No results matching ""