Очистка почтовых адресов России

Наличие базы правильных почтовых адресов позволяет существенно снизить издержки на почтовые рассылки, например, отправлять важную корреспонденцию без риска возврата ее от почтовых организаций, а также решить важные внутренние бизнес-задачи компании, например сегментировать клиентов по регионам и городам, что позволит проводить грамотный адресный маркетинг.

Очистка почтовых адресов актуальна в таких сферах бизнеса, как банковское дело, страхование, телекоммуникации, интернет-торговля, коллекторские услуги, сервисы доставки и многие другие.

Импорт данных: в поле DATA — исходные данные
Решение: сценарий с выгрузкой в Файлы Excel
Результат: очищенные данные с детализацией

Очистка

  • Выделение кода КЛАДР и ключа ФИАС.
  • Возможность вывода адреса с разбивкой по компонентам.
  • Приведение адреса к стандартному виду.
  • Восстановление полного адреса для адресообразующих элементов.
  • Актуализация адреса с учетом переименований.
  • Восстановление сокращенных названий, вариантов написания, синонимов.
  • Выделение номеров домов, квартир, строений, корпусов и т.д.
  • Исправление опечаток.
  • Определение степени уверенности в обнаруженном адресе.

Обогащение

  • Восстановление индекса до улицы.
  • Восстановление кода территориального участка инспекции Федеральной налоговой службы (ИФНС) физических лиц.
  • Восстановление кода территориального участка инспекции Федеральной налоговой службы (ИФНС) юридических лиц.
  • Восстановление кода участка Общероссийского классификатора объектов административно-территориального деления (ОКАТО).
  • Восстановление кода Общероссийского классификатора территорий муниципальных образований (ОКТМО).
  • Возможность выбора пользователем структуры очищенного адреса.

Результат

Все обработанные адреса будут разделены на 3 группы данных по степени пригодности их для дальнейшего применения. Каждой группе соответствует свой выходной набор данных:

  • Белая зона: записи, для которых определен адресообразующий элемент с наибольшей степенью соответствия выше установленного порога. Эти данные пригодны для использования без дополнительной обработки.
  • Серая зона: записи, для которых найдено несколько адресообразующих элементов, причем со степенью совпадения выше заданного порога (нельзя однозначно решить, какой из вариантов более корректный, поэтому требуется дополнительная обработка, либо определение правила разрешения конфликтов). А также, записи, для которых найден единственный адресообразующий элемент со степенью соответствия в диапазоне, не ниже 75% от заданного порога. Эти записи можно рассматривать, как найденные, но они не относятся однозначно к таковым, так как степень соответствия недостаточно высокая. Следовательно, высока вероятность некорректного разбора. Эти записи требуют дополнительного анализа.
  • Черная зона. Записи, для которых не найден однозначный адресообразующий элемент, или степень соответствия ниже заданного порога.

Ограничения

  • Названия на русском языке.
  • Только адреса России.

results matching ""

    No results matching ""