Не всегда Дадате удается однозначно распознать адрес. Иногда приходится делать допущения:


Исходный адрес Распознанный адрес Проблема
109341 ТВЕРСКАЯ ОБЛАСТЬ МОСКВА ВЕРХНИЕ ПОЛЯ 22\1-451 109341, г Москва, ул Верхние Поля, д 22/1, кв 451 Судя по всему, адрес московский. Но причем здесь Тверская область?
москва тверская-ямская 12 125047, г Москва, ул Тверская-Ямская 1-я, д 12 В Москве несколько Тверских-Ямских. Какую выбрать?
Санкт-Петербург невский 12, Связьинтерком 191186, г Санкт-Петербург, пр-кт Невский, д 12 Непонятно, что такое «Связьинтерком»
г. Москва, Хорошевское, Куусинена, д.11 г Москва, ул Куусинена, д 11 Непонятно, какую выбрать улицу — Куусинена или Хорошевское шоссе. Обе есть в Москве.

В таких случаях Дадата предлагает вариант разбора, но маркирует адрес как «Сомнительный» (столбец «Код проверки» в файле и поле qc = 1 в API). Сомнительные адреса лучше проверить вручную, чтобы убедиться, что Дадата не ошиблась в своих предположениях.


Если Дадата уверена в разборе, то код проверки — «Корректный» (qc = 0). Вероятность ошибки в корректных адресах — 1 на 10 000 адресов.

Как помочь Дадате правильно разобрать адрес

Чтобы увеличить процент уверенно распознанных адресов, вычистите из исходных данных любые слова, которые не имеют отношения к адресу (не тип и не название адресного объекта):

  • вспомогательные идентификаторы и коды;
  • названия организаций и ФИО контактных лиц;
  • номера телефонов.

Если Дадата всё равно неправильно разбирает адрес, и вы считаете, что случай очевидный — напишите нам. Мы отсматриваем все такие обращения и постоянно улучшаем алгоритмы.


---

Ключевые слова: некорректный парсинг, неправильный разбор адреса, ошибка распознавания адреса