0
Answered

Почтовый индекс в запросе к Стандартизации

Relines LLC 1 year ago in Стандартизация • updated by Антон 1 year ago 5

Мы обрабатываем с помощью Стандартизации некую базу адресов, в которой отсутствует указание района, из-за чего часто мелкие населенные пункты выбираются Стандартизацией случайным образом из всех имеющихся с таким названием в стране. 


Чтобы решить эту проблему мы попробовали добавлять в строку запроса почтовый индекс, который в обрабатываемой базе присутствует. Кажется, что добавленный индекс часто работает хорошо.


Но есть следующие проблемы:

  • индекс, похоже, не является сильным фактором, поэтому он не "исправляет" ошибки в других частях строки, например: "Новоленинское, Краснодарский край, Россия 352741" (правильно: "Новоленинский" вместо "Новоленинское") НЕкорректно определяется как "Краснодарский край, г Сочи, снт Россия (с Богушевка)" с индексом 354002;
  • состоящая из одного только индекса строка целиком попадает в unparsed_parts.

Вопросы:

  • стоит ли добавлять индекс в строку ради улучшения качества распознавания, или это может привести к непредсказуемым результатам (например, из-за того, что крупному городу соответствует множество индексов);
  • можно ли как-то получать результаты только под одному индексу?


Answer

Answer
Under review

Добрый день! Индекс для Дадаты — вспомогательный фактор при распознавании адреса. Это связано с тем, что в индексах очень часто встречаются ошибки.


Если у вас есть индекс, вполне можно добавлять его к исходному адресу (лучше в начало строки). Хуже не будет.


По одному только индексу получить результаты нельзя.

GOOD, I'M SATISFIED
Satisfaction mark by Relines LLC 1 year ago
Answer
Under review

Добрый день! Индекс для Дадаты — вспомогательный фактор при распознавании адреса. Это связано с тем, что в индексах очень часто встречаются ошибки.


Если у вас есть индекс, вполне можно добавлять его к исходному адресу (лучше в начало строки). Хуже не будет.


По одному только индексу получить результаты нельзя.

Подскажите ещё такой вопрос: если  у города несколько индексов, какой индекс лучше указывать?

Тот, который соответствует улице и дому. Если улицы и дома нет — не имеет значения.