0
Fixed

Стандартизация распознает адрес только по специфической строке

Relines LLC 2 years ago updated by Антон 1 year ago 7

Исходная строка: "Россия Оренбургская Область, пос. Ростоши" распознается как "г Оренбург", что некорректно.

"Ростоши" — вообще не распознается.

Но "Ростоши микрорайон" распознается корректно.


Кажется, это стоит починить.

Answer

Answer
Fixed

Исправили кейсы:


Россия Оренбургская Область, пос. Ростоши

ВЕРХОЯНСКИЙ ЭСЕ-ХАЙЯ

Пермский край КУДЫМКАРСКИЙ Р-Н КУДЫМКАР

Пермский край КУДЫМКАРСКИЙ РАЙОН Г.КУДЫМКАР

КАНАШСКИЙ РАЙОН КАНАШ Г

Under review

Спасибо что сообщили! Дадата ориентируется на базу налоговой (ФИАС), в которой есть два посёлка Ростоши (видимо, ошибочно). Причём один из них в определённый момент превратился в Оренбург, что и сбивает с толку Дадату. Посмотрим, что можно сделать.

Еще пример.
"ВЕРХОЯНСКИЙ ЭСЕ-ХАЙЯ" распознает некорректно.
"ЭСЕ-ХАЙЯ" — все ок.

И еще:

"Пермский край КУДЫМКАРСКИЙ Р-Н КУДЫМКАР" — не распознает;
"Пермский край КУДЫМКАРСКИЙ РАЙОН Г.КУДЫМКАР" — не распознает;
"Пермский край КУДЫМКАРСКИЙ КУДЫМКАР" — нормально.

"Пермский край Б. СОСНОВСКИЙ РАЙОН ЧЕРНОВСКОЕ" — ок,
"Б. СОСНОВСКИЙ РАЙОН ЧЕРНОВСКОЕ" — почему-то его тянет в Нижегородскую область, хотя до населенного пункта дойти не может.

Во втором примере нет названия региона, а название района написано с ошибкой («б. сосновский» вместо «большесосновский»). Это слишком слабые признаки, чтобы определить адрес.

"КАНАШСКИЙ РАЙОН КАНАШ Г" — не ок;
"КАНАШСКИЙ РАЙОН КАНАШ" — ок.

Answer
Fixed

Исправили кейсы:


Россия Оренбургская Область, пос. Ростоши

ВЕРХОЯНСКИЙ ЭСЕ-ХАЙЯ

Пермский край КУДЫМКАРСКИЙ Р-Н КУДЫМКАР

Пермский край КУДЫМКАРСКИЙ РАЙОН Г.КУДЫМКАР

КАНАШСКИЙ РАЙОН КАНАШ Г