0
Fixed

Литера приклеивается к корпусу

DaData user 23244 2 years ago updated by Антон 4 months ago 9

Пробую распознать следующий адрес: 195027, Санкт-Петербург, Пискаревский проспект, дом 2, корпус 2, литера Щ отсюда(https://yandex.ru/company/contacts/spb/) - возвращает block_type = "к", block = "2щ", что неверно.

Answer

Answer
Fixed

Некоторое время назад исправили. Теперь в адресах с литерой вроде «195027, Санкт-Петербург, Пискаревский проспект, дом 2, корпус 2, литера Щ» литера не приклеивается к корпусу.

Under review

А почему это неверно? По-моему, «к 2щ» и «к 2 литер щ» — одно и то же.

Согласно описанию block_type (https://dadata.userecho.com/topics/1087-kakie-byivayut-tipyi-korpusov-i-stroenij/) литеры должны преобразовываться в строения, т.е. должно быть "к 2 стр щ"

Только если литер относится к дому. Если он относится к корпусу — литер приклеивается к корпусу.

Если так - тогда да, ошибки нет.

Правда тогда больше литеру не определить, ибо и корпус может быть буквенный и литера.

Это очень плохо для Питера. Но да, тогда не ошибка. Неверно понял документацию, спасибо за разъяснение.

Вам спасибо! В документации этот момент и не раскрыт, дополним. А чем плохо, что не отделить литеру от буквенного корпуса? К каким проблемам это приводит?

В Санкт-Петербурге есть несколько систем с открытыми данными (например http://data.gov.spb.ru/), у меня проект пользуется ими, но проблема в том, что в СПб с адресами все очень сложно - думаю Вы и сами это знаете. Так вот, адреcа в этих системах хранятся в нестандартизованном виде, но всегда с литерами и корпусами отдельно, я хотел использовать dadata для получения некого универсального среднего, разобранного по компонентам - тогда, зная их, можно всегда сформировать запрос к любой системе зная ее формат построения индекса.

На данный момент почти все так и есть, кроме вот этой литеры, увы.

Да, СПб в плане литер «особенный» город. Понял, спасибо большое за пояснение. Посмотрим, может в будущем получится что-то с этим сделать.

Answer
Fixed

Некоторое время назад исправили. Теперь в адресах с литерой вроде «195027, Санкт-Петербург, Пискаревский проспект, дом 2, корпус 2, литера Щ» литера не приклеивается к корпусу.