0
Completed

Краткий анализ пробного разбора 100 адресов

Anonymous 4 years ago in Стандартизация • updated by Антон 4 years ago 4
Добрый день. Выполнил пробный разбор выборки в 100 адресов из большего спискадля предстоящей нормализации по КЛАДР или ФИАС. Осознанно была сделана выборка не самых непростых адресов. В целом сервис справился очень хорошо. Но есть несколько замечаний:
1. Игнорируется абонентский ящик в адресе. Хотя и восстанавливается индекс главпочтамта соответствующего населенного пункта.
2. Cправляется не с каждой нумерацией домов и помещений. Например, диапазон помещений 1-20 разобирается как к 1, кв 20, если перед ним есть номер дома 
3. В возвращенном файле не разделены по разным полям улица, дом, корпус, квартира и район, город, населенный пункт. Было бы удобнее

Спасибо

Answer

Answer
Completed
Добавили коды ФИАС, поле fias_id. По нумерации домов многое улучшили. Если у вас есть какие-то конкретные проблемные примеры, пишите.
Planned
Добрый день! Спасибо за обратную связь.

Действительно, сейчас есть проблемы с распознаванием диапазонов домов и абонентскими ящиками. До конца года будет крупное обновление адресного парсера, в котором эти проблемы решены.

Что касается гранулярных полей адреса, то они отдаются при работе через API.
И вам доброго дня.
Спасибо за ответ. 
Попутно возникла еще пара вопросов -
Можно ли получать в ответах на запросы коды адресов по ФИАС, то есть чтобы в них присутствовал также код внутригородского района и код округа в составе субъекта РФ? И уточнить хотелось бы по поводу e-mail адресов - сервис осуществляет какой-то разбор (контроль качества) и их тоже? Если да, то как будет тарифицироваться разбор списка e-mail в одной строке, относящегося к запросу по одному адресу и персоне?
Коды адресов по ФИАС сейчас, к сожалению, не подключены, но они есть у нас в планах.

Насчет email: по ним проводится исправление некоторых распространенных опечаток, проверка на корректность формата и на существование домена первого уровня.

Можно обрабатывать несколько email за один запрос, но для этого их нужно подавать в отдельных полях. Например:
{
  "structure": [ "EMAIL", "EMAIL" ],
  "data": [[ "anton@yandex/ru", "marina@mail.ru" ]]
}

Результат:
{
    "structure": [
        "EMAIL",
        "EMAIL"
    ],
    "data": [
        [
            {
                "source": "anton@yandex/ru",
                "email": "anton@yandex.ru",
                "qc": 0
            },
            {
                "source": "marina@mail.ru",
                "email": "marina@mail.ru",
                "qc": 0
            }
        ]
    ]
}
Тарифицируется как обычно: 10 копеек за запись (в примере выше 1 запись).
Answer
Completed
Добавили коды ФИАС, поле fias_id. По нумерации домов многое улучшили. Если у вас есть какие-то конкретные проблемные примеры, пишите.