0
Under review

Задавать регионы на этапе определения полей для повышения количества распознанных адресов

Denis Peplin 5 years ago updated by Антон 5 years ago 7
Захожу на сайт, пробую загрузить в форму Exel адреса, получаю половину адресов мимо, большинство с пометкой "корректно".

Форма проверяет правильность ввода данных, корректно находит колонку с адресами, но не предлагает выбрать регион.

Взгляните на файлик, это наша реальная БД.
http://goo.gl/QvA3No

На самом деле, проблемы особой нет, я то регион укажу, когда буду регион править, но вот ваша форма... возможно, вам захочется ее исправить, предложить регион.
Under review
Денис, вы можете передавать регион в экселе отдельным адресным полем. А для текущего поля с адресом поставить галочку "Продолжение предыдущего". Тогда dadata будет разбирать ваши адреса с учетом региона. 

Это то, чего вам хотелось?
Нет. Мне эта форма вообще не нужна. Воспользуюсь API для корректировки. Я просто подумал, что вы этой формой показываете, как крут ваш алгоритм. И никак не предупреждаете, что результаты могут быть мягко говоря неудовлетворительны.  Если вас это устраивает - ок.
Денис, мы этой формой показываем предварительный результат обработки, чтобы пользователь оценил самостоятельно, крут ли наш алгоритм на его данных, или нет. 

Обычно процент распознавания составляет от 50 до 90% в зависимости от источника данных. Для вашего образца корректно разобрано (см. поле "Код проверки") 35 из 50 записей, это 70%.

На одних данных алгоритм может быть крут, на других - нет. Предпросмотр обработки первых 100 записей позволяет это оценить до оплаты. 

Если у вас есть пожелания по самому устройству формы - с радостью их выслушаем. Мы не поняли, в какой момент вы предлагаете вставить выбор региона - в момент обработки, если система не поняла регион, к которому относится адрес?



Система предлагает пользователю подтвердить правильность автоопределения полей. Вот в этот момент.
Спасибо за идею. Пока мы не хотим усложнять эту форму. Если будут аналогичные пожелания и много - подумаем, что сможем с этим сделать.
Итак, сформулирую идею - голосуйте, если она вам нравится. 

В "Фактор" можно задавать набор регионов перед обработкой данных — это бывает полезно при обработке адресов без городов и заметно повышает качество распознавания данных.

Можно добавить эту же возможность в дадату, на этапе автоопределения полей. 
Проголосовать за собственный топик не могу, но да, это именно то, что я имел ввиду.