Служба поддержки DaData.ru

Иногда мы отвечаем на ваши вопросы даже ночью. Угадайте, почему? Мы просто любим наш сервис и хотим, чтобы он развивался в исключительно хорошую сторону. А ваши вопросы очень помогают нам в этом.


Именно здесь вы можете помочь нам сделать DaData.ru лучше! Отправьте сообщение, и мы ответим вам в течение 1-2 дней (а может, уже и через час, если мы еще не уснули или не в кино :)


P.S. Оставляйте свои идеи — чего не хватает сейчас сервису. И голосуйте за чужие идеи. Чем больше голосов набирает идея, тем скорее мы ее делаем.

+1
На рассмотрении
Elena Zhuravleva 8 месяцев назад в Поиск дублей • обновлен Антон 8 месяцев назад 0

Очень затруднительно большую базу контактов выгружать в vcf затем конвертировать в csv и тд.

0
Отвечен
Андрей Горшков 1 месяц назад в Поиск дублей • обновлен Антон 3 недели назад 5

Воспользовались сервисом по поиску дублей. Есть несколько вопросов по файлу с результатами:

1. Можно ли в выгрузках адрес разбивать по полям: страна, регион, город, улица, номер дома, номер квартиры?
2. Можно ли для коммуникационных данных и дат рождения в заголовках полей указывать в общей склейки имя файла источника?

3. Можно ли настраивать алгоритм для определения похожих? Например, исключить из выборок людей с разными датами рождения и/или отчествами? Это существенно уменьшит объем работы для ручного разбора. Сейчас встречаются такие записи, которые однозначно нельзя объединять (но они помечены как похожие и выделены цветом):

Александров Виталий

Александров Виталий Евгеньевич 08.12.19ХХ

Александров Виталий Юрьевич 11.06.19ХХ



Ответ
Антон 3 недели назад

Андрей, спасибо большое за замечания! Действительно, отмечать как похожие такие совпадения (с заведомо разными отчествами и датами рождения) неправильно — исправим это. Думаю, тогда и настройка алгоритма не потребуется.


Насчёт понимания «какой емейл откуда взялся» тоже подумаю, как это можно сделать.


Я вижу, что вы в итоге сделали большую обработку 22 июня, на 700 тысяч записей. Что скажете о результатах? Какие ещё есть замечания?


Буду признателен, если вы напишете, как именно использовали результат обработки. Работаете с экселем? Загрузили в какую-то другую систему? Что дальше делаете с этими данными? В общем, хотел бы узнать ваш бизнес-процесс, чтобы понять, как сделать поиск дублей Дадаты более полезным.


Со своей стороны, предлагаю вам бесплатную повторную обработку по всем данным после того, как поиск дублей будет доработан ツ

0
Отвечен
asgolovin 4 месяца назад в Поиск дублей • обновлен Анастасия 3 месяца назад 2

Добрый день!

Я представляю финансовую организацию, и по нашей внутренней политике безопасности мы не имеем права передавать контактные данные клиентов во внешние системы. В связи с этим возник вопрос - есть ли возможность использовать сервис стандартизации профилей пользователей (Дубликаты), используя хэши емейлов и телефонов? Или может быть есть ещё какие-то варианты обойти ограничения безопасности (например, развернуть сервис на внутренних ресурсах Компании)?


Мы сейчас уже используем ваш сервис стандартизации адресов и сервис подсказок, но с ним всё проще - там нет критических персональных данных (телефонов и емейлов). Очень хотелось бы использовать и сервис по Дубликатам.

Ответ
Анастасия 3 месяца назад

Добрый день!


Мы свяжемся с вами по почте в ближайшее время.

Если удобно, уточните, пожалуйста, ваш контактный телефон.

0
Отвечен
Anji 7 месяцев назад в Поиск дублей • обновлен Антон 7 месяцев назад 2

Здравствуйте.


Возможно ли использование сервиса "Поиск дублей" на своем сайте? (т.е. не заходить на ваш сайт, а на своем сайте загружать файлы для обработки)

Ответ
Антон 7 месяцев назад

Добрый день! Такой возможности нет. А зачем она вам?

Ответ
Антон 8 месяцев назад

Дадата умеет делать примерно такую штуку.


Пусть у вас есть основная база в файле 1_Исходные.xlsx:

И дополнительная база в файле 2_Свежие.xlsx:


Вы прогоняете файлы через поиск дублей и получаете результат:


Дальше фильтруете по условию «1_Исходные.xlsx = да» и «2_Свежие.xlsx = пусто» и получаете только тех клиентов, которые есть в основной базе, и при этом отсутствуют в дополнительной базе. То есть то, что вас и интересует.


Но, к сожалению, сейчас Дадата не умеет искать дубли с учетом паспортов. Планируем добавить это в 2017 году.


Если будут поддерживаться паспорта, вам подойдет сценарий, как я его описал выше?

0
Отвечен
Кирилл Н 12 месяцев назад в Поиск дублей • обновлен Антон 12 месяцев назад 1

По какому/им алгоритмам происходит поиск дубликатов? Сравниваются только адреса, либо еще и юр.лица/названия?

Ответ
Антон 12 месяцев назад

Дадата не сопоставляет реквизиты компаний. Все остальные данные – адреса, ФИО, e-mail, телефоны, даты рождения – учитываются при поиске дубликатов.

0
Отвечен
Алена 12 месяцев назад в Поиск дублей • обновлен Антон 12 месяцев назад 1

Доброе утро!

Мы делаем сервис по геренации анкет для b2c сегмента. Каждое агенство сможет создать себе аккаунт и заводить в нем клиентов. Нам важна возможность, когда поиск совпадений будет производиться только на уровне аккаунта клиента, а не по всей базе целиком. Т.е. для нас как для владельцев сервиса, объединение клиентов (фамилий ) внутри нашей базы нужно. А вот в сервисе, который мы предоставляем агенствам нужен поиск только по анкетам данного агентства. Возможно ли такое использование вашего сервиса?

Ответ
Антон 12 месяцев назад

Здравствуйте! Да, возможно. Для этого достаточно агентству отправлять на поиск дублей только его клиентов (но не клиентов других агентств).


Технически, например, так:


1) Представитель агентства в вашей системе выгружает своих клиентов в файл. При этом клиенты других агентств не выгружаются.

2) Представитель агентства загружает этот файл в Дадату, получает файл с дублями.

3) Представитель агентства загружает результаты в вашу систему, где вы уже что-то с ними делаете.

0
На рассмотрении
Кирилл Н 1 год назад в Поиск дублей • обновлен Антон 1 год назад 2

Подскажите, пожалуйста, учитываются ли при поиске дубликатов другие параметры, например, юр лицо или название магазина/точки?

Причина вопроса: в одном адресе может быть несколько одинаковых магазинов, но если системе смотрит только по адресу, она схлопнет эти 2 магазина в 1.

Ответ
Антон 1 год назад

Сейчас одинаковые адреса объединятся в один. Названия магазина/точки не будут учитываться, но сохранятся: рядом с адресом на листе "После слияния" будет несколько полей с названиями. Юр. лица/названия магазинов мы пока не умеем учитывать, возможно позже этому научимся.



Сервис поддержки клиентов работает на платформе UserEcho