Служба поддержки DaData.ru

Иногда мы отвечаем на ваши вопросы даже ночью. Угадайте, почему? Мы просто любим наш сервис и хотим, чтобы он развивался в исключительно хорошую сторону. А ваши вопросы очень помогают нам в этом.


Именно здесь вы можете помочь нам сделать DaData.ru лучше! Отправьте сообщение, и мы ответим вам в течение 1-2 дней (а может, уже и через час, если мы еще не уснули или не в кино :)


P.S. Оставляйте свои идеи — чего не хватает сейчас сервису. И голосуйте за чужие идеи. Чем больше голосов набирает идея, тем скорее мы ее делаем.

+1
Under review
Elena Zhuravleva 10 months ago in Поиск дублей • updated by Антон 10 months ago 0

Очень затруднительно большую базу контактов выгружать в vcf затем конвертировать в csv и тд.

0
Answered
Anonymous 2 months ago in Поиск дублей • updated by Антон 2 months ago 1

"Компания Лабмастер " ООО найти контактные телефоны .Фирма по старым контактам не отвечает

Answer
Антон 2 months ago

Простите, я не в курсе их контактных телефонов ツ

0
Answered
Андрей Горшков 3 months ago in Поиск дублей • updated by Антон 3 months ago 5

Воспользовались сервисом по поиску дублей. Есть несколько вопросов по файлу с результатами:

1. Можно ли в выгрузках адрес разбивать по полям: страна, регион, город, улица, номер дома, номер квартиры?
2. Можно ли для коммуникационных данных и дат рождения в заголовках полей указывать в общей склейки имя файла источника?

3. Можно ли настраивать алгоритм для определения похожих? Например, исключить из выборок людей с разными датами рождения и/или отчествами? Это существенно уменьшит объем работы для ручного разбора. Сейчас встречаются такие записи, которые однозначно нельзя объединять (но они помечены как похожие и выделены цветом):

Александров Виталий

Александров Виталий Евгеньевич 08.12.19ХХ

Александров Виталий Юрьевич 11.06.19ХХ



Answer
Антон 3 months ago

Андрей, спасибо большое за замечания! Действительно, отмечать как похожие такие совпадения (с заведомо разными отчествами и датами рождения) неправильно — исправим это. Думаю, тогда и настройка алгоритма не потребуется.


Насчёт понимания «какой емейл откуда взялся» тоже подумаю, как это можно сделать.


Я вижу, что вы в итоге сделали большую обработку 22 июня, на 700 тысяч записей. Что скажете о результатах? Какие ещё есть замечания?


Буду признателен, если вы напишете, как именно использовали результат обработки. Работаете с экселем? Загрузили в какую-то другую систему? Что дальше делаете с этими данными? В общем, хотел бы узнать ваш бизнес-процесс, чтобы понять, как сделать поиск дублей Дадаты более полезным.


Со своей стороны, предлагаю вам бесплатную повторную обработку по всем данным после того, как поиск дублей будет доработан ツ

0
Answered
asgolovin 6 months ago in Поиск дублей • updated by Анастасия 5 months ago 2

Добрый день!

Я представляю финансовую организацию, и по нашей внутренней политике безопасности мы не имеем права передавать контактные данные клиентов во внешние системы. В связи с этим возник вопрос - есть ли возможность использовать сервис стандартизации профилей пользователей (Дубликаты), используя хэши емейлов и телефонов? Или может быть есть ещё какие-то варианты обойти ограничения безопасности (например, развернуть сервис на внутренних ресурсах Компании)?


Мы сейчас уже используем ваш сервис стандартизации адресов и сервис подсказок, но с ним всё проще - там нет критических персональных данных (телефонов и емейлов). Очень хотелось бы использовать и сервис по Дубликатам.

Answer
Анастасия 5 months ago

Добрый день!


Мы свяжемся с вами по почте в ближайшее время.

Если удобно, уточните, пожалуйста, ваш контактный телефон.

0
Answered
Anji 9 months ago in Поиск дублей • updated by Антон 9 months ago 2

Здравствуйте.


Возможно ли использование сервиса "Поиск дублей" на своем сайте? (т.е. не заходить на ваш сайт, а на своем сайте загружать файлы для обработки)

Answer
Антон 9 months ago

Добрый день! Такой возможности нет. А зачем она вам?

Answer
Антон 10 months ago

Дадата умеет делать примерно такую штуку.


Пусть у вас есть основная база в файле 1_Исходные.xlsx:

И дополнительная база в файле 2_Свежие.xlsx:


Вы прогоняете файлы через поиск дублей и получаете результат:


Дальше фильтруете по условию «1_Исходные.xlsx = да» и «2_Свежие.xlsx = пусто» и получаете только тех клиентов, которые есть в основной базе, и при этом отсутствуют в дополнительной базе. То есть то, что вас и интересует.


Но, к сожалению, сейчас Дадата не умеет искать дубли с учетом паспортов. Планируем добавить это в 2017 году.


Если будут поддерживаться паспорта, вам подойдет сценарий, как я его описал выше?

0
Answered
Кирилл Н 1 year ago in Поиск дублей • updated by Антон 1 year ago 1

По какому/им алгоритмам происходит поиск дубликатов? Сравниваются только адреса, либо еще и юр.лица/названия?

Answer
Антон 1 year ago

Дадата не сопоставляет реквизиты компаний. Все остальные данные – адреса, ФИО, e-mail, телефоны, даты рождения – учитываются при поиске дубликатов.

0
Answered
Алена 1 year ago in Поиск дублей • updated by Антон 1 year ago 1

Доброе утро!

Мы делаем сервис по геренации анкет для b2c сегмента. Каждое агенство сможет создать себе аккаунт и заводить в нем клиентов. Нам важна возможность, когда поиск совпадений будет производиться только на уровне аккаунта клиента, а не по всей базе целиком. Т.е. для нас как для владельцев сервиса, объединение клиентов (фамилий ) внутри нашей базы нужно. А вот в сервисе, который мы предоставляем агенствам нужен поиск только по анкетам данного агентства. Возможно ли такое использование вашего сервиса?

Answer
Антон 1 year ago

Здравствуйте! Да, возможно. Для этого достаточно агентству отправлять на поиск дублей только его клиентов (но не клиентов других агентств).


Технически, например, так:


1) Представитель агентства в вашей системе выгружает своих клиентов в файл. При этом клиенты других агентств не выгружаются.

2) Представитель агентства загружает этот файл в Дадату, получает файл с дублями.

3) Представитель агентства загружает результаты в вашу систему, где вы уже что-то с ними делаете.

0
Under review
Кирилл Н 1 year ago in Поиск дублей • updated by Антон 1 year ago 2

Подскажите, пожалуйста, учитываются ли при поиске дубликатов другие параметры, например, юр лицо или название магазина/точки?

Причина вопроса: в одном адресе может быть несколько одинаковых магазинов, но если системе смотрит только по адресу, она схлопнет эти 2 магазина в 1.

Answer
Антон 1 year ago

Сейчас одинаковые адреса объединятся в один. Названия магазина/точки не будут учитываться, но сохранятся: рядом с адресом на листе "После слияния" будет несколько полей с названиями. Юр. лица/названия магазинов мы пока не умеем учитывать, возможно позже этому научимся.