Email-база невалида на 16кк записей

Тема в разделе "Бизнес и свое дело", создана пользователем Nopas, 5 дек 2014.

Статус обсуждения:
Комментирование ограничено.
  1. 5 дек 2014
    #1
    Nopas
    Nopas ЧКЧлен клуба
    Привет всем.

    Предлагаю вашему вниманию email базу адресов, содержащую:
    • баунсы (bounces) - 99%
    • жалобщиков (те кто жмут кнопку «спам») - 0,5%
    • абузеров и ящики-ловушки (те, кто жалуются хостинг-провайдеру) <0.01%
    Кол-во ящиков в базе на данный момент 16кк (около 16млн ящиков)

    Преимущества использования данной базы

    Когда вы удалите из своих баз плохие адреса, то получите следующие плюсы:
    1. вероятность попасть в папку спам снижается
    2. ваши ресурсы (сервера, время) не будут расходоваться на рассылку по плохим адресам, тем самым за тоже самое время вы отправите больше «более валидных» писем
    По мимо непосредственно баунсов, плюс в том, что в базе содержатся «абузеры» и ящики ловушки (те, что удалось вычислить), по которым вы теперь не будете рассылать ваши письма, тем самым повышая вероятность сохранить расходники на рассылку на более длительный срок.

    Ответы на вопросы

    Для чего нужна данная база?

    Если вы занимаетесь рассылками, то должны знать такое понятие как bounce (баунс) - отскок, отбив - ящик на который не получается отправить письмо. Сервер на который вы отправляете письмо в таком случае выдает ошибку.

    Когда кол-во таких ошибочных ящиков превышает заданный порог, то ваша рассылка может либо полностью улететь в спам, либо вообще перестать доставляться.

    Для того чтобы уменьшить количество баунсов и прочистить вашу базу вы сможете воспользоваться моей базой, просто сравнив списки.

    Из чего состоит база?

    База состоит на 99% из РУ ящиков
    mail.ru в базе 80-85%
    Остальное yandex, rambler, gmail и мелочь (корпы, ukr.net и тд)

    Откуда база?

    База создавалась мной лично в процессе многомиллионых рассылок.
    Чтобы создать данную базу были из расходованы сотни серверов и тысячи прокси.

    Гарантии? Как проверить базу?
    1. Проверка на невалидность. Берете рандомно ящики и вставляете их в поле кому (на mail.ru) и пытаетесь отправить - выйдет ошибка, что отправка на данные ящики невозможна
    2. Проверка на негенирированную базу. Берете любую базу, которую покупали здесь: смарт, джаст, 2гис, ламода, вайлдберис, купивип и тд и просто сравниваете с этими базами.
    Общий взнос 50.000 рублей

    В дополнение:
    1. Если интересно - могу отсортировать по доменам (mail.ru, rambler.ru и тд)
    2. Если вы владелец программы для рассылок AMS скину вам сам файл "списка исключений», (непосредственно и содержит эту базу) с инструкцией, как вы сможете заменить у себя этот файл в профиле программы. То есть вам не придется его загружать - экономия около 5-6 часов времени.
     
  2. 5 дек 2014
    #2
    analytic
    analytic ОргОрганизатор (А)
    Оригинально однако невалидную базу продавать=)
    п.с. баунсы (bounces) - это не обязательно отсутствие почтового ящика, просто для почтовых систем - источник рассылок может быть "уже под фильтром"
     
  3. 5 дек 2014
    #3
    Nopas
    Nopas ЧКЧлен клуба
    Это учитывается. AMS умеет определять по кодам-ответам по какой причине пришел баунс. Соответственно в базу заносятся только несуществующие-неработающие ящики, а не те, которые попали, например, для мейлру в 550-ую ошибку "spam message rejected"
     
  4. 5 дек 2014
    #4
    analytic
    analytic ОргОрганизатор (А)
    а какие там варианты кодов?
     
  5. 5 дек 2014
    #5
    Smart-PT
    Smart-PT ДолжникДолжник
    Интересно было бы, чтобы кто-то из проверяющих наложил эту базу хотя бы на те, что продавались здесь ранее.
    Тогда будет ясно, сколько пользы от неё.
    Если она пересекается на доли процентов, то польза сомнительна.
    Банусы можно и так отсеять при собственной рассылке.
    Только существенное пересечение делает базу реально ценной.
    Но 16КК в масштабах рунета - не так и много, а вот 16КК дохлых почт (но встречающихся в базах) - вполне может быть и нормально.
     
    1 человеку нравится это.
  6. 5 дек 2014
    #6
    Nopas
    Nopas ЧКЧлен клуба
    Например,
    на несуществующий email следующее:

    user unknown
    mailbox unavailable
    mailbox disabled
    no such user
    does not exist
    unknown user
    unknown in virtual mailbox
    no mailbox here by that name
    message could not be delivered
    no mailbox by that name
    unrouteable address
    invalid recipient
    account disabled
    user unknown in virtual alias table
    user does not exist
    this account has been disabled or discontinued
    recipient rejected
    no existe
    recipient unknown
    permanent fatal errors

    На отвергнутый из-за спама:
    you are not allowed to connect
    mail from ip banned
    has been rejected due to the sending mta
    denied by policy
    rejected due to spam content
    message filtered
    spam message not queued
    message refused
    spam detected
    552 transaction
    5.7.1 message rejected
    554 5.7.1
    554 denied
    this message has been blocked

    Это только пример, на каждую группу по 100-200 подобных фраз приходится.
    Плюс я их периодически пополнял - но сейчас уже редко, так как новые почти не встречаются коды ошибок и ответы.

    16кк они итак встречаются в базах, при этом я даже указал в самом посте с какими базами можно сверятся:
    "Берете любую базу, которую покупали здесь: смарт, джаст, 2гис, ламода, вайлдберис, купивип и тд и просто сравниваете с этими базами."
     
    1 человеку нравится это.
  7. 5 дек 2014
    #7
    Smart-PT
    Smart-PT ДолжникДолжник
    Тогда интереснее в цифрах было бы, хоть это не так просто оценить. Ну там на такой-то базе такой-то процент баунсов всплывает, такое-то снижение рисков по рассылке.
    Я, кстати, не в курсе, какой процент является критическим.
    Или это от сервиса зависит, у каждого свои показатели?
    У меня, кстати, по своей небольшой рассылке процент отклонённых писем плавает на одной и той же базе, видимо, зависит от нескольких факторов.
    Ещё пока изучаю эту тематику, не понял всех тонкостей.
     
  8. 6 дек 2014
    #8
    Nopas
    Nopas ЧКЧлен клуба
    По заявлениям почтовых сервисов в среднем такой показатель от 5% до 7%. Точные цифры и алгоритмы, конечно, никто не скажет.
    В mailru данный показатель заявлен, как 5% Так же как и Амазона, если с него рассылать

    Цитаты с с сайта мейлру
    "Наличие в рассылках более 5% невалидных адресов может привести к попаданию писем, отправленных с вашего домена, в папку «Спам» или даже к полной их блокировке."

    "Cервисы, осуществляющие рассылки на основе подписки, должны безусловно удалять из базы подписчиков или принимать меры по приостановке рассылок на адреса, которые генерируют ошибку протокола SMTP: 550 user not found (отслеживание валидности базы получателей — необходимое условие для поддержания положительной репутации рассыльщика)."
     
    1 человеку нравится это.
  9. 12 дек 2014
    #9
    obscurity
    obscurity ЧКЧлен клуба
  10. 13 дек 2014
    #10
    analytic
    analytic ОргОрганизатор (А)
    1. Нет желания
    2. Нет времени
    3. Кропотливая проверка
    4. п.с. ИХМО спрос маленький на это.
     
  11. 25 дек 2014
    #11
    Master WOO
    Master WOO ЧКЧлен клуба (А)
    ИМХО:
    не вижу как проверяющие будут чекать это БД, как определить, что это база реально неликвида который проверили, а не тупо сгенерированные несуществующие ящики? написать программу которая будет генерировать несуществующие ящики, притом они будут "человекоподобные" дело одного часа

    Вижу только сравнение своего неликвида из покупных БД и данной БД, если все они пересекаются (или большая часть) то тогда можно говорить, что БД реально соотвествует описанию и чекалась на неликвид, в остальном случае, все это сомнительно.
     
    1 человеку нравится это.
  12. 13 янв 2015
    #12
    egovel
    egovel ЧКЧлен клуба
    Автор указал метод проверки:
    шаг 1) проверить, что ящики есть в купленных базах
    шаг 2) разослать по ним письма и получить 100% боунс

    Для автора. Могу предложить метод, как доказать актуальность и продать это.
    Сделайте, например, выборку невалидных адресов по базе джастклика, которые начинаются на букву "a".
     
  13. 29 авг 2015
    #13
    Denceo
    Denceo СкладчикСкладчик
    через епочту сделать пересечение займет пол часа по времени на такой объем базы и 3 клика по объему работы
     
Статус обсуждения:
Комментирование ограничено.