Закрыто

X-Parser Light – парсер контента по списку ключевых слов (авг 2014) [Повтор-7]

Тема в разделе "Скрипты и программы", создана пользователем Брат, 15 авг 2014.

Цена: 13500р.
Взнос: 1023р.
88%

Основной список: 16 участников

Резервный список: 1 участников

Статус обсуждения:
Комментирование ограничено.
  1. 15 авг 2014
    #1
    Брат
    Брат ОргОрганизатор

    Складчина: X-Parser Light – парсер контента по списку ключевых слов (авг 2014) [Повтор-7]

    X-Parser Light – универсальный парсер контента(текстов) для дорвеев и СДЛ

    X-Parser Light – это универсальное средство для сбора тематического контента по спискам ключевых слов в любых объемах и для любых задач. Он отлично подходит для работы с генераторами дорвеев, а также автопостерами в различные CMS. Кроме того, продукт может быть использован для сбора исходников под рерайты или материалов для наполнения СДЛ.

    [​IMG]

    При тестировании парсер показывает скорость до 1 мегабайта в минуту, что эквивалентно 1.5 гигабайта в сутки. Собираемый контент отлично подходит для наполнения дорвеев. Если нужно наполнять сайты, требующие более чистого и качественного контента, например СДЛ, можно рассчитывать на 80-90% абсолютно чистых статей. Для фильтрации и обработки контента предусмотрен встроенный менеджер обработки контента.
    X-Parser работает многопоточно. Количество потоков задаете Вы сами. Имеет удобный интуитивно понятный интерфейс и при этом очень гибок в настройке. Все настройки могут сохраняться, как отдельно так и все вместе для максимального удобства работы.

    Возможности X-Parser Light:
    • Автоматическое распознавание тела статьи на любой странице любого сайта (если таковая там имеется))).
    • Удобный редактор для ручной проверки отпарсенного контента при помощи менеджера обработки контента.
    • Возможность парсить контент без разметки (под генераторы дорвеев и т.п.)
    • Возможность парсить контент с формированием базовой разметки на базе исходной разметки донора (выделения, заголовки и т.п.).
    • Возможность на стадии сбора контента фильтровать как статьи, так и отдельные абзацы по собственным фильтрам.
    • Возможность проверки статей на наличие целевого кейворда в теле статьи.
    • Добавление любых поисковых систем для парсинга исходных ссылок.
    • Настройка всевозможных форматов вывода статей для дальнейшего экспорта контента в любые программы для автопостинга контента.
    • Возможность парсить контент на любых языках.
    • Автоматическое определение капчи поисковых систем. Т.е. не зависимо от того какую ПС вы добавите, парсер самостоятельно определит страницу с капчей и отправит ее на Antigate либо предложит ввести ее вручную, в зависимости от выбранных настроек.
    Парсер постоянно обновляется, все обновления в рамках Light-версии бесплатны.
    ВНИМАНИЕ!
    Продукт приобретается официально у автора по фиксированной (оптовой) цене со скидкой для складчиков! Вам будут доступны все официальные обновления от автора!

    Стоимость лицензии - 900 рублей (официальная цена ~2 000 руб.) = скидка 55 %
    Взнос - фиксированный, с учетом интересов клуба ~1 023 руб.

    ! Не менее 10 чел. !

    !!! БОНУС !!!

    Участникам складчины - будет выдана бесплатно лицензия на расширенную версию программы Penguin.

    Penguin – это система обработки баз ключевых слов, служащая для обработки текстовых файлов больших размеров (до терабайта). Под обработкой подразумевается возможность осуществления выборок по ряду условий, фильтрация этих выборок от любого мусора, сортировка, перемешивание, удаление явных и неявных дублей строк, поиск дубликатов строк, осуществление поиска, замены и т.п.

    Стоимость расширенной версии составляет 10$.

    [​IMG]
    Области применения Penguin:
    • Основной, но далеко не единственной, областью применения Penguin является подбор ключевых слов из текстовых баз (файлов), подобных Базе Пастухова, которые можно найти в свободном доступе в сети.
    • Так же он будет полезен, если возникает необходимость извлечь нужные данные из любого списка или файла, или очистить его от ненужных элементов.
    • Вполне возможно применение Penguin для очистки отпарсенного контента от дублей и любого мусора, что бывает необходимо при подготовке текстов под доргены.
    Какие задачи может решать Penguin:
    • Открывать и просматривать контент больших текстовых файлов (1-2000Gb).
    • Производить выборки по ряду условий из текстовых файлов любых размеров со скоростью порядка 1 гигабайта в минуту.
    • Производить фильтрацию строк или кейвордов по включениям. Т.е. задав в качестве включения слово "Скачать" Вы получите все строки, которые содержат данное слово. Возможно задавать несколько включений одновременно, можно использовать регулярные выражения.
    • Производить фильтрацию строк или кейвордов по исключениям. Т.е. задав в качестве включения слово "Бесплатно" Вы получите все строки, которые не содержат данное слово. Возможно задавать несколько включений одновременно, можно использовать регулярные выражения.
    • Производить фильтрацию фильтрации строк или кейвордов по дублям слов (в расширенной версии).
    • Фильтровать строки по длине.
    • Фильтровать строки по количество слов.
    • Удалять явные дубли.
    • Удалять неявные дубли (в расширенной версии).
    • Находить дубли. Актуально, если нужно найти пересечения в нескольких списках любых строк или кейвордов (в расширенной версии).
    • Производить поиск нужных элементов каждой строки с помощью регулярных выражений. Например можно с легкостью из списка с данными клиентов извлечь список телефонов, задав 1 условие.
    • Производить поиск-замену, как с регулярными выражениями, так и без, в текстовых файлах неограниченных размеров.
    • Производить обработку одновременно нескольких файлов.
    • Производить выборку по разным включениям, сохраняя результаты в разные файлы, получая отдельные выборки по каждому условию за 1 проход (в расширенной версии).
    • Сохранять все настройки для повторного выполнения однотипных обработок.


     
    Последнее редактирование: 9 окт 2014
    1 человеку нравится это.
  2. Последние события

    1. skladchik.com
      Складчина закрыта.
      18 окт 2014
    2. Alseo
      Alseo участвует.
      9 окт 2014
    3. skladchik.com
      Складчина активна.
      9 окт 2014
    4. belev
      belev участвует.
      8 окт 2014

    Последние важные события

    1. skladchik.com
      Складчина закрыта.
      18 окт 2014
    2. skladchik.com
      Складчина активна.
      9 окт 2014
    3. skladchik.com
      Сбор взносов начинается 08.10.2014.
      6 окт 2014
    4. skladchik.com
      Взнос составляет 1023р.
      6 окт 2014
  3. Обсуждение
  4. 6 сен 2014
    #2
    renessans
    renessans ДолжникДолжник
    ещё 3 человека )
     
  5. 17 сен 2014
    #3
    renessans
    renessans ДолжникДолжник
    при 10 вступивших есть возможность начать выкупать лицензии?
     
  6. 25 сен 2014
    #4
    quaesitor
    quaesitor ДолжникДолжник
    На какие реквизиты оплату вносить ?
     
  7. 1 окт 2014
    #5
    X-Software
    X-Software СкладчикСкладчик
    Вышли новые обновления. Актуальная версия - 1.5.1. Внесены следующие изменения:
    • Обновлена система авторизации, исключена прямая зависимость от сервера авторизации. Теперь, если сервер недоступен приложение свободно запускается, не обращая на это внимания.
    • В связи обновлением системы авторизации имейте в виду, что при установке данных обновлений, Вам будет нужно переактивировать приложение. Для этого нужно как обычно указать свой код активации и ответить на секретный вопрос, который Вы указывали при предыдущей активации.
    • Добавлена поисковая система Webcrawler.com (EN), для сбора контента на английском языке
    • Добавлена поисковая система Hotbot.com (EN), для сбора контента на английском языке
    • Обновлена система автоматических обновлений
    • Обновлена форма "О программе"
     
  8. 2 окт 2014
    #6
    X-Software
    X-Software СкладчикСкладчик
    X-Parsr Light обновлен до версии 1.5.2.
    1. Добавлена возможность сохранения контента в файлах с различными расширениями, что позволяет настроить формат вывода абсолютно под любые нужды.
    2. Добавлен формат вывода полностью совместимый с TextKit
    3. Добавлен формат вывода в виде RSS-фида, что позволяет импортировать контент в любые движки, которые поддерживают импорт контента из RSS, например в такие, как DLE.
     
  9. 7 окт 2014
    #7
    Basill
    Basill ОргОрганизатор (А)
    X-Software Если есть Content Downloader X1 то данный парсер уже не нужен?
     
  10. 8 окт 2014
    #8
    X-Software
    X-Software СкладчикСкладчик
    Ну я не знаю там за X1, но CD и X-Parser выполняют совершенно разные задачи: CD - ручная настройка под каждый источник (универсально, но нужно настраивать и парсить можно только заданый источник), X-Parser - автомат, ничего не нужно настраивать - ввел ключи, получил контент со всех возможных источников без всяких настроек привязки к шаблону. Т.е. X-Parser сециализировано под это настроен. Что такое X1, я не в курсе, CD есть но я им не пользуюсь почти и давно не обновлялся. По отзывам покупателей лучше X-Parser для автоматического сбора статей по ключевым словам нет, так как такой автомат имеет достаточно сложный алгоритм (который трудно сделать), который выделяет тело статьи самостоятельно на любой странице любого сайта. В CD же все просто, вы указываете границы в теле документа и получаете содержимое внутри этих границ.
     
  11. 9 окт 2014
    #9
    Брат
    Брат ОргОрганизатор
    Участникам складчины - добавлен приятный бонус !!!
    Подробнее в шапке ....
     
    Последнее редактирование модератором: 9 окт 2014
  12. 15 окт 2014
    #10
    AmegA
    AmegA ЧКЧлен клуба
    Подскажите, пожалуйста...возможно ли записаться ? у меня при попытке записаться вылетает окно "Складчина остановлена." :(
     
    2 пользователям это понравилось.
Статус обсуждения:
Комментирование ограничено.