Вернуться   SEO форум - оптимизация и продвижение сайтов > SEO инструменты > Софт оптимизатора, SEO утилиты

Важная информация
Софт оптимизатора, SEO утилиты - Программы - создание, оптимизация, раскрутка и продвижение сайта. Софт для вКонтакте, Twitter, Facebook...

Закрытая тема
 
Опции темы Рейтинг: Рейтинг темы: голосов - 3, средняя оценка - 5.00. Опции просмотра
Старый 29.08.2013, 12:35   #1
 
Аватар для СТЕПАН
 
Сообщений: 1,639
FR (активность): 98,707

Доп. информация
Хорошо Автор темы Content Downloader VS Datacol Универсальный парсер

В этом обзоре речь пойдет о парсерах. На сегодняшний день существует огромное количество парсеров. И перед пользователем возникает вопрос: какой парсер использовать для решения своих задач?

Скорее всего, вы не раз встречали парсера, созданные для сбора данных с конкретных сайтов – например с популярных торговых площадок или интернет магазинов. Также существуют грабберы для сбора баз email, телефонов и т.п. В контексте данного вопроса, нельзя не упомянуть парсер контактов организаций с онлайн справочника 2Гис.

Но сегодня мы поговорим об универсальных парсерах.

В частности о двух из них, которые являются (по моему имхо) самыми лучшими в рунете: Content Downloader и Datacol.

Сриншоты:
Datacol
Content Downloader VS Datacol Универсальный парсер-dc1.png

Content Downloader
Content Downloader VS Datacol Универсальный парсер-cd1.png

Вопрос о сравнении этих двух продуктов неоднократно поднимался на форуме. Многим пользователям хочется узнать, в чем плюсы и минусы этих двух парсеров и какой лучше выбрать для решения своей задачи.

Я сам являюсь обладателем обоих парсеров и свободно ими владею. Поэтому ниже я постараюсь привести подробный объективный список их общих и отличительных характеристик.


Общая информация о Datacol и Content Downloader

Начнем с того, что это два самых популярных парсера рунета. Оба парсера являются универсальными. То есть, купив одну из программ, вы можете парсить не только определенные интернет магазины, форумы, блоги, но и настраивать сбор данных с любого интересующего вас вебресурса.

1) Сразу хочется отметить, что разработчики парсеров Content Downloader и Datacol поддерживают свой софт - регулярно выпускают обновления, устраняя найденные баги и добавляя новые функции. Таким образом, пожелания пользователей не остаются без внимания. Считаю, что это очень важный момент в развитии любого софта.

2) Оба парсера имеют форумы поддержки, где можно напрямую пообщаться как с разработчиками, так и с активными пользователями, которые не оставят ваш вопрос без ответа. По себе знаю, не всегда хватает прочтения справки – и форумы здесь очень кстати.

3) Мне часто задают вопросы, что такого может спарсить Content Downloader чего не может Datacol. По моему скромному мнению, в этом плане они аналогичны. По крайней мере, я не встречал задач парсинга, которые были бы однозначно нерешимы с помощью Content Downloader или Datacol.

4) Если сайты принимают меры для защиты от парсинга (например - известный гигант ucoz, который практически нереально быстро спарсить с 1 IP)то нам на помощь приходят прокси. Стоит отметить, что оба парсера отлично работают с прокси (Datacol также содержит встроенный проксичекер, хотя я все же приверженец платных анонимных прокси).

Отличия Datacol и Content Downloader

В чем основные приятные отличительные особенности Datacol от Content Downloader?

Datacol использует автоматический подбор формул вырезания данных (XPath выражений или Regex выражений), которые будут парсить нужный вам блок. При этом не нужно заморачиваться и искать подходящие теги в загруженном коде вебстраницы. Достаточно щелкнуть в помощнике правой кнопкой и программа все сделает за вас. Это упрощает жизнь новичкам, для которых исходный код страницы - темный лес. Благодаря данной функции с программой сможет справиться даже неопытный пользователь, который незнаком с html. Сразу оговорюсь, что автоматический подбор работает не в 100% случаев. У меня при настройке конкретного сайта 80% полей данных подбираются автоматически, а с остальными надо чуть пошаманить (хотя опять же, здесь нет ничего сверхсложного).

Количество потоков и одновременный запуск компаний. В политике Content Downloader предусмотрено несколько версий программы, которые отличаются по возможному количеству потоков (от 5 до 50) и соответственно по цене. В Datacol нет ограничения на количество потоков - сколько потянет ваш компьютер столько потоков и будет. Насчет одновременного парсинга 2х и более кампаний - в Datacol можно одновременно запускать несколько кампаний для парсинга. Однако и в Content Downloader есть решение.Если одновременно нужно парсить разные кампании, можно запустить вторую копию Content Downloader на своем ПК, проверено - работает отлично.


Дополнительные плюшки

Синонимайз. У Content Downloader на борту есть база синонимов SMARTREWRITER. В то же время Datacol содержит плагин синонимизации, но он платный. Стоимость плагина не высока, всего 15$, поэтому можно считать, что данная функция есть в обоих программах.

Парсинг 2Gis. В Datacol есть D5Plugin_2gis – плагин загрузки страницы 2gis с помощью браузера Chrome с поддержкой Javascript. Данный плагин бесплатный и идет сразу в комплекте с установленным парсером. Это готовое решение для парсинга организаций с ДубльГИС.

Лицензия на 2 и более ПК - как быть?

Разработчики Content Downloader предлагают возможность приобретения второго ключа на второй ПК всего за 387 рублей (данная возможность есть только на активацию второй лицензии, дабы избежать складчин), но и Datacol не отстает - при покупке второй лицензии, вы получаете скидку 25% от стоимости первой купленной лицензии. При покупке третьей лицензии, вы получаете скидку 20% от стоимости второй купленной лицензии

Демо-версия

Тут разработчики CD и Datacol позаботились о нас. У обоих продуктов есть демо-версия, которая позволит ознакомиться с программой, испробовать ее для решения конкретной задачи и только после этого принять осознанное решение о покупке программы.

Что проще в освоении?

Часто мне задают вопросы вроде такого: «Я новичок и не знаю программирования, что посоветуете?»

Для новичка однозначно проще в освоении будет Datacol. Он прост и понятен. Даже человек, который далек от программирования и HTML, быстро разберется как спарсить информацию с сайта

Content Downloader запросто освоит тот человек, который знает базовые основы HTML.

Чуть-чуть лирики

В любом случае, купив любой из вышеописанных парсеров, вы останетесь довольны! Что нужно для того, чтобы научиться парсить сайты?! Первое и самое важное - это желание, ведь, купив программу, которая будет лежать без дела, вы ничему не сможете научиться. Второе - наличие свободного времени на освоение функционала - примерно 3 часа для начала, в дальнейшем программа станет проще и понятнее. Тут главное понять сам принцип что, зачем и почему.

Итог:

Для того чтобы разобраться в том как работает Datacol у меня ушло примерно 3 часа (это без прочтения справки и форума). Сам интерфейс программы достаточно прост и интуитивно понятен. И вообще мануалы это не то, что нужно первым делом читать, все самому пробовать нужно, методом проб и ошибок =) Но насчет справки - есть отличные видео инструкции от самого разработчика Datacol на youtube канале (можете подписаться и получать обновления).

Разработчик Content Downloader создал раздел на сайте в виде вики справки, что тоже может помочь вам в освоении функционала программы. Освоение Content Downloader заняло 2 часа точно так же без прочтения мануалов, много кнопочек сначала отпугивают, но постепенно начинаешь привыкать и понимаешь, что за чем должно следовать.

В итоге сейчас отлично владею обоими парсерами и для конкретной задачи применяю тот, который быстрее справится (ну или как это обычно бывает тот который не занят).

Официальный сайт

Content Downloader http://sbfactory.ru/ & Datacol http://web-data-extractor.net/

Купить со скидкой парсер

Content Downloader и Datacol
Apelsex, Hifdin, kvantor и 2 еще: сообщение полезно
СТЕПАН вне форума  
Сказавших "Спасибо!": 10 (показать список)
Сказать Плохо за это бесполезное сообщение
Закрытая тема

Метки
content downloader, datacol универсальный парсер


Опции темы
Опции просмотра Оценка этой теме
Оценка этой теме:

Ваши права в разделе
Вы не можете создавать новые темы
Вы можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Datacol Универсальный парсер сейчас со скидкой в 30% СТЕПАН Софт оптимизатора, SEO утилиты 107 18.11.2014 16:29
[ Вопрос ] Как спарсить форум с Content Downloader Alexandr S Программы для создания сайтов 6 29.03.2013 21:48
[ Бесплатно ] content downloader nindia Почетные пользователи - скрытый раздел 5 08.03.2013 09:33

Текущее время: 21:48. Часовой пояс GMT +3.