Thursday, 11 September, 2025г.
russian english deutsch french spanish portuguese czech greek georgian chinese japanese korean indonesian turkish thai uzbek

пример: покупка автомобиля в Запорожье

 

Настройка форматов URL для Datacol

Настройка форматов URL для DatacolУ вашего броузера проблема в совместимости с HTML5
Обычно на любом сайте присутствует 2 типа страниц: с одних мы собираем ссылки, с других мы собираем данные. Для примера сайта http://kolchaka.net/ . Допустим, мы хотим собрать с этого сайта полностью все посты (причем именно посты,а не анонсы). В данном случае главная страница сайта и страницы категорий (например http://kolchaka.net/category/parsery/ ) будут считаться страницами со ссылками (поскольку с них невозможно собрать данные в нужном на полноценном виде, зато можно собрать ссылки на посты, а также ссылки на другие страницы категорий со ссылками). С другой стороны страницы с постами (например http://kolchaka.net/parsery/datacol-vse-parsera-v-odnom/) будут представлять собой страницы с данными. С них можно собирать полноценные данные (например название и полное содержимое поста), которые нас как раз интересуют. Концепт форматов URL в Datacol позволяет указывать парсеру, какие страницы стоит считать страницами с данными, а какие страницы считать страницами со ссылками. То есть откуда собирать данные, а откуда ссылки. Подробнее на http://web-data-extractor.net/
Мой аккаунт