Блог веб-студии

1
21Сентября2018 г.

Парсинги - какие могут быть трудности при работе с ними?

Автор: Игорь Яворский


Поскольку мы занимаем первые позиции в поиске по запросу "парсинг сайтов", и у нас их много в работе, мы постоянно сталкиваемся с одними и теми же заблуждениями наших заказчиков, некоторые из них разберем в этой статье.


Что такое парсинг?

Как правило - это копия какой-то части чужого сайта (донора) в Эксель и последующая заливка на ваш сайт (получатель).

В этой статье мы избежим правовых вопросов, упомянем только, что если это товары с типовыми описаниями производителя и фотографиями от него же, то вряд ли за такое вас кто-то засудит.

Так чем же тогда опасен парсинг, кроме возможных претензий от донора?

  1. Мы делаем полную копию чужого сайта. Ничего хорошего в этом нет, а есть признание Яндексом плагиата. Более того, наверняка перенесутся и всякие мелочи, типа метатегов с упоминанием сайта-донора или водяных знаков.
  2. Мы можем спарсить сайт, который нравится заказчику, но не нравится Яндексу. Тогда ситуация еще хуже. Например, сайта-донора нет в топе, или на нем вообще фильтр типа АГС. Получив такой контент, мы наследуем и проблемы донора.
  3. Если парсинги идут с нескольких сайтов, то возможно частичное дублирование. Например, на одном сайте-доноре есть Кирпич пустотелый, а на другом Пустотелый кирпич. Несмотря на то, что это один и тот же товар, в результате парсинга будет задвоение.
  4. Сайт-получатель не может принять результаты парсинга. Элементарно может быть, что у донора 5 фотографий товаров, а у получателя возможность разместить только 1.
Что с этим делать?

Попробуем взглянуть на проблему шире. Для чего делают парсинг? Его делают, чтобы быстро наполнить сайт товарами и потом запустить продвижение. Тогда, может, стоит начать сразу с продвижения? Вот алгоритм действий:

  1. Определите товары и категории, которые вам нужны и подберите донора, на котором они есть. Донор должен находиться по нужным вам товарным запросам в топе. Самое верное - собрать все нужные нам запросы, и подобрать более точно несколько доноров под разные товарные категории. Подробнее про сбор семантического ядра написано тут.
  2. Определите, будет ли ваш сайт повторять структуру донора, или будет следовать собранному семантическому ядру. Последнее - наиболее верно, если мы не хотим быть в положении вечнодогоняющего.
  3. Определите, как будет идти уникализация контента. Хотя бы изменим немного цены, подставим иные шаблоны для метатегов, и массово изменим заголовки h1. Это можно сделать после парсинга в csv.
  4. Убедитесь, что получатель в состоянии принять парсинг, что у него есть возможность показать все те характеристики, которые будут спарсены, и что у него корректно работает экспорт-импорт. Если нет - доработать сайт.
И только потом можно делать техническое задание, и сам парсинг.

Парсинг без продвижения - малополезен, вот основная мысль. Обращайтесь не к программистам, а к специалистам по продвижению, которые сделают парсинг под продвижение. Мы пока не встречали тех, кто делает всё вместе. Мы - можем. Мы знаем множество примеров сайтов, которые заливали к себе десятки тысяч позиций и это давало 10-20 посетителей в сутки естественного трафика, что является просто смешным для магазинов такого объема. А всё потому, что SEO-составляющая не бралась в расчет.

В заключение еще несколько полезных советов:

В каком случае НЕ надо делать парсинг?У вас менее 2000 товаров в сумме, или много доноров (например, один донор для 100 товаров, другой для еще 100, третий для 200 и т.д.).
Как подобрать донора для парсинга быстро?Выделите 3-4 самых главных для вас запроса и найдите в топе современно выглядящие сайты на позициях 1-3 места.
Как поставить задачу на парсинг так, чтобы вас поняли?Лучше всего так "я продаю ...., вот мой прайс-лист, и я хочу чтобы эти товары наименее затратным образом появились на моем сайте, и чтобы потом можно было продвигать их. И я хочу чтобы была настройка с сайтом поставщика для автоматической корректировки цен и наличия" (ну или автоматическое обновление не нужно). И вам нетрудно, и нам понятно.
Могут ли быть гарантии на парсинг, и какие?К сожалению, вообще никаких. Только в случае автоматического обновления можно на условиях техподдержки гарантировать, что мы исправим возможные проблемы.
Чем меньше доноров, тем лучше.Чем больше доноров - тем больше проблем пересечения товарного ассортимента.

Посмотреть описание услуги парсинга
Посмотреть про стоимость парсинга
Посмотреть про автоматическое обновление
Метки: Битрикс, Наполнение сайта, Парсинг, сайт
Array ( [0] => parsingi-rassmotrim-podvodnye-kamni [1] => sravnenie-bitriks-i-host-cms-dlya-internetmagazina [2] => chto-otvetish-ty-mne-yandeks-anons-eksperimenta- [3] => sravnenie-populyarnykh-shablonov-internetmagazinov-na-bitrikse-chast-1 [4] => kak-rabotat-s-personalnymi-dannymi-na-sayte-chtoby-izbezhat-shtrafa [5] => kak-proverit-pozitsii-sayta [6] => chto-takoe-umnyy-filtr [7] => tilda-ili-wordpress [8] => internetmagazin-arenda-ili-pokupka [9] => u-vas-dorogo [10] => lomat-ili-stroit [11] => trendy-2016-goda [12] => bitriks-malyy-biznes-ili-bitriks-biznes-chto-vybrat [13] => kak-vybrat-shablon-na-bitriks-marketpleyse [14] => kak-rabotat-s-zakazchikom-esli-vy-vebstudiya [15] => parsing-dlya-sayta-skolko-stoit [16] => iz-chego-skladyvaetsya-stoimost-sayta [17] => 5-oshibok-pri-sozdanii-sayta )