Назад к блогу

Как собирать данные о продавцах на Wildberries и Ozon: методы парсинга и обхода защиты

Полное руководство по сбору данных о продавцах на маркетплейсах: методы парсинга, выбор инструментов, настройка прокси и обход антибот-систем для мониторинга конкурентов.

📅25 января 2026 г.

Мониторинг конкурентов на маркетплейсах — ключевая задача для любого онлайн-продавца. Знание ассортимента, цен, отзывов и стратегий других продавцов позволяет принимать взвешенные решения и опережать конкурентов. В этом руководстве разберём практические методы сбора данных о продавцах на Wildberries, Ozon, Яндекс.Маркет и других площадках, а также способы обхода антибот-защиты.

Зачем собирать данные о продавцах на маркетплейсах

Сбор информации о конкурентах — это не просто любопытство, а необходимость для успешного ведения бизнеса на маркетплейсах. Вот основные причины, по которым продавцы регулярно мониторят других участников площадки:

Анализ ценовой политики конкурентов. Зная, по каким ценам продают аналогичные товары другие продавцы, вы можете корректировать свои цены для повышения конкурентоспособности. Многие успешные селлеры используют динамическое ценообразование — автоматически меняют цены в зависимости от действий конкурентов.

Изучение ассортимента и трендов. Отслеживание того, какие товары появляются у конкурентов, помогает выявлять новые ниши и растущий спрос. Если несколько продавцов одновременно добавляют определённую категорию товаров, это может сигнализировать о перспективном направлении.

Мониторинг отзывов и репутации. Анализ отзывов на товары конкурентов позволяет понять, что нравится покупателям, а что вызывает недовольство. Эту информацию можно использовать для улучшения собственных товаров и описаний.

Оценка стратегий продвижения. Изучение того, как конкуренты используют фото, описания, ключевые слова и акции, даёт идеи для собственных маркетинговых активностей. Особенно полезно анализировать успешных продавцов в вашей нише.

Поиск поставщиков и производителей. Иногда по данным о продавце можно выйти на общих поставщиков или понять, откуда конкуренты закупают товар. Это помогает оптимизировать собственную цепочку поставок.

Какие данные о продавцах можно собирать

Маркетплейсы предоставляют разный объём публичной информации о продавцах. Вот основные типы данных, которые можно собирать для анализа конкурентов:

Базовая информация о продавце: название магазина, рейтинг, количество отзывов, дата регистрации на площадке, юридическое лицо (если указано), контактная информация.

Ассортимент товаров: список всех товаров продавца, категории, бренды, артикулы, характеристики, фотографии, описания, наличие на складах.

Ценовая информация: текущие цены, скидки, история изменения цен, участие в акциях маркетплейса, цены с учётом промокодов.

Отзывы и рейтинги: количество отзывов по каждому товару, средний рейтинг, текст отзывов, фото от покупателей, ответы продавца на отзывы.

Показатели продаж: количество заказов (если доступно), динамика остатков на складе, популярность товаров, позиции в поисковой выдаче маркетплейса.

Разные маркетплейсы предоставляют разный уровень доступа к информации. Например, на Wildberries можно увидеть количество заказов за последнее время, а на Ozon эта информация скрыта. На Авито доступна история активности продавца, а на Яндекс.Маркет — подробные характеристики доставки.

Методы парсинга маркетплейсов: ручной vs автоматический

Существует несколько подходов к сбору данных о продавцах на маркетплейсах. Выбор метода зависит от объёма данных, частоты обновления и технических навыков.

Ручной сбор данных

Самый простой способ — вручную просматривать страницы продавцов и записывать нужную информацию в таблицу Excel или Google Sheets. Этот метод подходит для разовых исследований или анализа небольшого количества конкурентов (5-10 продавцов).

Преимущества ручного сбора: не требует технических навыков, не нужны дополнительные инструменты, низкий риск блокировки, можно собирать качественную информацию с учётом контекста.

Недостатки: очень медленно, трудозатратно, невозможно отслеживать изменения в реальном времени, высокая вероятность ошибок при ручном вводе, не масштабируется.

Готовые сервисы для парсинга

На рынке существуют специализированные сервисы для мониторинга маркетплейсов, которые предоставляют готовые решения для сбора данных. Примеры: MpStats, SellerFox, Moneyplace, DataOx, Price Tracker и другие.

Преимущества готовых сервисов: работают "из коробки", не требуют настройки, предоставляют аналитику и визуализацию данных, автоматически обходят защиту маркетплейсов, регулярно обновляются при изменении структуры сайтов.

Недостатки: ежемесячная подписка (от 2000 до 15000 рублей), ограничения по количеству запросов, собирают только стандартный набор данных, зависимость от стабильности работы сервиса.

Автоматический парсинг с помощью парсеров

Для тех, кто хочет полный контроль над процессом сбора данных, существуют специальные программы-парсеры. Они автоматически загружают страницы маркетплейса, извлекают нужную информацию и сохраняют её в удобном формате.

Популярные инструменты для парсинга: Octoparse, ParseHub, WebHarvy, Scrapy (для программистов), Selenium (для автоматизации браузера). Эти инструменты позволяют настроить сбор именно тех данных, которые нужны вам, без ограничений готовых сервисов.

Преимущества парсеров: гибкая настройка под любые задачи, можно собирать уникальные данные, нет ограничений по количеству запросов, единоразовая покупка или бесплатные решения, полный контроль над процессом.

Недостатки: требуется время на настройку, нужны базовые технические навыки, необходимо самостоятельно настраивать обход защиты, при изменении структуры сайта придётся корректировать настройки.

Как маркетплейсы защищаются от парсинга

Маркетплейсы активно борются с автоматическим сбором данных, так как массовый парсинг создаёт дополнительную нагрузку на серверы и может использоваться конкурентами. Вот основные методы защиты, с которыми вы столкнётесь:

Ограничение по IP-адресу. Самая распространённая защита — блокировка IP-адресов, с которых приходит слишком много запросов за короткое время. Wildberries и Ozon отслеживают частоту запросов и временно блокируют подозрительные IP на несколько часов или дней.

Капча и проверка на бота. При обнаружении подозрительной активности маркетплейс может показать капчу или страницу проверки "Вы робот?". Это останавливает автоматический парсинг до ручного решения капчи.

Анализ User-Agent и заголовков. Сайты проверяют, откуда приходит запрос — из браузера или от программы. Запросы без правильных заголовков (User-Agent, Referer, Accept-Language) часто блокируются автоматически.

JavaScript-защита и динамическая загрузка. Многие маркетплейсы загружают данные через JavaScript после открытия страницы. Простые парсеры, которые просто скачивают HTML, не видят эти данные и получают пустые страницы.

Honeypot-ловушки. На страницах могут быть скрытые ссылки, невидимые для обычных пользователей, но доступные парсерам. Переход по таким ссылкам идентифицирует бота и приводит к блокировке.

Изменение структуры HTML. Маркетплейсы периодически меняют названия CSS-классов и структуру страниц, чтобы сломать настроенные парсеры. Это требует регулярного обновления настроек сбора данных.

Выбор прокси для парсинга данных продавцов

Использование прокси — обязательное условие для успешного парсинга маркетплейсов. Прокси позволяют обходить ограничения по IP-адресу и делать запросы от имени разных пользователей. Выбор типа прокси зависит от задачи и бюджета.

Сравнение типов прокси для парсинга

Тип прокси Скорость Риск блокировки Цена Когда использовать
Прокси дата-центров Очень высокая Высокий Низкая Массовый парсинг с ротацией, сбор публичных данных
Резидентные прокси Средняя Низкий Средняя Парсинг с защитой от блокировок, длительный мониторинг
Мобильные прокси Средняя Очень низкий Высокая Парсинг с максимальной защитой, обход сложной защиты

Прокси дата-центров для парсинга

Это самый быстрый и дешёвый вариант для парсинга больших объёмов данных. Прокси дата-центров располагаются на серверах хостинг-провайдеров и обеспечивают высокую скорость загрузки страниц.

Когда подходят: для сбора публичных данных, которые не требуют авторизации; при использовании пула из 50-100+ IP с автоматической ротацией; для парсинга небольших маркетплейсов с слабой защитой.

Ограничения: IP дата-центров легко определяются маркетплейсами и чаще блокируются; Wildberries и Ozon активно фильтруют такие IP; требуется большой пул адресов и медленная скорость запросов.

Резидентные прокси для парсинга

Резидентные прокси используют IP-адреса реальных домашних интернет-провайдеров. Для маркетплейсов такие запросы выглядят как действия обычных покупателей, что значительно снижает риск блокировки.

Когда подходят: для регулярного мониторинга конкурентов на Wildberries и Ozon; при парсинге данных, требующих авторизации; для долгосрочных проектов с ежедневным сбором данных; когда важна стабильность и низкий риск блокировок.

Особенности использования: можно делать запросы медленнее, имитируя поведение реальных пользователей; подходят для парсинга через браузерную автоматизацию (Selenium, Puppeteer); обеспечивают доступ к региональным версиям маркетплейсов.

Мобильные прокси для сложных случаев

Мобильные прокси используют IP-адреса мобильных операторов. Это самый надёжный тип прокси для обхода защиты, так как маркетплейсы крайне осторожно блокируют мобильные IP — за одним адресом могут находиться тысячи реальных пользователей.

Когда подходят: при парсинге маркетплейсов с очень строгой защитой; когда другие типы прокси уже заблокированы; для сбора данных через мобильные приложения маркетплейсов; при необходимости максимальной надёжности.

Ограничения: более высокая стоимость по сравнению с резидентными прокси; обычно за одним IP находится несколько пользователей (shared IP); скорость может быть ниже, чем у проводных прокси.

Готовые сервисы и инструменты для сбора данных

Для тех, кто не хочет настраивать парсинг самостоятельно, существуют готовые решения. Рассмотрим популярные сервисы для мониторинга разных маркетплейсов.

Сервисы для Wildberries

MpStats — один из самых популярных сервисов для анализа Wildberries. Позволяет отслеживать продажи конкурентов, мониторить цены, анализировать отзывы и находить перспективные ниши. Стоимость от 3990 рублей в месяц. Предоставляет готовые отчёты и графики, не требует технических навыков.

SellerFox — сервис с фокусом на аналитику продавцов. Показывает динамику продаж, остатки на складах, историю цен. Есть функция отслеживания конкретных продавцов и уведомлений об изменениях. Цена от 2500 рублей в месяц.

Moneyplace — комплексная платформа для анализа маркетплейсов с акцентом на поиск товаров для продажи. Включает мониторинг конкурентов, анализ ниш, отслеживание трендов. Подписка от 5000 рублей в месяц.

Сервисы для Ozon

Ozon Seller — официальный кабинет продавца Ozon предоставляет базовую аналитику конкурентов. Можно посмотреть средние цены в категории и позиции своих товаров относительно других продавцов. Бесплатно для продавцов Ozon.

DataOx — специализированный сервис для парсинга Ozon и других маркетплейсов. Собирает данные о товарах, ценах, продавцах. Работает через API, подходит для интеграции с собственными системами. Цена зависит от объёма запросов.

Price Tracker — сервис для отслеживания изменения цен на Ozon. Можно добавить товары конкурентов и получать уведомления о снижении или повышении цен. Есть бесплатный тариф с ограничениями.

Универсальные парсеры

Octoparse — визуальный парсер без необходимости программирования. Позволяет настроить сбор данных с любого сайта, включая маркетплейсы. Есть готовые шаблоны для популярных площадок. Бесплатная версия с ограничениями, платная от $75 в месяц.

ParseHub — аналог Octoparse с более простым интерфейсом. Подходит для новичков. Умеет работать с JavaScript-сайтами и авторизацией. Бесплатная версия позволяет создать до 5 проектов, платная от $149 в месяц.

WebHarvy — десктопная программа для парсинга. Работает на вашем компьютере, не требует облачных сервисов. Подходит для разовых задач. Единоразовая покупка около $139, бесплатная пробная версия на 15 дней.

Пошаговая инструкция: настройка парсинга с прокси

Рассмотрим практический пример настройки парсинга данных продавцов на Wildberries с использованием готового инструмента и прокси. Для примера возьмём Octoparse — один из самых доступных визуальных парсеров.

Шаг 1: Подготовка инструментов

Скачайте и установите Octoparse с официального сайта. Зарегистрируйтесь и войдите в программу. Бесплатная версия позволяет создать до 10 задач парсинга, чего достаточно для начала.

Получите доступ к прокси. Для парсинга Wildberries рекомендуются резидентные прокси с российскими IP-адресами. Вам понадобятся: IP-адрес прокси-сервера, порт, логин и пароль (если требуется аутентификация).

Шаг 2: Настройка прокси в Octoparse

Откройте Octoparse и перейдите в настройки (иконка шестерёнки в правом верхнем углу). Выберите раздел "Network" или "Прокси". Включите опцию "Use proxy server" (Использовать прокси-сервер).

Введите данные вашего прокси: в поле "Proxy Host" укажите IP-адрес, в поле "Port" — порт. Если прокси требует авторизацию, поставьте галочку "Authentication required" и введите логин и пароль. Сохраните настройки.

Проверьте соединение: нажмите кнопку "Test" или "Проверить". Программа должна подтвердить успешное подключение к прокси. Если появляется ошибка, проверьте правильность введённых данных.

Шаг 3: Создание задачи парсинга

Создайте новую задачу: нажмите "New Task" или "Создать задачу". Введите URL страницы продавца на Wildberries, данные которого хотите собрать. Например, страницу со всеми товарами конкретного магазина.

Octoparse откроет встроенный браузер и загрузит указанную страницу через прокси. Дождитесь полной загрузки страницы. Если всё настроено правильно, вы увидите контент Wildberries, как будто заходите с IP-адреса прокси.

Шаг 4: Выбор данных для сбора

Используйте инструмент выбора элементов Octoparse: кликните на название товара на странице. Программа автоматически определит все похожие элементы (все названия товаров) и выделит их. Нажмите "Select all" (Выбрать все).

Повторите процесс для других данных: цены, рейтинга, количества отзывов, изображений. Каждый раз Octoparse будет добавлять новое поле в таблицу данных справа. Проверьте, что все нужные данные выбраны.

Если товары расположены на нескольких страницах, настройте пагинацию: найдите кнопку "Следующая страница" и укажите Octoparse, что нужно переходить по ней. Программа автоматически соберёт данные со всех страниц.

Шаг 5: Настройка параметров сбора

Установите задержки между запросами: в настройках задачи найдите "Action Settings" и установите "Wait time" (Время ожидания) 3-5 секунд между загрузкой страниц. Это имитирует поведение реального пользователя и снижает риск блокировки.

Настройте User-Agent: в расширенных настройках выберите случайный User-Agent браузера Chrome или Firefox. Это делает запросы более похожими на действия обычных пользователей.

Включите обработку ошибок: установите опцию "Retry on error" (Повторить при ошибке) с 2-3 попытками. Если страница не загрузится с первого раза, Octoparse автоматически попробует ещё раз.

Шаг 6: Запуск парсинга

Сохраните задачу и нажмите "Run" (Запустить). Выберите режим выполнения: "Local" (на вашем компьютере) для небольших объёмов или "Cloud" (в облаке) для больших задач. Облачный режим работает быстрее, но доступен только в платной версии.

Наблюдайте за процессом: Octoparse покажет прогресс сбора данных в реальном времени. Вы увидите, сколько страниц обработано и сколько записей собрано. При возникновении ошибок программа покажет уведомление.

После завершения экспортируйте данные: нажмите "Export" и выберите формат — Excel, CSV, JSON или прямую загрузку в базу данных. Данные сохранятся на ваш компьютер в удобном для анализа формате.

Шаг 7: Автоматизация регулярного сбора

Для регулярного мониторинга конкурентов настройте расписание: в настройках задачи выберите "Schedule" (Расписание) и укажите частоту запуска — ежедневно, еженедельно или в определённое время.

Настройте уведомления: включите отправку email-уведомлений о завершении парсинга или возникновении ошибок. Это позволит оперативно реагировать на проблемы.

Для продвинутых пользователей: настройте автоматическую загрузку данных в Google Sheets или вашу CRM-систему. Octoparse поддерживает интеграцию через API и вебхуки.

Важно: Даже при использовании прокси соблюдайте разумные интервалы между запросами. Рекомендуется не более 1 запроса в 3-5 секунд. Слишком агрессивный парсинг может привести к блокировке даже качественных прокси.

Парсинг сайтов находится в серой зоне законодательства. С одной стороны, публичная информация на сайтах доступна всем пользователям. С другой — массовый автоматический сбор данных может нарушать пользовательское соглашение площадки.

Что говорит закон

В России нет специального закона, прямо запрещающего парсинг сайтов. Сбор публично доступной информации сам по себе не является нарушением. Однако есть несколько юридических рисков:

Нарушение пользовательского соглашения. Большинство маркетплейсов в своих Terms of Service прямо запрещают автоматический сбор данных. Технически это не уголовное преступление, но площадка может заблокировать ваш аккаунт, если вы зарегистрированы как продавец.

Создание нагрузки на сервер. Если ваш парсинг создаёт существенную нагрузку на инфраструктуру сайта (DDoS-подобная активность), это может квалифицироваться как компьютерное преступление по статье 273 УК РФ. Однако для этого нужна действительно огромная нагрузка.

Использование собранных данных. Сам парсинг — это одно, а использование данных — другое. Если вы публикуете собранные данные или используете их для недобросовестной конкуренции, это может привести к судебным искам от правообладателей.

Как минимизировать риски

Чтобы снизить юридические риски при парсинге маркетплейсов, следуйте этим рекомендациям:

Собирайте только публичные данные. Не пытайтесь обходить авторизацию или получать доступ к закрытым разделам. Парсите только ту информацию, которая доступна любому посетителю сайта без регистрации.

Не создавайте чрезмерную нагрузку. Используйте задержки между запросами, не запускайте десятки параллельных потоков парсинга. Ваша активность не должна влиять на работу сайта для обычных пользователей.

Используйте данные для внутреннего анализа. Собранная информация должна использоваться для вашего бизнеса — анализа конкурентов, ценообразования, изучения рынка. Не публикуйте массивы данных публично и не продавайте их.

Не выдавайте себя за другого пользователя. Не используйте чужие учётные записи для парсинга. Если нужна авторизация, используйте свой аккаунт или парсите без авторизации.

Изучите robots.txt. Хотя этот файл не имеет юридической силы, он показывает отношение владельца сайта к автоматическому сбору данных. Соблюдение указаний robots.txt демонстрирует добросовестность.

Альтернативы парсингу

Некоторые маркетплейсы предоставляют официальные API для получения данных. Например, Яндекс.Маркет имеет API для партнёров, Ozon предоставляет API для продавцов. Использование официальных API — легальный и безопасный способ получения данных.

Также существуют специализированные сервисы аналитики маркетплейсов (MpStats, SellerFox), которые берут на себя юридические риски и предоставляют данные в рамках своих лицензионных соглашений. Использование таких сервисов переносит ответственность на провайдера услуги.

Заключение

Сбор данных о продавцах на маркетплейсах — важный инструмент конкурентной разведки для любого онлайн-бизнеса. Регулярный мониторинг цен, ассортимента и стратегий конкурентов позволяет принимать обоснованные решения и оставаться конкурентоспособным.

Выбор метода парсинга зависит от ваших задач и ресурсов: ручной сбор подходит для разовых исследований, готовые сервисы — для регулярного мониторинга без технических навыков, а самостоятельная настройка парсеров — для полного контроля и гибкости.

Ключ к успешному парсингу — правильный выбор и настройка прокси. Для большинства задач на российских маркетплейсах оптимальным решением будут резидентные прокси с российскими IP-адресами — они обеспечивают низкий риск блокировок при разумной стоимости и позволяют вести долгосрочный мониторинг конкурентов без технических проблем.

Помните о соблюдении разумных ограничений при парсинге: используйте задержки между запросами, не создавайте чрезмерную нагрузку на серверы маркетплейсов и применяйте собранные данные этично — для анализа и развития собственного бизнеса, а не для недобросовестной конкуренции.