La fijación de precios dinámica se ha convertido en un estándar en los marketplaces: los precios cambian de 10 a 20 veces al día dependiendo de la demanda, el stock y las acciones de los competidores. Si eres vendedor en Wildberries, Ozon o Avito, lo sabes: quien se entera primero de la reducción de precios de un competidor, mantiene su posición en los resultados de búsqueda. Pero todos los marketplaces bloquean estrictamente el scraping masivo desde una sola IP. En este artículo, analizaremos cómo configurar el monitoreo automático de precios a través de proxies, para recopilar datos 24/7 sin riesgo de bloqueo de cuenta o dirección IP.
Por qué los marketplaces bloquean el scraping de precios y cómo funciona
Todos los grandes marketplaces utilizan protección en múltiples niveles contra la recopilación automática de datos. La razón es simple: el scraping masivo crea una carga en los servidores y otorga una ventaja competitiva a quienes saben recopilar datos. Wildberries, por ejemplo, registra hasta 300,000 cambios de precios al día, y no quiere que esos datos sean accesibles a los competidores de forma gratuita.
Así es como funciona un sistema típico de protección contra el scraping:
- Monitoreo de la frecuencia de solicitudes desde una IP — si abres más de 50 fichas de productos por minuto, el sistema entiende que no eres una persona. Un comprador normal revisa de 3 a 5 productos por minuto, un scraper — de 100 a 500.
- Análisis de User-Agent y encabezados — las solicitudes sin encabezados de navegador correctos van directamente a la lista negra. Muchos principiantes utilizan bibliotecas estándar de Python requests sin configurar encabezados — esto es lo primero que detectan los sistemas de protección.
- Verificación de JavaScript y cookies — los marketplaces modernos utilizan Cloudflare, DataDome y sus propios sistemas anti-bots. Verifican la ejecución de JavaScript, la presencia de cookies de sesión, el comportamiento del mouse y el desplazamiento.
- Vinculación geográfica de IP — si estás scrapeando Ozon ruso desde una IP de Alemania o EE. UU., esto parece sospechoso. El sistema puede mostrarte precios desactualizados o incluso bloquear el acceso.
- Bloqueo de centros de datos — la mayoría de los marketplaces mantienen bases de datos de direcciones IP de proveedores de nube (AWS, Google Cloud, Hetzner) y limitan automáticamente las solicitudes desde ellas.
El resultado del bloqueo puede variar: desde una limitación temporal de velocidad (rate limit) hasta un bloqueo total de IP durante varias semanas. Si estás scrapeando a través de una cuenta de vendedor, corres el riesgo de que se bloquee tu cuenta personal, lo cual es crítico para el negocio.
Caso real: Un vendedor en Wildberries configuró el scraping de precios de competidores a través de un servidor VPS normal. En 2 horas recopiló datos de 500 productos. Al día siguiente, descubrió que su IP estaba completamente bloqueada — incluso acceder al sitio como comprador normal se volvió imposible. Tuvo que esperar 2 semanas hasta que el bloqueo se levantó automáticamente.
Qué tipos de proxies son adecuados para el monitoreo de precios: comparación
Para el monitoreo de la fijación de precios dinámica, hay tres tipos de proxies, cada uno con sus pros y contras. La elección depende del presupuesto, el volumen de scraping y los requisitos geográficos.
| Tipo de proxy | Ventajas | Desventajas | Para qué tareas |
|---|---|---|---|
| Proxies residenciales | IP reales de usuarios domésticos, riesgo mínimo de bloqueo, soporte para cualquier geografía, elusión de Cloudflare | Más caros que otros tipos, la velocidad puede variar | Scraping de Wildberries, Ozon, sitios con protección estricta. Monitoreo de precios regionales. |
| Proxies móviles | IP de operadores móviles, una IP es utilizada por miles de usuarios — casi imposible de bloquear, alto trust score | Los más caros, geografía limitada, cambio periódico de IP por parte del operador | Scraping a través de aplicaciones móviles de marketplaces, elusión de la protección más estricta |
| Proxies de centros de datos | Alta velocidad, bajo costo, conexión estable, tráfico ilimitado | Fácilmente detectables, muchos marketplaces bloquean centros de datos de forma preventiva | Scraping de sitios sin protección seria, Avito, pequeñas tiendas en línea |
Recomendación práctica para la elección:
- Para Wildberries y Ozon — solo proxies residenciales o móviles. Estas plataformas utilizan Cloudflare y sus propios sistemas anti-bots, los centros de datos son bloqueados en el 90% de los casos.
- Para Yandex.Market — proxies residenciales con geografía rusa, el sistema verifica la correspondencia entre la IP y la región de búsqueda.
- Para Avito — se pueden usar centros de datos, pero con rotación y retrasos entre solicitudes. La protección es más débil que en los marketplaces.
- Para AliExpress y plataformas internacionales — proxies residenciales del país necesario, muchos muestran diferentes precios para diferentes regiones.
Si el presupuesto es limitado, comienza con un grupo de 20-30 proxies residenciales con rotación. Esto será suficiente para monitorear de 500 a 1000 productos al día sin bloqueos.
Características de protección de Wildberries, Ozon, Yandex.Market y Avito
Cada plataforma utiliza su propia combinación de mecanismos de protección. Comprender estas características ayuda a configurar el scraper correctamente desde el primer intento.
Wildberries
La protección más estricta entre los marketplaces rusos. Utilizan Cloudflare con el modo "I'm Under Attack" activado, que verifica el desafío de JavaScript antes de acceder al contenido. Además, monitorean:
- Fingerprint del navegador — canvas, WebGL, fuentes, resolución de pantalla
- Fingerprint TLS — versión del protocolo y conjunto de suites de cifrado
- Factores de comportamiento — velocidad de desplazamiento, movimientos del mouse, tiempo en la página
- Historia de sesión — si comienzas a abrir fichas de productos de inmediato sin ver la página principal y las categorías, eso es sospechoso
Lo que funciona: Navegadores sin cabeza (Puppeteer, Playwright) con proxies residenciales, emulación del comportamiento real del usuario, retrasos de 5-15 segundos entre solicitudes, rotación de User-Agent y proxies después de cada 20-30 solicitudes.
Ozon
Utilizan su propio sistema anti-bots más DataDome. Característica: los precios pueden variar según la ciudad de entrega — el sistema determina la región por IP y muestra los precios correspondientes teniendo en cuenta la logística.
Ozon bloquea activamente rangos de IP de centros de datos conocidos. Al scrapear a través de un VPS normal, en el 80% de los casos recibirás un captcha o un error 403. También monitorean las cookies — si haces solicitudes sin mantener la sesión entre solicitudes, esto se detecta.
Lo que funciona: Proxies residenciales con geografía rusa, mantenimiento obligatorio de cookies entre solicitudes, simulación de agregar productos a favoritos (esto crea una "historia" del usuario), retrasos de 3-10 segundos.
Yandex.Market
Nivel medio de protección. La característica principal es la estricta vinculación a la región. Si estás scrapeando precios para Moscú desde una IP de Vladivostok, el sistema mostrará precios para Vladivostok o bloqueará el acceso por completo. Para un monitoreo correcto, se necesitan proxies de la región de la que estás rastreando precios.
Yandex también utiliza su propio sistema anti-fraude, que analiza la secuencia de acciones. Se ve sospechoso: abrir fichas de productos a través de enlaces directos sin búsqueda, intervalos iguales entre solicitudes (por ejemplo, estrictamente cada 5 segundos), ausencia de solicitudes a recursos estáticos (imágenes, estilos).
Lo que funciona: Proxies residenciales de la región necesaria, emulación de un ciclo completo: búsqueda → lista de productos → ficha de producto, retrasos aleatorios de 4-12 segundos, rotación periódica de proxies.
Avito
La protección más tolerante entre las plataformas mencionadas. La principal protección es un límite en la cantidad de vistas de anuncios desde una IP (aproximadamente 100-150 anuncios por hora). Después de superar el límite, se muestra un captcha o un bloqueo temporal de 1-2 horas.
Avito también verifica la presencia de cookies y encabezados básicos, pero no utiliza desafíos de JavaScript complejos. Los centros de datos funcionan, pero con limitaciones — se necesita rotación y frecuencia moderada de solicitudes.
Lo que funciona: Incluso los centros de datos con rotación, retrasos de 2-5 segundos entre anuncios, encabezados de navegador correctos, mantenimiento de cookies. Para grandes volúmenes — proxies residenciales.
Configuración de la rotación de proxies para scraping 24/7
La rotación correcta de proxies es un factor clave para un scraping estable sin bloqueos. Existen tres estrategias principales de rotación, cada una adecuada para diferentes escenarios.
Estrategia 1: Rotación por cantidad de solicitudes
Esencialmente: cambias de proxy después de un número determinado de solicitudes (por ejemplo, después de cada 20-50 solicitudes). Este es el método más simple y efectivo para la mayoría de las tareas.
Valores recomendados para diferentes plataformas:
- Wildberries: 15-25 solicitudes por proxy, luego cambio
- Ozon: 20-30 solicitudes
- Yandex.Market: 30-50 solicitudes
- Avito: 50-100 solicitudes
Un matiz importante: agrega aleatorización. No cambies de proxy estrictamente después de 20 solicitudes — hazlo después de 18-23 solicitudes de forma aleatoria. Esto hace que el patrón sea menos predecible para los sistemas de protección.
Estrategia 2: Rotación temporal
Cambias de proxy cada N minutos independientemente de la cantidad de solicitudes. Adecuado para tareas con carga impredecible — por ejemplo, monitoreo de precios en tiempo real, donde la cantidad de actualizaciones puede cambiar drásticamente.
Intervalos recomendados: 5-15 minutos para plataformas estrictas (Wildberries, Ozon), 15-30 minutos para las más tolerantes (Avito, pequeñas tiendas).
Estrategia 3: Sticky sessions (sesiones pegajosas)
Utilizas el mismo proxy para todas las solicitudes dentro de una "sesión de usuario". Por ejemplo: emulas a un comprador que ingresó a Ozon, buscó "portátiles", abrió 5 fichas de productos, y agregó uno al carrito. Todas estas acciones se realizan a través de un proxy manteniendo las cookies.
Después de finalizar la sesión (después de 3-10 minutos) — cambias de proxy y comienzas una nueva sesión. Este es el patrón más "humano", pero requiere más proxies y es más complicado de implementar.
Cuándo utilizar: Scraping en plataformas con protección muy estricta, donde una simple rotación no funciona. También es adecuado para la recopilación de datos a través de cuentas personales de vendedores.
Consejo práctico:
Combina estrategias. Por ejemplo: utiliza sesiones pegajosas de 20-30 solicitudes, y después de finalizar la sesión, cambia de proxy. Agrega un límite temporal — si la sesión dura más de 10 minutos, cambia de proxy forzosamente. Este enfoque híbrido proporciona la máxima protección contra la detección.
Herramientas listas para el monitoreo de precios con soporte de proxies
Si no deseas escribir un scraper desde cero, hay soluciones listas con soporte de proxies incorporado. Vamos a revisar las herramientas más populares para el monitoreo de precios en marketplaces rusos e internacionales.
Para marketplaces rusos
1. Mpstats (mpstats.io)
Servicio especializado para la analítica de Wildberries y Ozon. Recopila datos sobre ventas, stock, precios de competidores. Tiene API para integración con sistemas propios. El servicio funciona a través de su propia infraestructura de proxies, no necesitas configurar nada adicional.
Desventaja: alto costo (a partir de 15,000 rublos/mes por acceso completo), no se pueden usar tus propios proxies. Adecuado para grandes vendedores con un volumen de 1-2 millones de rublos/mes.
2. Sellego
Servicio similar con enfoque en la automatización de precios. Monitorea los precios de los competidores y ajusta automáticamente tus precios según reglas establecidas (por ejemplo, "ser un 5% más barato que el competidor"). También funciona a través de sus propios proxies.
3. Parsehub
Constructor visual de scrapers sin código. Haces clic en los elementos de la página que necesitas recopilar, y el servicio crea automáticamente el scraper. Soporta proxies — puedes agregar tu lista en la configuración del proyecto. Adecuado para quienes no saben programar en absoluto.
Costo: tarifa gratuita — 200 páginas al mes, tarifas de pago a partir de $149/mes por 10,000 páginas. Para monitorear de 100 a 200 productos, la tarifa gratuita es suficiente.
Para desarrollo independiente
Si estás dispuesto a configurar el scraper tú mismo o tienes un programador en el equipo:
1. Scrapy (Python)
Potente framework para scraping con soporte incorporado de proxies, rotación, manejo de errores. Tiene middleware para cambiar automáticamente proxies de la lista. Requiere conocimientos de Python, pero la documentación es excelente.
Adecuado para scraping de sitios simples sin JavaScript. Para Wildberries y Ozon, necesita combinarse con Splash o Selenium para manejar JavaScript.
2. Puppeteer / Playwright (JavaScript)
Navegadores sin cabeza que emulan completamente a un usuario real — ejecutan JavaScript, mantienen cookies, pueden emular movimientos del mouse. Ideal para plataformas con protección estricta.
La configuración de proxies es simple — un parámetro al iniciar el navegador. Playwright se considera más moderno y estable, pero Puppeteer tiene más ejemplos y bibliotecas listas.
3. Octoparse
Aplicación de escritorio para Windows con constructor visual de scrapers. No requiere programación — simplemente haces clic en los elementos que necesitas recopilar. Soporte incorporado de proxies, programador de ejecuciones, exportación a Excel/CSV.
Costo: versión gratuita con limitaciones (10,000 registros al mes), tarifas de pago a partir de $75/mes. Buena opción para pequeñas y medianas empresas.
Configuración paso a paso del scraper de precios con proxies en 15 minutos
Te mostraré la forma más sencilla de configurar el monitoreo de precios usando Parsehub — una herramienta sin código. Este método es adecuado incluso si nunca has trabajado con scrapers.
Paso 1: Registro e instalación
- Regístrate en parsehub.com (hay una tarifa gratuita)
- Descarga e instala la aplicación de escritorio para Windows o Mac
- Inicia la aplicación e inicia sesión en tu cuenta
Paso 2: Creación de proyecto y selección de elementos
- Haz clic en "Nuevo Proyecto" e inserta la URL de la página con los productos (por ejemplo, una categoría en Ozon o resultados de búsqueda)
- Parsehub cargará la página en el navegador integrado
- Haz clic en el nombre del primer producto — Parsehub automáticamente resaltará todos los elementos similares en la página
- Haz clic en el precio del producto — se añadirá a la lista de datos a recopilar
- Agrega otros campos necesarios: enlace al producto, calificación, cantidad de reseñas
Paso 3: Configuración de proxies
- Abre la configuración del proyecto (icono de engranaje)
- Encuentra la sección "Configuración de Proxy"
- Selecciona "Usar proxy" e inserta los datos de tus proxies en el formato: IP:PUERTO:NOMBRE_DE_USUARIO:CONTRASEÑA
- Si tienes una lista de proxies, activa la opción "Rotar proxies" — Parsehub cambiará automáticamente los proxies entre solicitudes
Paso 4: Configuración de programación
- En la configuración del proyecto, busca "Programar"
- Selecciona la frecuencia de ejecución: cada hora, cada 6 horas, una vez al día, etc.
- Para la fijación de precios dinámica, lo óptimo es — cada 2-4 horas
Paso 5: Exportación de datos
- Después de la primera ejecución del scraper, los datos aparecerán en la pestaña "Datos"
- Haz clic en "Exportar" y selecciona el formato: CSV, Excel, JSON
- Puedes configurar el envío automático de datos a Google Sheets o por correo electrónico después de cada ejecución
Toda la configuración toma de 10 a 15 minutos. Después de esto, el scraper funcionará automáticamente según el horario, recopilando precios de competidores y enviándote los datos.
Importante: Para el scraping de Wildberries y Ozon a través de Parsehub, asegúrate de usar proxies residenciales. Los centros de datos serán bloqueados, incluso con rotación. Un grupo de 10-20 proxies es suficiente para monitorear de 200 a 500 productos.
5 errores que llevan a bloqueos durante el scraping
Incluso con los proxies correctos, puedes ser bloqueado si cometes errores típicos. Aquí están los problemas más comunes de la práctica.
Error 1: Velocidad de solicitudes demasiado alta
Muchos intentan recopilar datos lo más rápido posible y hacen de 10 a 20 solicitudes por segundo. Esto es detectado instantáneamente por los sistemas de protección. Un ser humano real no puede abrir 20 fichas de productos por segundo.
Solución: Agrega retrasos entre solicitudes. Mínimo 2-3 segundos para sitios simples, 5-10 segundos para marketplaces con protección. Haz que los retrasos sean aleatorios — no estrictamente 5 segundos, sino de 4 a 8 segundos de forma aleatoria.
Error 2: Uso de un solo proxy para todas las solicitudes
Incluso si compraste un proxy residencial, usar una sola IP para cientos de solicitudes al día llevará a un bloqueo. Los sistemas de protección rastrean la actividad de cada IP.
Solución: Mínimo 10-20 proxies en el grupo con rotación. Para grandes volúmenes (1000+ productos al día) — 50-100 proxies.
Error 3: Ausencia o encabezados de solicitudes incorrectos
Las solicitudes sin User-Agent o con el User-Agent predeterminado de la biblioteca (por ejemplo, "Python-requests/2.28.1") son detectadas inmediatamente como bots.
Solución: Siempre especifica un User-Agent de un navegador real. Además, agrega encabezados Accept, Accept-Language, Accept-Encoding. Cambia el User-Agent al cambiar de proxy.
Error 4: Ignorar cookies y sesiones
Muchos marketplaces utilizan cookies para rastrear la sesión del usuario. Si haces cada solicitud "desde cero" sin cookies, esto parece sospechoso.
Solución: Mantén las cookies entre solicitudes dentro de una misma sesión. Al cambiar de proxy, limpia las cookies y comienza una nueva sesión. Usa bibliotecas con manejo automático de cookies (requests.Session en Python, puppeteer en JavaScript).
Error 5: Scraping solo de fichas de productos sin simular navegación
Si abres directamente enlaces a fichas de productos, omitiendo la página principal, la búsqueda y las categorías, esto no se parece al comportamiento de un usuario real.
Solución: Para plataformas con protección estricta (Wildberries, Ozon) simula el camino completo del usuario: página principal → búsqueda o categoría → lista de productos → ficha de producto. Esto aumenta el tiempo de scraping, pero reduce el riesgo de bloqueo drásticamente.
Conclusión
El monitoreo de la fijación de precios dinámica es una tarea críticamente importante para cualquier vendedor en marketplaces. Los precios de los competidores cambian varias veces al día, y quien reacciona primero a los cambios — mantiene posiciones en los resultados y ganancias. Pero todos los grandes marketplaces bloquean estrictamente el scraping, por lo que sin proxies correctamente configurados, recopilar datos es imposible.
Conclusiones clave del artículo: para Wildberries y Ozon, utiliza solo proxies residenciales o móviles — los centros de datos son bloqueados en el 90% de los casos. Asegúrate de configurar la rotación de proxies — cambia de IP después de cada 20-30 solicitudes. Agrega retrasos entre solicitudes (5-10 segundos) y aleatoriza. Usa navegadores sin cabeza para plataformas con protección de JavaScript. Simula el comportamiento de un usuario real — no abras fichas de productos directamente, emula el camino completo a través de búsqueda y categorías.
Si no deseas lidiar con los detalles técnicos, utiliza herramientas listas como Parsehub o Octoparse — no requieren programación y tienen soporte de proxies incorporado. Para grandes volúmenes y tareas específicas, es mejor desarrollar tu propio scraper en Scrapy o Puppeteer.
Si planeas configurar el monitoreo automático de precios en marketplaces rusos, te recomendamos comenzar con proxies residenciales — ofrecen acceso estable a Wildberries, Ozon y otros marketplaces con un riesgo mínimo de bloqueos. Para casos especialmente difíciles o para trabajar con aplicaciones móviles de marketplaces, son adecuados proxies móviles con IP de operadores rusos.