Volver al blog

Proxies para scraping de Ozon: recopilación de precios, productos y reseñas sin bloqueos

Ozon bloquea activamente el scraping, pero con los proxies y configuraciones correctas, puedes recopilar datos sobre precios, productos y reseñas sin ser baneado. Analizamos todo paso a paso.

📅1 de abril de 2026
```html

Ozon es uno de los marketplaces más protegidos de Runet: sistemas anti-bots, captchas, límites en las solicitudes y bloqueos por IP hacen que la recopilación automática de datos sea una verdadera prueba. Si estás monitoreando los precios de la competencia, analizando el surtido o recopilando reseñas para análisis — sin proxies bien configurados, tu scraper será bloqueado en cuestión de minutos. En esta guía, analizaremos qué proxies son adecuados para Ozon, cómo configurarlos correctamente y qué errores pueden arruinar los proyectos de recopilación de datos.

Por qué Ozon bloquea el scraping: cómo funciona la protección

Antes de configurar proxies, es importante entender con qué te enfrentarás. Ozon utiliza un sistema de protección de múltiples niveles contra solicitudes automáticas, y cada uno de sus elementos debe ser considerado al construir el scraper.

Limitación de tasa — restricción en la frecuencia de solicitudes

Si desde una dirección IP se reciben más de 30-50 solicitudes por minuto, Ozon comienza a devolver el error 429 (Demasiadas Solicitudes) o bloquea completamente la IP. Para un usuario normal, tal frecuencia de solicitudes no ocurre — lo que significa que es un bot. Por eso, un solo servidor proxy no es suficiente: se necesita un grupo de decenas o cientos de direcciones IP con rotación.

Análisis de User-Agent y encabezados HTTP

El sistema de Ozon verifica los encabezados de cada solicitud. Si el User-Agent parece un script (por ejemplo, python-requests/2.28), la solicitud será bloqueada de inmediato. Es necesario imitar los encabezados de un navegador real: User-Agent correcto, Accept-Language, Accept-Encoding, Referer.

Fingerprinting del navegador

En las páginas de Ozon, JavaScript recopila la huella del navegador: resolución de pantalla, fuentes instaladas, WebGL, Canvas. Si estás haciendo scraping a través de un navegador sin cabeza (Puppeteer, Playwright) sin camuflaje — el sistema lo detectará. Por lo tanto, es importante usar herramientas con modo sigiloso o hacer scraping a través de la API sin renderizar JS.

Geobloqueo y verificación de reputación de IP

Ozon es un marketplace ruso, y espera solicitudes de IP rusas. Si te conectas a través de un proxy de un centro de datos en Alemania o EE. UU., eso genera sospechas de inmediato. Además, las direcciones IP de los centros de datos a menudo están en listas negras de sistemas anti-bots (Cloudflare, DataDome) — por eso, para Ozon se necesitan IP residenciales rusas o móviles.

Resumen: qué bloquea Ozon

  • IP de centros de datos y servidores VPN (en listas negras)
  • Frecuencia de solicitudes demasiado alta desde una IP
  • Encabezados HTTP poco realistas (User-Agent de scripts)
  • Direcciones IP extranjeras para un marketplace ruso
  • Falta de cookies y datos de sesión

Qué proxies son adecuados para Ozon: comparación de tipos

No todos los proxies manejan igual de bien la protección de Ozon. Analicemos tres tipos principales y su aplicabilidad para tareas en este marketplace.

Tipo de proxy Cómo se ve para Ozon Velocidad Riesgo de bloqueo ¿Adecuado para Ozon?
Centro de datos IP de hosting/nube Muy alta Alta ⚠️ Solo para tareas ligeras
Residenciales IP de usuario doméstico Media Bajo ✅ Excelente
Móviles IP de operador móvil Media Mínimo ✅ Ideal

Proxies residenciales — el caballo de batalla para Ozon

Los proxies residenciales utilizan direcciones IP de usuarios domésticos reales. Para Ozon, tal solicitud se ve como una persona normal que accede al sitio a través de Internet doméstico. El sistema anti-bots no detecta signos de automatización a nivel de IP. Esto convierte a los proxies residenciales en la opción principal para scraping a gran escala: monitoreo de precios de miles de SKU, recopilación de fichas de productos, análisis del surtido de la competencia.

La ventaja clave es un gran grupo de direcciones IP con la posibilidad de elegir la geolocalización rusa. Ozon espera solicitudes de direcciones rusas, y los proxies residenciales con geotargeting en Rusia ofrecen un nivel mínimo de sospecha.

Proxies móviles — máxima fiabilidad

Los proxies móviles funcionan a través de IP de operadores móviles (MTS, Beeline, MegaFon, Tele2). Este es el tipo de tráfico más "limpio" desde el punto de vista de los sistemas anti-bots: las IP móviles rara vez caen en listas negras, y una sola IP puede ser utilizada por miles de usuarios reales al mismo tiempo. Si una IP residencial es bloqueada — eso es sospechoso. Si una IP móvil es bloqueada — Ozon arriesga cortar miles de compradores reales, lo cual no les conviene.

Los proxies móviles son especialmente buenos para tareas donde se necesita alta fiabilidad: recopilación de reseñas, monitoreo de promociones y ventas en tiempo real.

Proxies de centros de datos — solo para tareas simples

Los proxies de centros de datos son rápidos y más baratos, pero su uso en Ozon es limitado. La mayoría de estas IP ya están en las bases de datos de sistemas anti-bots. Pueden ser adecuados para tareas puntuales con baja frecuencia de solicitudes — por ejemplo, verificar la disponibilidad de un producto específico una vez por hora. No son adecuados para monitoreo regular a gran escala.

Escenarios de uso: precios, productos, reseñas

Las tareas de recopilación de datos de Ozon son diversas, y cada una necesita su propia estrategia. Analicemos tres escenarios principales.

📊 Monitoreo de precios de la competencia

Este es el escenario más popular entre los vendedores. Tarea: rastrear precios de cientos o miles de productos de la competencia, para ajustar rápidamente tu propia estrategia de precios. Ozon cambia los precios varias veces al día — especialmente durante las promociones.

Requisitos para los proxies: se necesita un grupo de 50-200 IP residenciales con geolocalización rusa. Las solicitudes deben hacerse con un retraso de 2-5 segundos entre cada una, y la IP debe cambiarse después de cada 5-10 solicitudes. Con este modo, el scraper puede procesar de 500 a 1000 fichas de productos por hora sin bloqueos.

Qué recopilar: precio actual, precio antes del descuento, disponibilidad en stock, calificación del vendedor, número de reseñas, estado de participación en la promoción de Ozon.

🛍️ Recopilación de datos sobre productos y surtido

Los analistas y marketers recopilan datos sobre el surtido: qué categorías están creciendo, qué productos están en la cima de las búsquedas, cómo cambia el número de vendedores en la nicho. Estas son tareas más voluminosas — se necesita navegar por miles de páginas del catálogo.

Requisitos para los proxies: un grupo de al menos 200 IP con rotación. Es importante usar sesiones pegajosas (cuando una IP está "fijada" a una sesión durante varios minutos) para navegar correctamente por la paginación — de lo contrario, al cambiar la IP en la siguiente página del catálogo, puedes obtener resultados diferentes.

Qué recopilar: nombre del producto, artículo (SKU), categoría, marca, descripción, características, fotografías, número de vendedores, posición en la búsqueda.

⭐ Scraping de reseñas y calificaciones

Las reseñas son una fuente valiosa de datos para analizar las preferencias del consumidor, encontrar debilidades en la competencia y mejorar tus propios productos. Las páginas de reseñas en Ozon están especialmente bien protegidas: para cargarlas se necesita JavaScript, y los datos a menudo se cargan a través de solicitudes AJAX.

Requisitos para los proxies: para el scraping de reseñas, los proxies móviles con IP rusas son los más adecuados. Dado que cada página de reseñas requiere varias solicitudes (página principal + AJAX para cargar contenido), las IP móviles aseguran la estabilidad de la sesión.

Qué recopilar: texto de la reseña, calificación (1-5 estrellas), fecha de publicación, utilidad de la reseña (me gusta), respuesta del vendedor, fotografías en las reseñas, compra verificada.

Rotación de IP y gestión de sesiones: cómo evitar bloqueos

Incluso con buenos proxies, puedes recibir un bloqueo si no gestionas correctamente las sesiones y la rotación. Este es uno de los aspectos técnicos clave del scraping en Ozon.

Dos modos de rotación: rotating vs sticky

Rotating (rotación aleatoria) — cada solicitud proviene de una nueva IP. Esto es bueno para solicitudes independientes: por ejemplo, cuando verificas el precio de un producto específico. Ozon no ve conexión entre las solicitudes.

Sticky sessions (sesiones pegajosas) — una IP se utiliza para varias solicitudes consecutivas dentro de una "sesión" (generalmente de 1 a 30 minutos). Esto es necesario cuando navegas por la paginación del catálogo, recopilas varias páginas de reseñas de un producto o trabajas con el carrito/autenticación. Un cambio brusco de IP a mitad de sesión parece sospechoso.

Reglas de retraso entre solicitudes

Tipo de tarea Retraso entre solicitudes Cambio de IP
Monitoreo de precios (1000+ SKU) 2-4 segundos Cada 5-10 solicitudes
Navegación por el catálogo (paginación) 3-6 segundos Cada 20-30 páginas
Recopilación de reseñas 4-8 segundos Cada producto — nueva IP
Verificación puntual de disponibilidad 1-2 segundos Cada solicitud

Gestión de cookies y datos de sesión

Ozon rastrea las cookies: si cada solicitud llega sin cookies o con nuevas cookies, eso es un signo de bot. Se recomienda al primer acceso desde una nueva IP "calentar" la sesión — primero cargar la página principal, luego ir a la categoría, y solo después solicitar los datos necesarios. Esto imita el comportamiento de un usuario real y reduce el riesgo de bloqueo en 3-5 veces.

Configuración de proxies para el scraping de Ozon: guía paso a paso

Analicemos la configuración práctica utilizando herramientas populares. Comencemos con una configuración básica que se adapta a la mayoría de los escenarios.

Paso 1. Obtén los datos del proxy

Después de conectar proxies residenciales o móviles, recibirás los datos de conexión en el siguiente formato:

host: proxy.example.com
port: 8080
username: your_username
password: your_password
protocol: HTTP / HTTPS / SOCKS5

Para Ozon, se recomienda utilizar el protocolo HTTPS o SOCKS5. SOCKS5 es preferible si tu herramienta lo soporta — transmite menos encabezados identificativos.

Paso 2. Configura el geotargeting en Rusia

En la configuración del servicio de proxy, selecciona el país: Rusia (RU). Para algunas tareas, es importante una ciudad específica — por ejemplo, si quieres ver precios considerando la entrega a Moscú o San Petersburgo. En este caso, elige el geotargeting a nivel de ciudad.

Si el servicio proporciona un endpoint con el parámetro de geolocalización en la URL, se verá aproximadamente así:

proxy.example.com:8080?country=ru&city=moscow&session=random

Paso 3. Configura los encabezados HTTP correctos

Este es un paso críticamente importante. La solicitud a Ozon debe parecer una solicitud de un navegador real Chrome en Windows. El conjunto mínimo de encabezados:

User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 
            (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: ru-RU,ru;q=0.9,en-US;q=0.8,en;q=0.7
Accept-Encoding: gzip, deflate, br
Connection: keep-alive
Upgrade-Insecure-Requests: 1
Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: none

Paso 4. Configura la rotación y los retrasos

En la mayoría de los scrapers listos y herramientas sin código, hay configuraciones de retraso y rotación. Establece:

  • Retraso entre solicitudes: 3-5 segundos (puedes agregar aleatoriedad: de 2 a 7 segundos)
  • Rotación de IP: cada 5-10 solicitudes para monitoreo de precios, cada solicitud para verificaciones puntuales
  • Tiempo de espera de solicitud: 15-30 segundos (Ozon a veces responde lentamente)
  • Reintentos en caso de error: 3 intentos con nueva IP al recibir 403/429/503

Paso 5. Verifica el funcionamiento antes de lanzar

Antes de lanzar el scraping completo, realiza una prueba: haz 20-30 solicitudes a diferentes páginas de Ozon con un intervalo de 5 segundos. Si todas las solicitudes devuelven el estado 200 y HTML correcto — la configuración se ha realizado correctamente. Si ves 403 o redirección a captcha — necesitas ajustar los encabezados o cambiar el tipo de proxy.

Herramientas para el scraping de Ozon sin código

La mayoría de los vendedores y analistas no escriben scrapers desde cero. Hay herramientas listas que soportan la conexión de proxies y no requieren habilidades de programación.

Octoparse — scraper visual con soporte para proxies

Octoparse es una de las herramientas sin código más populares para scraping. Indicas visualmente los elementos en la página que necesitas recopilar, y la herramienta genera automáticamente el scraper. Soporta la conexión de proxies a través de la configuración de tareas: especifica la dirección, el puerto, el nombre de usuario y la contraseña — y la herramienta rotará automáticamente la IP.

Cómo conectar proxies en Octoparse: abre la tarea → Configuración → Configuración de Proxy → Agregar Proxy → introduce los datos de conexión → selecciona el modo de rotación. Para Ozon, se recomienda el modo "Rotar IP por cada N solicitudes" con un valor de 5-10.

ParseHub — scraper en la nube para sitios complejos

ParseHub se desempeña bien en páginas donde los datos se cargan a través de JavaScript (lo cual es relevante para Ozon). Soporta trabajar a través de proxies en tarifas pagadas. La herramienta tiene un navegador integrado que renderiza JS — esto ayuda a recopilar datos que no están disponibles a través de solicitudes HTTP normales.

Servicios especializados de monitoreo de precios

Para la tarea de monitoreo de precios en Ozon, existen soluciones SaaS especializadas: Priceva, Metacommerce, Price2Spy. Ya contienen lógica incorporada para eludir la protección de Ozon y funcionan por suscripción. Si tu tarea es solo monitorear precios sin datos personalizados, estos servicios pueden ser más convenientes que configurar un scraper con proxies.

n8n / Make (Integromat) — automatización con solicitudes HTTP

Para tareas simples — por ejemplo, verificar el precio de un producto específico una vez por hora — puedes usar plataformas de automatización como n8n o Make. Envían solicitudes HTTP a Ozon y analizan la respuesta según una plantilla dada. El proxy se conecta en la configuración del nodo HTTP: especifica la dirección del proxy en el campo Proxy URL. Este no es el método más potente, pero es el más sencillo para automatización sin código.

💡 Consejo: utiliza la API de Ozon donde sea posible

Ozon proporciona una API oficial para vendedores. Si eres un vendedor registrado, parte de los datos (pedidos, existencias, análisis de ventas) se pueden obtener a través de la API sin proxies y riesgo de bloqueos. El scraping a través de proxies es necesario para datos que la API no proporciona: precios de la competencia, sus reseñas, posiciones en la búsqueda.

Top-7 errores al hacer scraping en Ozon y cómo evitarlos

La mayoría de los problemas con bloqueos surgen de los mismos errores. Aquí hay una lista de lo que definitivamente no debes hacer — y cómo corregirlo.

❌ Error 1: Usar una IP para todas las solicitudes

Incluso la IP más "limpia" será bloqueada si recibe 500 solicitudes por hora. Solución: un grupo de al menos 50 IP con rotación.

❌ Error 2: Hacer scraping sin retrasos

Las solicitudes sin retrasos son el signo más obvio de un bot. Incluso 1 segundo entre solicitudes reduce significativamente el riesgo de bloqueo. Óptimo: 3-5 segundos con un rango aleatorio.

❌ Error 3: Usar el User-Agent predeterminado de la biblioteca

python-requests/2.28.0 — esto resulta en un bloqueo instantáneo. Siempre reemplaza el User-Agent por uno actual de Chrome.

❌ Error 4: Usar IP extranjeras para Ozon

Ozon es un servicio ruso. Las solicitudes desde IP alemanas o estadounidenses generan sospechas. Siempre elige geotargeting en Rusia.

❌ Error 5: Ignorar errores 429 y seguir enviando solicitudes

Si recibes un 429 — detén inmediatamente las solicitudes desde esta IP, espera 5-10 minutos, cambia la IP. Continuar enviando solicitudes al recibir un 429 acelera el bloqueo permanente de la IP.

❌ Error 6: No manejar redirecciones a captcha

Ozon a veces redirige a una página de captcha en lugar de bloquear. El scraper debe verificar que el HTML obtenido contiene los datos necesarios, y no la página de captcha — y en caso de captcha, cambiar la IP.

❌ Error 7: Hacer scraping en horas pico de carga

En horas pico (tarde, fines de semana) Ozon filtra el tráfico de manera más agresiva. Para tareas voluminosas, planifica el scraping para horas nocturnas o temprano en la mañana — la carga en los servidores es menor y los sistemas anti-bots son menos estrictos.

Conclusión: cómo establecer una recopilación de datos estable de Ozon

Hacer scraping en Ozon no es una configuración única, sino un trabajo constante con la infraestructura. El marketplace actualiza regularmente la protección, cambia la estructura de las páginas y endurece los filtros anti-bots. Un monitoreo exitoso se basa en tres pilares: el tipo correcto de proxy, la rotación adecuada de IP y la correcta simulación del comportamiento de un usuario real.

Si resumimos brevemente todo lo que hemos analizado:

  • Para monitoreo de precios y surtido — utiliza proxies residenciales con geolocalización rusa y un grupo de al menos 50 IP
  • Para recopilación de reseñas y tareas con altos requisitos de fiabilidad — proxies móviles de operadores rusos
  • Siempre configura retrasos, rotación y encabezados HTTP correctos
  • Utiliza sesiones pegajosas al navegar por la paginación
  • Planifica tareas voluminosas para la noche

Si recién estás comenzando a construir un sistema de monitoreo de Ozon, te recomendamos empezar con proxies residenciales con IP rusas — ofrecen un equilibrio entre costo, velocidad y fiabilidad para la mayoría de las tareas de recopilación de datos de marketplaces. Para tareas críticas, donde cada solicitud debe pasar sin fallos, considera proxies móviles — son más caros, pero prácticamente no se bloquean incluso con un uso intensivo.

```