Voltar ao blog

Proxies para Scraping Ozon: Coleta de Preços, Produtos e Avaliações sem Bloqueios

Ozon bloqueia ativamente o scraping - mas com os proxies e configurações corretas, você pode coletar dados sobre preços, produtos e avaliações sem ser banido. Vamos analisar tudo passo a passo.

📅1 de abril de 2026
```html

Ozon é um dos marketplaces mais protegidos da Runet: sistemas anti-bot, CAPTCHAs, limites de solicitações e bloqueios por IP tornam a coleta automática de dados um verdadeiro desafio. Se você está monitorando os preços dos concorrentes, analisando o sortimento ou coletando avaliações para análise — sem proxies bem configurados, seu parser será bloqueado em poucos minutos. Neste guia, vamos discutir quais proxies são adequados para Ozon, como configurá-los corretamente e quais erros podem arruinar projetos de coleta de dados.

Por que Ozon bloqueia o parsing: como funciona a proteção

Antes de configurar proxies, é importante entender com o que exatamente você vai lidar. Ozon utiliza um sistema de proteção em múltiplas camadas contra solicitações automáticas, e cada um de seus elementos deve ser considerado ao construir o parser.

Limitação de taxa — restrição na frequência de solicitações

Se um único endereço IP faz mais de 30 a 50 solicitações por minuto, Ozon começa a retornar o erro 429 (Too Many Requests) ou bloqueia completamente o IP. Para um usuário comum, essa frequência de solicitações não existe — portanto, isso indica um bot. É por isso que um único servidor proxy não é suficiente: você precisa de um pool de dezenas ou centenas de endereços IP com rotação.

Análise de User-Agent e cabeçalhos HTTP

O sistema Ozon verifica os cabeçalhos de cada solicitação. Se o User-Agent parece um script (por exemplo, python-requests/2.28), a solicitação será bloqueada instantaneamente. É necessário simular os cabeçalhos de um navegador real: User-Agent correto, Accept-Language, Accept-Encoding, Referer.

Fingerprinting do navegador

Nas páginas do Ozon, o JavaScript coleta a impressão digital do navegador: resolução de tela, fontes instaladas, WebGL, Canvas. Se você está fazendo parsing através de um navegador headless (Puppeteer, Playwright) sem disfarce — o sistema irá detectar. Portanto, é importante usar ferramentas com modo stealth ou fazer parsing através da API sem renderização de JS.

Geobloqueio e verificação da reputação do IP

Ozon é um marketplace russo, e espera solicitações de IPs russos. Se você se conecta através de um proxy de data center da Alemanha ou dos EUA, isso imediatamente levanta suspeitas. Além disso, os endereços IP de data centers frequentemente estão listados em bancos de dados de sistemas anti-bot (Cloudflare, DataDome) — é por isso que para Ozon são necessários IPs residenciais ou móveis russos.

Resumo: o que bloqueia Ozon

  • IPs de data centers e servidores VPN (listados em listas negras)
  • Frequência de solicitações muito alta de um único IP
  • Cabeçalhos HTTP irreais (User-Agent de scripts)
  • Endereços IP estrangeiros para um marketplace russo
  • Falta de cookies e dados de sessão

Quais proxies são adequados para Ozon: comparação de tipos

Nem todos os proxies lidam igualmente bem com a proteção do Ozon. Vamos discutir três tipos principais e sua aplicabilidade para tarefas neste marketplace.

Tipo de proxy Como aparece para Ozon Velocidade Risco de bloqueio Adequado para Ozon?
Data center IP de hospedagem/nuvem Muito alta Alta ⚠️ Apenas para tarefas leves
Residenciais IP de usuário doméstico Média Baixo ✅ Excelente
Móveis IP de operadora móvel Média Mínimo ✅ Ideal

Proxies residenciais — o cavalo de batalha para Ozon

Proxies residenciais utilizam endereços IP de usuários domésticos reais. Para Ozon, essa solicitação parece um usuário comum acessando o site através da internet doméstica. O sistema anti-bot não vê sinais de automação no nível do IP. Isso torna os proxies residenciais a escolha principal para parsing em larga escala: monitoramento de preços de milhares de SKU, coleta de fichas de produtos, análise do sortimento dos concorrentes.

A principal vantagem é um grande pool de endereços IP com a possibilidade de escolher a geolocalização russa. Ozon espera solicitações de endereços russos, e proxies residenciais com geotargeting para a Rússia oferecem um nível mínimo de suspeita.

Proxies móveis — máxima confiabilidade

Proxies móveis operam através de IPs de operadoras móveis (MTS, Beeline, MegaFon, Tele2). Este é o tipo de tráfego mais "limpo" do ponto de vista dos sistemas anti-bot: IPs móveis raramente entram em listas negras, e um único IP pode ser utilizado por milhares de usuários reais simultaneamente. Se um IP residencial for bloqueado — isso é suspeito. Se um IP móvel for bloqueado — Ozon arrisca cortar milhares de compradores reais, o que não é vantajoso para eles.

Proxies móveis são especialmente bons para tarefas que exigem alta confiabilidade: coleta de avaliações, monitoramento de promoções e vendas em tempo real.

Proxies de data center — apenas para tarefas simples

Proxies de data center funcionam rapidamente e custam menos, mas sua aplicação para Ozon é limitada. A maioria desses IPs já está listada em bancos de dados de sistemas anti-bot. Eles podem ser adequados para tarefas pontuais com baixa frequência de solicitações — por exemplo, verificar a disponibilidade de um produto específico uma vez por hora. Para monitoramento regular em larga escala, eles não são adequados.

Cenários de uso: preços, produtos, avaliações

As tarefas de coleta de dados do Ozon são diversas, e cada uma requer sua própria estratégia. Vamos discutir três cenários principais.

📊 Monitoramento de preços dos concorrentes

Este é o cenário mais popular entre os vendedores. Tarefa: monitorar preços de centenas ou milhares de itens dos concorrentes para ajustar rapidamente sua própria precificação. Ozon frequentemente altera os preços várias vezes ao dia — especialmente durante promoções.

Requisitos para proxies: um pool de 50 a 200 IPs residenciais com geolocalização russa. As solicitações devem ser feitas com um intervalo de 2 a 5 segundos entre cada uma, e o IP deve mudar após cada 5 a 10 solicitações. Com esse regime, o parser pode processar de 500 a 1000 fichas de produtos por hora sem bloqueios.

O que coletar: preço atual, preço antes do desconto, disponibilidade em estoque, classificação do vendedor, número de avaliações, status de participação na promoção Ozon.

🛍️ Coleta de dados sobre produtos e sortimento

Analistas e profissionais de marketing coletam dados sobre o sortimento: quais categorias estão crescendo, quais produtos estão no topo das buscas, como muda o número de vendedores no nicho. Essas são tarefas mais abrangentes — é necessário percorrer milhares de páginas do catálogo.

Requisitos para proxies: um pool de pelo menos 200 IPs com rotação. É importante usar sessões sticky (quando um IP é "fixado" a uma sessão por alguns minutos) para contornar corretamente a paginação — caso contrário, ao mudar de IP na próxima página do catálogo, você pode obter uma resposta diferente.

O que coletar: nome do produto, código (SKU), categoria, marca, descrição, características, fotos, número de vendedores, posição na busca.

⭐ Parsing de avaliações e classificações

Avaliações são uma fonte valiosa de dados para analisar preferências dos consumidores, identificar pontos fracos dos concorrentes e melhorar seus próprios produtos. As páginas de avaliações no Ozon são especialmente bem protegidas: para carregá-las, é necessário JavaScript, e os dados frequentemente são carregados através de solicitações AJAX.

Requisitos para proxies: para parsing de avaliações, os proxies móveis com IPs russos são os mais adequados. Como cada página de avaliações requer várias solicitações (página principal + AJAX para carregar o conteúdo), os IPs móveis garantem a estabilidade da sessão.

O que coletar: texto da avaliação, classificação (1 a 5 estrelas), data de publicação, utilidade da avaliação (curtidas), resposta do vendedor, fotos nas avaliações, compra verificada.

Rotação de IP e gerenciamento de sessões: como evitar bloqueios

Mesmo com bons proxies, você pode ser bloqueado se não gerenciar corretamente as sessões e a rotação. Este é um dos aspectos técnicos-chave do parsing no Ozon.

Dois modos de rotação: rotating vs sticky

Rotating (rotação aleatória) — cada solicitação é feita a partir de um novo IP. Isso é bom para solicitações independentes: por exemplo, quando você verifica o preço de um item específico. Ozon não vê conexão entre as solicitações.

Sticky sessions (sessões fixas) — um IP é usado para várias solicitações sequenciais dentro de uma única "sessão" (geralmente de 1 a 30 minutos). Isso é necessário quando você está contornando a paginação do catálogo, coletando várias páginas de avaliações de um único produto ou trabalhando com o carrinho/autenticação. Uma mudança brusca de IP no meio da sessão parece suspeita.

Regras de atraso entre solicitações

Tipo de tarefa Atraso entre solicitações Mudança de IP
Monitoramento de preços (1000+ SKU) 2–4 segundos A cada 5–10 solicitações
Navegação no catálogo (paginações) 3–6 segundos A cada 20–30 páginas
Coleta de avaliações 4–8 segundos Cada produto — novo IP
Verificação pontual de disponibilidade 1–2 segundos Cada solicitação

Gerenciamento de cookies e dados de sessão

Ozon rastreia cookies: se cada solicitação chega sem cookies ou com novos cookies, isso é um sinal de bot. É recomendado, ao visitar pela primeira vez a partir de um novo IP, "aquecer" a sessão — primeiro carregue a página principal, depois vá para a categoria e só então solicite os dados necessários. Isso simula o comportamento de um usuário real e reduz o risco de bloqueio em 3 a 5 vezes.

Configuração de proxies para parsing Ozon: guia passo a passo

Vamos discutir a configuração prática usando ferramentas populares. Começaremos com uma configuração básica que se adequa à maioria dos cenários.

Passo 1. Obtenha os dados do proxy

Após conectar proxies residenciais ou móveis, você receberá os dados de conexão no seguinte formato:

host: proxy.example.com
port: 8080
username: your_username
password: your_password
protocol: HTTP / HTTPS / SOCKS5

Para Ozon, recomenda-se usar o protocolo HTTPS ou SOCKS5. SOCKS5 é preferível se sua ferramenta suportar — ele transmite menos cabeçalhos identificáveis.

Passo 2. Configure o geotargeting para a Rússia

Nas configurações do serviço de proxy, escolha o país: Rússia (RU). Para algumas tarefas, uma cidade específica é importante — por exemplo, se você deseja ver preços considerando a entrega em Moscovo ou São Petersburgo. Nesse caso, escolha o geotargeting a nível de cidade.

Se o serviço fornecer um endpoint com o parâmetro de geolocalização na URL, isso se parece com:

proxy.example.com:8080?country=ru&city=moscow&session=random

Passo 3. Configure os cabeçalhos HTTP corretos

Este é um passo crítico. A solicitação ao Ozon deve parecer uma solicitação de um navegador real Chrome no Windows. O conjunto mínimo de cabeçalhos:

User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 
            (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: ru-RU,ru;q=0.9,en-US;q=0.8,en;q=0.7
Accept-Encoding: gzip, deflate, br
Connection: keep-alive
Upgrade-Insecure-Requests: 1
Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: none

Passo 4. Configure a rotação e os atrasos

Na maioria dos parsers prontos e ferramentas no-code, existem configurações de atraso e rotação. Defina:

  • Atraso entre solicitações: 3–5 segundos (pode adicionar aleatoriedade: de 2 a 7 segundos)
  • Rotação de IP: a cada 5–10 solicitações para monitoramento de preços, cada solicitação para verificações pontuais
  • Timeout da solicitação: 15–30 segundos (Ozon às vezes responde lentamente)
  • Tentativas de repetição em caso de erro: 3 tentativas com um novo IP ao receber 403/429/503

Passo 5. Verifique a operação antes do lançamento

Antes de iniciar o parsing completo, faça um teste: faça 20–30 solicitações a diferentes páginas do Ozon com um intervalo de 5 segundos. Se todas as solicitações retornarem status 200 e HTML correto — a configuração foi feita corretamente. Se você ver 403 ou redirecionamento para CAPTCHA — é necessário ajustar os cabeçalhos ou mudar o tipo de proxy.

Ferramentas para parsing Ozon sem código

A maioria dos vendedores e analistas não escreve parsers do zero. Existem ferramentas prontas que suportam a conexão de proxies e não requerem habilidades de programação.

Octoparse — parser visual com suporte a proxies

Octoparse é uma das ferramentas no-code populares para parsing. Você indica visualmente os elementos na página que deseja coletar, e a ferramenta gera automaticamente o parser. Suporta a conexão de proxies através das configurações da tarefa: insira o endereço, porta, login e senha — e a ferramenta irá rotacionar automaticamente os IPs.

Como conectar proxies no Octoparse: abra a tarefa → Configurações → Configurações de Proxy → Adicionar Proxy → insira os dados de conexão → escolha o modo de rotação. Para Ozon, recomenda-se o modo "Rotacionar IP a cada N solicitações" com valor de 5–10.

ParseHub — parser em nuvem para sites complexos

ParseHub lida bem com páginas onde os dados são carregados via JavaScript (o que é relevante para Ozon). Suporta o trabalho através de proxies em planos pagos. A ferramenta possui um navegador embutido que renderiza JS — isso ajuda a coletar dados que não estão disponíveis através de uma solicitação HTTP comum.

Serviços especializados de monitoramento de preços

Para a tarefa de monitoramento de preços no Ozon, existem soluções SaaS especializadas: Priceva, Metacommerce, Price2Spy. Elas já contêm lógica embutida para contornar a proteção do Ozon e funcionam por assinatura. Se sua tarefa é apenas monitorar preços sem dados personalizados, esses serviços podem ser mais convenientes do que configurar um parser com proxies.

n8n / Make (Integromat) — automação com solicitações HTTP

Para tarefas simples — por exemplo, verificar o preço de um produto específico uma vez por hora — você pode usar plataformas de automação n8n ou Make. Elas enviam solicitações HTTP para Ozon e fazem parsing da resposta de acordo com um modelo definido. O proxy é conectado nas configurações do nó HTTP: insira o endereço do proxy no campo Proxy URL. Esta não é a forma mais poderosa, mas é a mais simples de automação sem código.

💡 Dica: use a API do Ozon sempre que possível

Ozon fornece uma API oficial para vendedores. Se você é um vendedor registrado, parte dos dados (pedidos, estoques, análise de vendas) pode ser obtida através da API sem proxies e risco de bloqueios. O parsing através de proxies é necessário para dados que a API não fornece: preços dos concorrentes, suas avaliações, posições na busca.

Top 7 erros ao fazer parsing no Ozon e como evitá-los

A maioria dos problemas com bloqueios ocorre devido aos mesmos erros. Aqui está uma lista do que definitivamente não deve ser feito — e como corrigir.

❌ Erro 1: Usar um único IP para todas as solicitações

Mesmo o IP mais "limpo" será bloqueado se fizer 500 solicitações por hora. Solução: um pool de pelo menos 50 IPs com rotação.

❌ Erro 2: Fazer parsing sem atrasos

Solicitações sem atrasos são o sinal mais óbvio de um bot. Mesmo 1 segundo entre solicitações reduz significativamente o risco de bloqueio. O ideal: 3–5 segundos com variação aleatória.

❌ Erro 3: Usar o User-Agent padrão da biblioteca

python-requests/2.28.0 — isso resulta em um bloqueio instantâneo. Sempre substitua o User-Agent por um Chrome atual.

❌ Erro 4: Usar IPs estrangeiros para Ozon

Ozon é um serviço russo. Solicitações de IPs alemães ou americanos levantam suspeitas. Sempre escolha geotargeting para a Rússia.

❌ Erro 5: Ignorar erros 429 e continuar enviando solicitações

Recebeu 429 — pare imediatamente as solicitações desse IP, aguarde 5–10 minutos, mude o IP. Continuar as solicitações ao receber 429 acelera o bloqueio permanente do IP.

❌ Erro 6: Não tratar redirecionamentos para CAPTCHA

Ozon às vezes redireciona para uma página de CAPTCHA em vez de bloquear. O parser deve verificar se o HTML recebido contém os dados necessários, e não a página de CAPTCHA — e, em caso de CAPTCHA, mudar o IP.

❌ Erro 7: Fazer parsing em horários de pico de carga

Durante os horários de pico (noite, fins de semana), Ozon filtra o tráfego de forma mais agressiva. Para tarefas volumosas, planeje o parsing para a noite ou início da manhã — a carga nos servidores é menor e os sistemas anti-bot são menos rigorosos.

Conclusão: como estabelecer uma coleta de dados estável com Ozon

O parsing do Ozon não é uma configuração única, mas um trabalho contínuo com a infraestrutura. O marketplace atualiza regularmente a proteção, muda a estrutura das páginas e endurece os filtros anti-bot. Um monitoramento bem-sucedido é construído sobre três pilares: o tipo correto de proxy, rotação de IP adequada e simulação correta do comportamento de um usuário real.

Para resumir tudo o que discutimos:

  • Para monitoramento de preços e sortimento — use proxies residenciais com geolocalização russa e um pool de pelo menos 50 IPs
  • Para coleta de avaliações e tarefas com altas exigências de confiabilidade — proxies móveis de operadoras russas
  • Sempre configure atrasos, rotação e cabeçalhos HTTP corretos
  • Use sessões sticky ao contornar a paginação
  • Planeje tarefas volumosas para a noite

Se você está apenas começando a construir um sistema de monitoramento do Ozon, recomendamos começar com proxies residenciais com IPs russos — eles oferecem um equilíbrio entre custo, velocidade e confiabilidade para a maioria das tarefas de coleta de dados em marketplaces. Para tarefas críticas, onde cada solicitação deve passar sem falhas, considere proxies móveis — eles são mais caros, mas praticamente não são bloqueados mesmo com uso intenso.

```