Voltar ao blog

Proxies para Raspagem de Avaliações da Amazon, Google Reviews e Yelp: Guia Completo Sem Bloqueios

Quer coletar automaticamente avaliações do Amazon, Google Reviews e Yelp, mas está sempre recebendo bloqueios? Neste artigo, discutimos quais proxies escolher e como configurar a coleta de dados sem bans.

📅16 de maio de 2026
```html

Você está iniciando a coleta automática de avaliações do Amazon ou Google — e já após 10-20 solicitações recebe um captcha ou banimento de IP. História familiar? Os marketplaces e plataformas de avaliações estão ativamente se protegendo contra scraping: detectam bots, bloqueiam faixas de endereços IP de data centers e exigem a resolução de captchas. Mas com os proxies certos, esse problema pode ser resolvido de uma vez por todas.

Neste guia, vamos discutir qual tipo de proxy é adequado para cada plataforma, como configurar a rotação de IP, quais ferramentas usar sem escrever código — e como, no final, coletar milhares de avaliações diariamente sem bloqueios.

Por que Amazon, Google e Yelp bloqueiam o scraping de avaliações

Antes de escolher um proxy, é importante entender: por que ocorrem bloqueios? Não se trata apenas do fato de que as plataformas "não querem compartilhar dados". Elas têm mecanismos técnicos específicos de proteção que precisam ser contornados de forma inteligente.

Solicitações excessivas de um único IP. Quando uma pessoa comum navega pelas avaliações no Amazon, ela faz de 2 a 5 solicitações por minuto. Um scraper — centenas. O sistema detecta uma atividade anômala e bloqueia o IP. Essa é a razão mais comum para bans durante a coleta de dados.

IPs de data centers em listas negras. Amazon, Google e Yelp há muito tempo adicionaram às suas listas negras faixas de IP de grandes provedores de nuvem: AWS, Google Cloud, DigitalOcean, Hetzner. Se você usar proxies de data centers baratos com endereços "expostos" — você será bloqueado antes mesmo da primeira solicitação.

Análise de fingerprint do navegador e cabeçalhos. Sistemas de proteção modernos (Cloudflare, PerimeterX, DataDome) analisam não apenas o IP, mas também os cabeçalhos HTTP, User-Agent, comportamento do mouse, sequência de solicitações. Se os cabeçalhos indicarem um bot — o bloqueio é inevitável.

Restrições geolocalizadas. Algumas avaliações no Amazon estão disponíveis apenas para usuários de determinados países. Por exemplo, as avaliações no amazon.de são vistas de forma diferente na Alemanha do que na Rússia. Para uma coleta de dados correta, são necessários proxies com a geolocalização adequada.

Captcha e desafios de JS. O Google utiliza especialmente o reCAPTCHA. O Yelp aplica verificações de JS que não passam por solicitações HTTP simples. Esses mecanismos exigem o uso de ferramentas de navegador ou serviços especiais para resolver captchas.

Conclusão principal:

Os bloqueios não são um acaso, mas um sistema. Superá-lo só pode ser feito de forma abrangente: tipo de proxy correto + rotação de IP + cabeçalhos de solicitação adequados + ferramenta de scraping apropriada.

Quais tipos de proxies existem e o que é adequado para scraping de avaliações

Nem todos os proxies são igualmente úteis para a coleta de avaliações. Vamos discutir três tipos principais e sua aplicabilidade à tarefa.

Proxies de data centers (Datacenter Proxies)

Esses são endereços IP que pertencem a empresas de servidores. Eles são rápidos, baratos e adequados para tarefas onde a velocidade é mais importante que a anonimidade. No entanto, para scraping de avaliações no Amazon ou Google, eles funcionam mal: a maioria desses IPs já está na lista negra. Você conseguirá coletar algumas páginas, mas rapidamente receberá um bloqueio ou captcha.

Proxies de data centers são justificáveis apenas para testar o scraper ou para plataformas com proteção mínima — como pequenos sites regionais de avaliações.

Proxies residenciais (Residential Proxies)

Esses são endereços IP de usuários domésticos reais. Do ponto de vista do Amazon ou Google — é uma pessoa comum com internet residencial. Esses proxies praticamente não entram em listas negras, pois seus IPs mudam constantemente e pertencem a dispositivos reais.

Proxies residenciais são a escolha ideal para scraping de avaliações no Amazon, Yelp e na maioria das plataformas com proteção moderada. Eles permitem fazer solicitações com a geolocalização necessária (país, cidade), o que é crítico para obter avaliações locais.

Proxies móveis (Mobile Proxies)

Endereços IP de operadoras móveis (4G/5G). Este é o tipo de tráfego mais "confiável" para qualquer plataforma: IPs móveis raramente são bloqueados, pois por trás de um IP pode haver centenas de usuários reais (NAT das operadoras móveis). O Google é especialmente leal aos endereços móveis.

Proxies móveis são indispensáveis para scraping de Google Reviews e Yelp, onde a proteção contra bots é especialmente agressiva. Eles são mais caros que os residenciais, mas oferecem a maior taxa de solicitações bem-sucedidas sem captcha.

Scraping de avaliações Amazon: características e configuração de proxies

O Amazon é um dos sites mais difíceis para scraping. A empresa utiliza vários níveis de proteção simultaneamente: análise de comportamento, verificação de cabeçalhos, geolocalização e um sistema de captcha agressivo. No entanto, milhares de marketers e analistas coletam avaliações do Amazon diariamente — apenas fazem isso da maneira certa.

O que é necessário para um scraping bem-sucedido de avaliações Amazon

Aqui está o conjunto mínimo de condições sob as quais o scraping funcionará de forma estável:

  • Proxies residenciais ou móveis com geolocalização do país necessário (EUA para amazon.com, DE para amazon.de)
  • Rotação de IP — pelo menos a cada 10-30 solicitações
  • User-Agent correto — simulação de um navegador real (Chrome, Firefox)
  • Atrasos entre solicitações — 2-5 segundos, para não parecer um bot
  • Cookies de sessão — o Amazon responde melhor a solicitações com cookies salvos

Configuração passo a passo para Amazon

Passo 1. Escolha proxies residenciais com geolocalização do país necessário. Para amazon.com — EUA, para amazon.co.uk — Reino Unido. Isso é importante: o Amazon mostra avaliações diferentes para usuários de diferentes países.

Passo 2. Configure a rotação. Se você estiver usando um scraper pronto (por exemplo, Octoparse ou ParseHub), especifique os proxies nas configurações de conexão. A maioria dessas ferramentas suporta uma lista de proxies com rotação automática.

Passo 3. Defina atrasos entre solicitações. No Octoparse, isso é feito na seção "Configurações de atraso" — defina um intervalo aleatório de 2 a 6 segundos.

Passo 4. Execute um teste em 50-100 páginas. Se o captcha aparecer mais de 5% das vezes — aumente o atraso ou mude o pool de proxies.

Passo 5. Escale. Após um teste bem-sucedido, você pode iniciar a coleta de milhares de avaliações. Um bom pool de proxies residenciais permite coletar de 5000 a 10000 avaliações por dia sem bloqueios.

Importante sobre o Amazon:

O Amazon atualiza regularmente seus algoritmos de proteção. Se seu scraper funcionou mês passado, mas agora começou a receber bloqueios — provavelmente, o algoritmo de verificação mudou. Solução: atualize o User-Agent para a versão mais recente do Chrome e verifique se seus proxies não estão na lista negra.

Coleta de avaliações Google Reviews: o que é importante saber

Google Reviews — avaliações no Google Maps e Google Business Profile — são uma fonte valiosa de dados para marketers, especialistas em SEO e analistas. Mas o Google protege seus dados de forma especialmente agressiva: reCAPTCHA v3, análise de comportamento, verificação de fingerprint do navegador.

A principal dificuldade: Google Reviews não são carregadas através de solicitações HTTP comuns. As avaliações são carregadas dinamicamente via JavaScript. Isso significa que um scraper HTTP simples não funcionará — é necessária uma ferramenta que consiga renderizar JavaScript (scraper de navegador).

Como coletar corretamente Google Reviews

Opção 1: Serviços prontos. Ferramentas como Outscraper, Apify (ator Google Maps Scraper) ou PhantomBuster conseguem coletar Google Reviews através do motor de navegador. Você só precisa especificar a URL ou o nome do estabelecimento e conectar o proxy.

Opção 2: Octoparse com modo de navegador. O Octoparse suporta o modo de renderização de navegador. Nas configurações, especifique proxies residenciais ou móveis — e a ferramenta coletará avaliações como um usuário real.

Opção 3: Google Places API. O caminho oficial — usar a Google Places API. Ela fornece até 5 avaliações por estabelecimento gratuitamente, mas para um volume maior é necessário pagamento. Mas não há bloqueios e proxies não são necessários.

Por que para Google são necessários proxies móveis

O Google é o criador do reCAPTCHA e um dos líderes na detecção de bots. Proxies residenciais funcionam, mas IPs móveis oferecem resultados significativamente melhores. A razão é simples: o Google é uma plataforma móvel e confia no tráfego móvel. Solicitações de IPs móveis raramente acionam captchas e são menos propensas a serem analisadas comportamentalmente.

Para a coleta em larga escala de Google Reviews (milhares de estabelecimentos por dia), recomenda-se usar proxies móveis rotativos com geolocalização da cidade ou região necessária. Assim, as avaliações serão o mais relevantes possível para a pesquisa local.

Scraping Yelp sem bans: instruções passo a passo

O Yelp é a maior plataforma de avaliações nos EUA. Para marketers que trabalham com o mercado americano, é uma fonte obrigatória de dados sobre concorrentes, sentimentos dos clientes e tendências no nicho. Scraping Yelp é mais difícil do que parece à primeira vista: a plataforma usa Cloudflare e seu próprio sistema de proteção contra bots.

Características da proteção do Yelp

  • Gerenciamento de Bots Cloudflare — analisa comportamento e fingerprint
  • Limitação de solicitações: mais de 30-50 solicitações por minuto de um único IP — banimento
  • Verificações de JavaScript na primeira visita
  • Parte das avaliações está oculta ("filtered reviews") e disponível apenas para usuários autenticados

Instruções passo a passo para Yelp

Passo 1. Escolha uma ferramenta com suporte a Cloudflare. Scrapers comuns não passarão pelo Cloudflare. Use Apify (ator Yelp Scraper), Bright Data Scraping Browser ou PhantomBuster — eles conseguem contornar verificações de JS.

Passo 2. Conecte proxies residenciais com geolocalização dos EUA. O Yelp é voltado para o mercado americano. Proxies com IPs americanos fornecerão o máximo de acesso aos dados e o mínimo de bloqueios.

Passo 3. Configure a rotação a cada 5-10 solicitações. O Yelp é muito sensível à frequência de solicitações. A rotação de IP a cada 5-10 páginas é uma condição obrigatória para um funcionamento estável.

Passo 4. Adicione atrasos de 3-8 segundos entre solicitações. Atrasos aleatórios imitam o comportamento de um usuário real e reduzem significativamente o risco de bloqueio.

Passo 5. Use a Yelp Fusion API para parte dos dados. O Yelp fornece uma API oficial com acesso a dados básicos sobre negócios e avaliações. Para volumes pequenos, este é o caminho mais simples sem risco de bloqueios.

Ferramentas para coleta de avaliações sem escrever código

A boa notícia: para scraping de avaliações, não é necessário ser programador. Existem ferramentas prontas com interface visual que suportam a conexão de proxies e rotação automática de IP. Vamos discutir as mais populares.

Ferramenta Plataformas Suporte a proxies Dificuldade
Octoparse Amazon, Yelp, qualquer site ✅ Lista de proxies + rotação Baixa (modo visual)
Apify Amazon, Google Maps, Yelp ✅ Proxies embutidos + seus próprios proxies Baixa (atores prontos)
PhantomBuster Google Maps, Yelp ✅ Proxies residenciais Baixa (modelos)
ParseHub Amazon, Yelp, qualquer site ✅ Lista de proxies Média
Outscraper Google Reviews, Maps ✅ Embutido Muito baixa (SaaS)

Como conectar proxies no Octoparse (passo a passo)

Octoparse é uma das ferramentas mais populares entre marketers sem formação técnica. Veja como conectar proxies:

  1. Abra o Octoparse → vá para Configurações → Configurações de Proxy
  2. Selecione “Usar proxy personalizado”
  3. Cole a lista de proxies no formato ip:porta:login:senha
  4. Ative “Rotação automática de proxy” — a ferramenta mudará automaticamente o IP
  5. Clique em “Testar proxy” — verifique se todos os proxies estão funcionando
  6. Inicie a tarefa no modo normal

Como conectar proxies no Apify

  1. Acesse apify.com → escolha o ator desejado (por exemplo, “Amazon Reviews Scraper”)
  2. Na seção “Entrada”, encontre o campo “Configuração de Proxy”
  3. Selecione “Proxies personalizados” e cole os dados dos seus proxies
  4. Especifique a URL das páginas com avaliações ou os códigos ASIN dos produtos (para Amazon)
  5. Clique em “Iniciar” — os resultados estarão disponíveis no formato JSON ou Excel

Rotação de proxies e regras de scraping seguro de avaliações

Mesmo os melhores proxies não ajudarão se as regras de scraping seguro não forem seguidas. As plataformas analisam padrões de comportamento, e um padrão de solicitações incorreto pode levar ao bloqueio de todo o pool de IPs.

Regra 1: Rotacione IPs regularmente

Para o Amazon, recomenda-se mudar o IP a cada 10-20 solicitações. Para o Google — a cada 5-10. Para o Yelp — a cada 5-8. Se você estiver usando proxies de sessão (sticky sessions), certifique-se de que a sessão não ultrapasse 10-15 minutos — após isso, solicite um novo IP.

Regra 2: Imite o comportamento real

Um usuário real não faz solicitações com intervalos perfeitos de 2 segundos. Adicione atrasos aleatórios: de 1 a 8 segundos. Às vezes, faça pausas de 30-60 segundos — como se uma pessoa estivesse lendo a página. Isso reduz significativamente a probabilidade de detecção.

Regra 3: Use User-Agents atualizados

O User-Agent deve corresponder a um navegador real. Versões desatualizadas do Chrome ou Firefox imediatamente levantam suspeitas. Atualize o User-Agent pelo menos uma vez por mês. Bons scrapers (Octoparse, Apify) fazem isso automaticamente.

Regra 4: Não faça scraping à noite (de acordo com o horário local da plataforma)

Os sistemas de proteção são mais sensíveis ao tráfego suspeito durante a noite. Se você estiver fazendo scraping do Amazon dos EUA, é melhor fazê-lo durante o dia no horário americano (EST/PST) — quando há muitos usuários reais na plataforma e suas solicitações "afundam" no tráfego geral.

Regra 5: Monitore a taxa de solicitações bem-sucedidas

Um bom indicador é mais de 95% de solicitações bem-sucedidas sem captcha. Se a taxa cair abaixo de 85% — algo está errado. Verifique: se os proxies estão desatualizados, se o algoritmo de proteção mudou, se é necessário atualizar o User-Agent ou aumentar os atrasos.

Checklist de scraping seguro de avaliações:

  • ✅ Proxies residenciais ou móveis com a geolocalização necessária
  • ✅ Rotação de IP a cada 5-20 solicitações (dependendo da plataforma)
  • ✅ Atrasos aleatórios de 1-8 segundos entre solicitações
  • ✅ User-Agent atualizado (última versão do Chrome)
  • ✅ Scraping durante o dia de acordo com o horário local da plataforma
  • ✅ Monitoramento da taxa de solicitações bem-sucedidas (meta: >95%)
  • ✅ Atualização do pool de proxies a cada 1-2 meses

Comparação de tipos de proxies para diferentes plataformas de avaliações

Abaixo está uma tabela resumida que ajudará a escolher rapidamente o tipo de proxy correto para uma tarefa específica. Use-a ao configurar o scraping.

Plataforma Datacenter Residenciais Móveis Recomendação
Avaliações Amazon ❌ Bloqueiam ✅ Bom ✅ Excelente Residenciais (EUA)
Avaliações Google ❌ Bloqueiam ⚠️ Médio ✅ Excelente Móveis
Yelp ❌ Bloqueiam ✅ Bom ✅ Excelente Residenciais (EUA)
Trustpilot ⚠️ Parcialmente ✅ Bom ✅ Excelente Residenciais
Wildberries / Ozon ⚠️ Funcionam ✅ Excelente ✅ Excelente Residenciais (RU)
TripAdvisor ❌ Bloqueiam ✅ Bom ✅ Excelente Residenciais

Por que coletar avaliações: cenários de uso

A coleta automática de avaliações resolve várias tarefas de negócios:

  • Análise de concorrentes. Coleta avaliações sobre produtos concorrentes no Amazon → identifica pontos fracos → usa em seu marketing
  • Monitoramento de reputação. Monitora automaticamente novas avaliações sobre sua marca em todas as plataformas
  • Pesquisa de audiência. Analisa milhares de avaliações → identifica padrões → melhora o produto
  • SEO e conteúdo. Coleta avaliações para análise semântica, identifica palavras-chave que os compradores reais usam
  • Agregadores de avaliações. Cria serviços que agregam avaliações de várias plataformas para negócios

Scraping de avaliações em marketplaces russos

Se seu negócio está voltado para o mercado russo, a coleta de avaliações do Wildberries, Ozon e Yandex.Market também é relevante. Essas plataformas têm uma proteção mais suave em comparação com o Amazon, mas também bloqueiam scraping em massa. Para elas, são suficientes proxies residenciais com IPs russos — eles permitem coletar dados de forma estável sem captcha e bloqueios.

Ferramentas populares para scraping de marketplaces russos: Screaming Frog (com proxies), Octoparse, bem como serviços especializados como Moneyplace ou MPStats, que já incluem proxies em sua infraestrutura.

Conclusão: como começar a coletar avaliações sem bloqueios agora mesmo

A coleta automática de avaliações do Amazon, Google Reviews e Yelp é uma ferramenta poderosa para marketers, analistas e especialistas em e-commerce. O principal obstáculo são os bloqueios. E a principal solução é o tipo correto de proxy combinado com uma configuração inteligente de rotação e atrasos.

Resumindo: para Amazon e Yelp, use proxies residenciais com geolocalização do país necessário. Para Google Reviews — proxies móveis, que oferecem a maior taxa de solicitações bem-sucedidas. Proxies de data centers para essas tarefas são praticamente inúteis — seus IPs já estão em listas negras.

Entre as ferramentas sem código, as melhores opções são Octoparse e Apify — ambas suportam a conexão de proxies externos e rotação automática. Para Google Reviews, também considere o Outscraper — é um serviço especializado que já está otimizado para coleta de dados do Google Maps.

Se você planeja coletar avaliações regularmente de várias plataformas, recomendamos começar com proxies residenciais — eles oferecem o equilíbrio ideal entre velocidade, anonimato e custo, e são adequados para a maioria das tarefas de monitoramento de avaliações. Para trabalhar com Google Reviews, onde a proteção é especialmente agressiva, vale a pena considerar proxies móveis — eles oferecem a maior taxa de solicitações bem-sucedidas sem captcha.

```