Retour au blog

Proxies pour le scraping d'avis sur Amazon, Google Reviews et Yelp : guide complet sans blocages

Vous souhaitez collecter automatiquement des avis sur Amazon, Google Reviews et Yelp, mais vous êtes constamment bloqué ? Dans cet article, nous expliquons quels proxies choisir et comment configurer la collecte de données sans être banni.

📅16 mai 2026
```html

Vous lancez la collecte automatique d'avis sur Amazon ou Google — et après seulement 10-20 requêtes, vous recevez un captcha ou un ban IP. Une histoire familière ? Les marketplaces et les plateformes d'avis se protègent activement contre le parsing : elles détectent les bots, bloquent les plages d'adresses IP des centres de données et exigent la résolution de captchas. Mais avec les bons proxies, ce problème peut être résolu une bonne fois pour toutes.

Dans ce guide, nous allons examiner quel type de proxy convient à chaque plateforme, comment configurer la rotation des IP, quels outils utiliser sans écrire de code — et comment finalement collecter des milliers d'avis chaque jour sans blocages.

Pourquoi Amazon, Google et Yelp bloquent le parsing des avis

Avant de choisir un proxy, il est important de comprendre : pourquoi y a-t-il des blocages ? Ce n'est pas seulement parce que les plateformes « ne veulent pas partager de données ». Elles ont des mécanismes de protection techniques spécifiques qu'il faut contourner intelligemment.

Trop de requêtes depuis une seule IP. Lorsqu'une personne normale parcourt les avis sur Amazon, elle effectue 2 à 5 requêtes par minute. Un parser — des centaines. Le système détecte une activité anormale et bloque l'IP. C'est la raison la plus courante des bans lors de la collecte de données.

Les adresses IP des centres de données sont sur liste noire. Amazon, Google et Yelp ont depuis longtemps mis sur liste noire les plages d'IP des grands fournisseurs de cloud : AWS, Google Cloud, DigitalOcean, Hetzner. Si vous utilisez des proxies bon marché de centres de données avec des adresses « exposées » — vous serez bloqué avant même la première requête.

Analyse de l'empreinte du navigateur et des en-têtes. Les systèmes de protection modernes (Cloudflare, PerimeterX, DataDome) analysent non seulement l'IP, mais aussi les en-têtes HTTP, le User-Agent, le comportement de la souris, la séquence des requêtes. Si les en-têtes trahissent un bot — le blocage est inévitable.

Restrictions géolocalisées. Certains avis sur Amazon ne sont accessibles qu'aux utilisateurs de certains pays. Par exemple, les avis sur amazon.de sont visibles différemment depuis l'Allemagne que depuis la Russie. Pour une collecte de données correcte, des proxies avec la géolocalisation appropriée sont nécessaires.

Captcha et défis JS. Google utilise particulièrement reCAPTCHA. Yelp applique des vérifications JS qui ne passent pas les simples requêtes HTTP. Ces mécanismes nécessitent soit l'utilisation d'outils de navigateur, soit des services spéciaux pour résoudre les captchas.

Conclusion principale :

Les blocages ne sont pas un accident, mais un système. Pour les contourner, il faut une approche globale : le bon type de proxy + rotation des IP + en-têtes de requêtes appropriés + outil de parsing adapté.

Quels types de proxies existent et ce qui convient pour le parsing des avis

Tous les proxies ne sont pas également utiles pour la collecte d'avis. Examinons trois types principaux et leur applicabilité à la tâche.

Proxies de centres de données (Datacenter Proxies)

Ce sont des adresses IP appartenant à des entreprises de serveurs. Elles sont rapides, bon marché et conviennent bien aux tâches où la vitesse est plus importante que l'anonymat. Cependant, pour le parsing des avis sur Amazon ou Google, elles fonctionnent mal : la plupart de ces IP sont déjà sur liste noire. Vous pourrez collecter quelques pages, mais vous obtiendrez rapidement un blocage ou un captcha.

Les proxies de centres de données ne sont justifiés que pour tester le parser ou pour des plateformes avec une protection minimale — par exemple, de petits sites d'avis régionaux.

Proxies résidentiels (Residential Proxies)

Ce sont des adresses IP de véritables utilisateurs domestiques. Du point de vue d'Amazon ou de Google — c'est une personne ordinaire avec Internet à domicile. Ces proxies ne tombent pratiquement jamais sur liste noire, car leurs IP changent constamment et appartiennent à de véritables appareils.

Les proxies résidentiels sont le choix optimal pour le parsing des avis sur Amazon, Yelp et la plupart des plateformes avec une protection modérée. Ils permettent de faire des requêtes avec la géolocalisation requise (pays, ville), ce qui est crucial pour obtenir des avis locaux.

Proxies mobiles (Mobile Proxies)

Adresses IP des opérateurs mobiles (4G/5G). C'est le type de trafic le plus « fiable » pour toute plateforme : les IP mobiles sont rarement bloquées, car derrière une seule IP peuvent se trouver des centaines d'utilisateurs réels (NAT des opérateurs mobiles). Google est particulièrement tolérant envers les adresses mobiles.

Les proxies mobiles sont indispensables pour le parsing des Google Reviews et Yelp, où la protection contre les bots est particulièrement agressive. Ils sont plus chers que les résidentiels, mais offrent le plus haut pourcentage de requêtes réussies sans captcha.

Parsing des avis Amazon : spécificités et configuration des proxies

Amazon est l'un des sites les plus difficiles à parser. L'entreprise utilise plusieurs niveaux de protection simultanément : analyse du comportement, vérification des en-têtes, géolocalisation et un système de captcha agressif. Néanmoins, des milliers de marketeurs et d'analystes collectent quotidiennement des avis sur Amazon — ils le font simplement correctement.

Ce qu'il faut pour un parsing réussi des avis Amazon

Voici le minimum de conditions dans lesquelles le parsing fonctionnera de manière stable :

  • Proxies résidentiels ou mobiles avec géolocalisation du pays requis (US pour amazon.com, DE pour amazon.de)
  • Rotation des IP — au moins toutes les 10-30 requêtes
  • User-Agent correct — imitation d'un véritable navigateur (Chrome, Firefox)
  • Délai entre les requêtes — 2-5 secondes, pour ne pas avoir l'air d'un bot
  • Cookies de session — Amazon réagit mieux aux requêtes avec des cookies sauvegardés

Configuration étape par étape pour Amazon

Étape 1. Choisissez des proxies résidentiels avec géolocalisation du pays requis. Pour amazon.com — États-Unis, pour amazon.co.uk — Royaume-Uni. C'est important : Amazon affiche des avis différents aux utilisateurs de différents pays.

Étape 2. Configurez la rotation. Si vous utilisez un parser prêt à l'emploi (par exemple, Octoparse ou ParseHub), indiquez les proxies dans les paramètres de connexion. La plupart de ces outils prennent en charge une liste de proxies avec rotation automatique.

Étape 3. Définissez des délais entre les requêtes. Dans Octoparse, cela se fait dans la section « Paramètres de délai » — définissez un intervalle aléatoire de 2 à 6 secondes.

Étape 4. Lancez un test sur 50-100 pages. Si le captcha apparaît plus de 5 % du temps — augmentez le délai ou changez le pool de proxies.

Étape 5. Évoluez. Après un test réussi, vous pouvez commencer à collecter des milliers d'avis. Un bon pool de proxies résidentiels permet de collecter 5000-10000 avis par jour sans blocages.

Important concernant Amazon :

Amazon met régulièrement à jour ses algorithmes de protection. Si votre parser fonctionnait il y a un mois, mais commence maintenant à recevoir des blocages — il est probable que l'algorithme de vérification ait changé. Solution : mettez à jour le User-Agent à la version actuelle de Chrome et vérifiez si vos proxies ne sont pas sur liste noire.

Collecte des avis Google Reviews : ce qu'il faut savoir

Google Reviews — avis sur Google Maps et Google Business Profile — est une source de données précieuse pour les marketeurs, les spécialistes du SEO et les analystes. Mais Google protège ses données de manière particulièrement agressive : reCAPTCHA v3, analyse du comportement, vérification de l'empreinte du navigateur.

La principale difficulté : les Google Reviews ne se chargent pas via une requête HTTP classique. Les avis sont chargés dynamiquement via JavaScript. Cela signifie qu'un simple parser HTTP ne fonctionnera pas — il faut un outil capable de rendre JavaScript (parser de navigateur).

Comment collecter correctement les Google Reviews

Option 1 : Services prêts à l'emploi. Des outils comme Outscraper, Apify (acteur Google Maps Scraper) ou PhantomBuster peuvent collecter des Google Reviews via un moteur de navigateur. Vous devez simplement indiquer l'URL ou le nom de l'établissement et connecter un proxy.

Option 2 : Octoparse en mode navigateur. Octoparse prend en charge le mode de rendu de navigateur. Dans les paramètres, indiquez des proxies résidentiels ou mobiles — et l'outil collectera des avis comme un véritable utilisateur.

Option 3 : Google Places API. La voie officielle consiste à utiliser Google Places API. Il fournit jusqu'à 5 avis par établissement gratuitement, mais pour un volume plus important, un paiement est nécessaire. Pas de blocages et pas besoin de proxies.

Pourquoi des proxies mobiles sont nécessaires pour Google

Google est le créateur de reCAPTCHA et l'un des leaders dans le domaine de la détection des bots. Les proxies résidentiels fonctionnent, mais les IP mobiles donnent des résultats nettement meilleurs. La raison est simple : Google est lui-même une plateforme mobile et fait confiance au trafic mobile. Les requêtes avec des IP mobiles déclenchent moins souvent des captchas et sont moins susceptibles d'être soumises à une analyse comportementale.

Pour une collecte à grande échelle des Google Reviews (des milliers d'établissements par jour), il est recommandé d'utiliser des proxies mobiles rotatifs avec une géolocalisation de la ville ou de la région requise. Ainsi, les avis seront maximement pertinents pour la recherche locale.

Parsing de Yelp sans bans : instructions étape par étape

Yelp est la plus grande plateforme d'avis aux États-Unis. Pour les marketeurs travaillant avec le marché américain, c'est une source incontournable de données sur les concurrents, les sentiments des clients et les tendances dans la niche. Parser Yelp est plus difficile qu'il n'y paraît au premier abord : la plateforme utilise Cloudflare et son propre système de protection contre les bots.

Spécificités de la protection Yelp

  • Gestion des bots Cloudflare — analyse le comportement et l'empreinte
  • Limitation des requêtes : plus de 30-50 requêtes par minute depuis une seule IP — ban
  • Vérifications JavaScript lors de la première visite
  • Une partie des avis est cachée (« filtered reviews ») et accessible uniquement aux utilisateurs authentifiés

Instructions étape par étape pour Yelp

Étape 1. Choisissez un outil prenant en charge Cloudflare. Les parsers classiques ne passeront pas Cloudflare. Utilisez Apify (acteur Yelp Scraper), Bright Data Scraping Browser ou PhantomBuster — ils savent contourner les vérifications JS.

Étape 2. Connectez des proxies résidentiels avec géolocalisation aux États-Unis. Yelp est orienté vers le marché américain. Les proxies avec des IP américaines donneront un accès maximal aux données et un minimum de blocages.

Étape 3. Configurez la rotation toutes les 5-10 requêtes. Yelp est très sensible à la fréquence des requêtes. La rotation des IP toutes les 5-10 pages est une condition obligatoire pour un fonctionnement stable.

Étape 4. Ajoutez des délais de 3 à 8 secondes entre les requêtes. Des délais aléatoires imitent le comportement d'un véritable utilisateur et réduisent considérablement le risque de blocage.

Étape 5. Utilisez l'API Yelp Fusion pour certaines données. Yelp propose une API officielle avec accès aux données de base sur les entreprises et les avis. Pour de petits volumes, c'est le moyen le plus simple sans risque de blocages.

Outils pour collecter des avis sans écrire de code

Bonne nouvelle : pour le parsing des avis, il n'est pas nécessaire d'être programmeur. Il existe des outils prêts à l'emploi avec une interface visuelle qui prennent en charge la connexion de proxies et la rotation automatique des IP. Examinons les plus populaires d'entre eux.

Outil Plateformes Support des proxies Difficulté
Octoparse Amazon, Yelp, tous les sites ✅ Liste de proxies + rotation Faible (mode visuel)
Apify Amazon, Google Maps, Yelp ✅ Proxies intégrés + vos propres proxies Faible (acteurs prêts à l'emploi)
PhantomBuster Google Maps, Yelp ✅ Proxies résidentiels Faible (modèles)
ParseHub Amazon, Yelp, tous les sites ✅ Liste de proxies Moyenne
Outscraper Google Reviews, Maps ✅ Intégré Très faible (SaaS)

Comment connecter des proxies dans Octoparse (étape par étape)

Octoparse est l'un des outils les plus populaires parmi les marketeurs sans formation technique. Voici comment connecter des proxies :

  1. Ouvrez Octoparse → allez dans Settings → Proxy Settings
  2. Sélectionnez « Use custom proxy »
  3. Collez la liste de proxies au format ip:port:login:password
  4. Activez « Auto rotate proxy » — l'outil changera automatiquement d'IP
  5. Cliquez sur « Test proxy » — assurez-vous que tous les proxies fonctionnent
  6. Lancez la tâche en mode normal

Comment connecter des proxies dans Apify

  1. Allez sur apify.com → choisissez l'acteur souhaité (par exemple, « Amazon Reviews Scraper »)
  2. Dans la section « Input », trouvez le champ « Proxy configuration »
  3. Sélectionnez « Custom proxies » et collez les données de vos proxies
  4. Indiquez l'URL des pages avec des avis ou les codes ASIN des produits (pour Amazon)
  5. Cliquez sur « Start » — les résultats seront disponibles au format JSON ou Excel

Rotation des proxies et règles de parsing sécurisé des avis

Même les meilleurs proxies ne vous aideront pas si vous ne respectez pas les règles de parsing sécurisé. Les plateformes analysent les modèles de comportement, et un seul modèle de requêtes incorrect peut entraîner le blocage de l'ensemble du pool d'IP.

Règle 1 : Faites tourner les IP régulièrement

Pour Amazon, il est recommandé de changer d'IP toutes les 10-20 requêtes. Pour Google — toutes les 5-10. Pour Yelp — toutes les 5-8. Si vous utilisez des proxies de session (sticky sessions), assurez-vous que la session ne dépasse pas 10-15 minutes — après cela, demandez une nouvelle IP.

Règle 2 : Imitez le comportement réel

Un utilisateur réel ne fait pas de requêtes avec des intervalles parfaits de 2 secondes. Ajoutez des délais aléatoires : de 1 à 8 secondes. Parfois, faites des pauses de 30 à 60 secondes — comme si une personne lisait la page. Cela réduit considérablement le risque de détection.

Règle 3 : Utilisez des User-Agent actuels

Le User-Agent doit correspondre à un véritable navigateur. Les anciennes versions de Chrome ou Firefox suscitent immédiatement des soupçons. Mettez à jour le User-Agent au moins une fois par mois. Les bons parsers (Octoparse, Apify) le font automatiquement.

Règle 4 : Ne parsez pas la nuit (selon l'heure locale de la plateforme)

Les systèmes de protection sont plus sensibles au trafic suspect la nuit. Si vous parsez Amazon US, il est préférable de le faire pendant la journée selon l'heure américaine (EST/PST) — lorsque la plateforme a de nombreux utilisateurs réels et que vos requêtes « se noient » dans le trafic général.

Règle 5 : Surveillez le pourcentage de requêtes réussies

Un bon indicateur est de plus de 95 % de requêtes réussies sans captcha. Si le pourcentage tombe en dessous de 85 % — quelque chose ne va pas. Vérifiez : vos proxies ne sont-ils pas obsolètes, l'algorithme de protection a-t-il changé, devez-vous mettre à jour le User-Agent ou augmenter les délais.

Checklist pour un parsing sécurisé des avis :

  • ✅ Proxies résidentiels ou mobiles avec la géolocalisation requise
  • ✅ Rotation des IP toutes les 5-20 requêtes (selon la plateforme)
  • ✅ Délais aléatoires de 1 à 8 secondes entre les requêtes
  • ✅ User-Agent actuel (dernière version de Chrome)
  • ✅ Parsing pendant la journée selon l'heure locale de la plateforme
  • ✅ Surveillance du pourcentage de requêtes réussies (objectif : >95 %)
  • ✅ Mise à jour du pool de proxies tous les 1-2 mois

Comparaison des types de proxies pour différentes plateformes d'avis

Ci-dessous se trouve un tableau récapitulatif qui vous aidera à choisir rapidement le bon type de proxy pour une tâche spécifique. Orientez-vous dessus lors de la configuration du parsing.

Plateforme Datacenter Résidentiels Mobiles Recommandation
Avis Amazon ❌ Bloqués ✅ Bien ✅ Excellent Résidentiels (US)
Avis Google ❌ Bloqués ⚠️ Moyen ✅ Excellent Mobiles
Yelp ❌ Bloqués ✅ Bien ✅ Excellent Résidentiels (US)
Trustpilot ⚠️ Partiellement ✅ Bien ✅ Excellent Résidentiels
Wildberries / Ozon ⚠️ Fonctionnent ✅ Excellent ✅ Excellent Résidentiels (RU)
TripAdvisor ❌ Bloqués ✅ Bien ✅ Excellent Résidentiels

Pourquoi collecter des avis : scénarios d'utilisation

La collecte automatique d'avis résout plusieurs problèmes commerciaux :

  • Analyse des concurrents. Vous collectez des avis sur les produits des concurrents sur Amazon → vous trouvez des points faibles → vous les utilisez dans votre marketing
  • Surveillance de la réputation. Vous suivez automatiquement les nouveaux avis sur votre marque sur toutes les plateformes
  • Recherche d'audience. Vous analysez des milliers d'avis → vous identifiez des modèles → vous améliorez le produit
  • SEO et contenu. Vous collectez des avis pour une analyse sémantique, identifiez les mots-clés utilisés par de vrais acheteurs
  • Agrégateurs d'avis. Vous créez des services qui agrègent des avis de plusieurs plateformes pour les entreprises

Parsing des avis sur les marketplaces russes

Si votre entreprise est orientée vers le marché russe, la collecte d'avis sur Wildberries, Ozon et Yandex.Market vous concerne également. Ces plateformes ont une protection moins stricte par rapport à Amazon, mais bloquent également le parsing de masse. Pour elles, des proxies résidentiels avec des IP russes suffisent — ils permettent de collecter des données de manière stable sans captcha ni bans.

Outils populaires pour le parsing des marketplaces russes : Screaming Frog (avec proxies), Octoparse, ainsi que des services spécialisés comme Moneyplace ou MPStats, qui intègrent déjà des proxies dans leur infrastructure.

Conclusion : comment commencer à collecter des avis sans blocages dès maintenant

La collecte automatique d'avis sur Amazon, Google Reviews et Yelp est un outil puissant pour les marketeurs, les analystes et les spécialistes de l'e-commerce. Le principal obstacle — les blocages. Et la principale solution — le bon type de proxy associé à une configuration intelligente de la rotation et des délais.

En résumé : pour Amazon et Yelp, utilisez des proxies résidentiels avec la géolocalisation du pays requis. Pour Google Reviews — des proxies mobiles, ils offrent le plus haut pourcentage de requêtes réussies. Les proxies de centres de données sont pratiquement inutiles pour ces tâches — leurs IP sont depuis longtemps sur liste noire.

Parmi les outils sans code, Octoparse et Apify sont les mieux adaptés — tous deux prennent en charge la connexion de proxies externes et la rotation automatique. Pour Google Reviews, envisagez également Outscraper — c'est un service spécialisé qui est déjà optimisé pour la collecte de données Google Maps.

Si vous prévoyez de collecter régulièrement des avis sur plusieurs plateformes, nous vous recommandons de commencer par des proxies résidentiels — ils offrent un équilibre optimal entre vitesse, anonymat et coût, et conviennent à la plupart des tâches de surveillance des avis. Pour travailler avec Google Reviews, où la protection est particulièrement agressive, envisagez des proxies mobiles — ils offrent le plus haut pourcentage de requêtes réussies sans captcha.

```