Si vous vendez sur Ozon, vous savez que les prix changent 10 à 20 fois par jour. Les concurrents pratiquent le dumping, les algorithmes du marketplace recalculent les classements, et vous perdez des ventes parce que vous n'avez pas pu ajuster votre prix à temps. La surveillance manuelle prend des heures, tandis que les parseurs automatiques se font bloquer après 50 à 100 requêtes. Dans cet article, nous allons examiner comment configurer une surveillance stable des prix sur Ozon via des proxies, quels outils utiliser et comment éviter les erreurs courantes qui entraînent des blocages.
Pourquoi Ozon bloque la surveillance des prix
Ozon, comme d'autres grands marketplaces (Wildberries, Yandex.Market), se protège activement contre la collecte automatique de données. La raison est simple : le parsing crée une charge supplémentaire sur les serveurs, et la collecte massive de prix est utilisée non seulement par les vendeurs, mais aussi par les concurrents du marketplace pour analyser l'assortiment.
Voici ce qui se passe lorsque vous essayez de surveiller les prix sans protection :
- Blocage par adresse IP — après 50 à 150 requêtes depuis une seule IP, Ozon commence à afficher un captcha ou bloque complètement l'accès pendant 1 à 24 heures. Cela se produit parce qu'un utilisateur normal ne peut pas physiquement consulter 100 fiches produits en une minute.
- Détection par User-Agent — si vous utilisez un User-Agent standard du parseur (par exemple, Python-requests/2.28), le système reconnaît immédiatement la requête automatique et la bloque.
- Analyse du comportement — Ozon suit la vitesse des requêtes, l'absence d'actions (défilement, clics), des intervalles identiques entre les requêtes. Si votre script effectue des requêtes toutes les 5 secondes exactement, c'est un signe évident de bot.
- Empreinte du navigateur — lors de l'utilisation de navigateurs sans tête (Selenium, Puppeteer), Ozon peut détecter l'absence de WebGL, de canvas ou d'autres signes d'un véritable navigateur.
D'après notre expérience avec les vendeurs, sans l'utilisation de proxies, une surveillance stable est impossible dès que vous suivez plus de 20 produits. Si vous devez vérifier les prix des concurrents sur 100 à 500 positions plusieurs fois par jour, les proxies deviennent un outil indispensable.
Important : Ozon ne interdit pas la surveillance des prix en tant que telle — le marketplace lutte contre la charge sur les serveurs. Si vous respectez des limites raisonnables de requêtes (pas plus de 1 à 2 requêtes par seconde depuis une seule IP) et utilisez la rotation des proxies, vous pouvez éviter complètement les blocages.
Quels proxies conviennent pour le parsing Ozon
Le choix du type de proxy influence directement la stabilité de la surveillance et le coût de la solution. Examinons trois options principales et leur applicabilité pour travailler avec Ozon.
Proxies résidentiels — le choix optimal pour Ozon
Les proxies résidentiels utilisent des adresses IP de véritables utilisateurs domestiques qui ont mis leurs appareils à disposition du réseau du fournisseur de proxy. Pour Ozon, ces requêtes ressemblent à celles de visiteurs ordinaires du site, ce qui réduit pratiquement les blocages.
Avantages pour la surveillance Ozon :
- Score de confiance élevé — les IP appartiennent à de véritables fournisseurs (Rostelecom, MTS, Beeline), et non à des centres de données
- Risque minimal de ban — même lors d'un parsing intensif (jusqu'à 1000 requêtes par heure avec rotation)
- Répartition géographique — vous pouvez surveiller les prix depuis différentes régions de Russie (Moscou, Saint-Pétersbourg, Ekaterinbourg), car Ozon affiche des prix différents selon la région de livraison
- Longue durée de session — vous pouvez utiliser une IP jusqu'à 30 minutes sans rotation
Inconvénients : coût plus élevé par rapport aux proxies de centres de données (généralement à partir de 3-5 $ pour 1 Go de trafic). Cependant, pour la surveillance des prix, le trafic est minimal — vérifier 1000 produits prend généralement 50-100 Mo.
Proxies mobiles — fiabilité maximale
Les proxies mobiles utilisent des IP de fournisseurs de services mobiles (MTS, Beeline, Megafon, Tele2). C'est le type d'IP le plus fiable pour tous les marketplaces, car la plupart des acheteurs Ozon accèdent au site via des appareils mobiles.
Quand choisir des proxies mobiles :
- Vous avez déjà reçu des blocages en utilisant des proxies résidentiels
- Vous devez parser des données particulièrement protégées (par exemple, des prix dans des catégories fermées)
- Vous surveillez non seulement les prix, mais aussi les avis, les notes, les stocks de produits
- Vous travaillez avec de grands volumes (5000+ produits par jour)
La particularité des proxies mobiles — l'IP change automatiquement lors de la reconnexion au réseau de l'opérateur (généralement toutes les 5 à 15 minutes). Cela permet une rotation naturelle sans réglages supplémentaires.
Proxies de centres de données — option économique avec des limitations
Les proxies de centres de données sont des adresses IP de serveurs dans des centres de données. Ils sont beaucoup moins chers (à partir de 0,5 $ pour 1 Go), mais Ozon reconnaît facilement ces IP et les bloque plus souvent.
Quand utiliser des proxies de centres de données pour Ozon :
- Vous surveillez un petit nombre de produits (jusqu'à 50 positions)
- Vous vérifiez les prix rarement (1-2 fois par jour)
- Vous utilisez un grand pool d'IP (au moins 50-100 adresses) avec rotation
- Vous testez le parseur avant d'acheter des proxies résidentiels
D'après notre expérience, les proxies de centres de données ne conviennent que pour des tâches simples. Si vous vous engagez sérieusement dans la surveillance des prix sur Ozon, il est préférable d'utiliser directement des proxies résidentiels — cela vous fera gagner du temps dans la lutte contre les blocages.
| Type de proxy | Score de confiance pour Ozon | Coût | Recommandation |
|---|---|---|---|
| Résidentiels | Élevé (9/10) | 3-5$ par Go | Optimal pour une surveillance continue |
| Mobiles | Maximal (10/10) | 8-15$ par IP/mois | Pour de grands volumes et des données protégées |
| Centre de données | Bas (4/10) | 0.5-1$ par Go | Uniquement pour des tests ou de petits volumes |
Comparaison des outils de surveillance des prix
Pour suivre les prix sur Ozon, il existe trois approches principales : des services SaaS prêts à l'emploi, des programmes de bureau pour le parsing et des scripts personnalisés. Examinons chaque option en termes de commodité, de coût et de nécessité d'utiliser des proxies.
Services SaaS de surveillance prêts à l'emploi
Ce sont des plateformes cloud qui contiennent déjà des parseurs intégrés et des proxies. Vous indiquez simplement les articles à suivre et recevez des rapports prêts à l'emploi avec la dynamique des prix.
Services populaires pour Ozon :
- Moneyplace — service spécialisé pour les vendeurs de marketplaces. Prend en charge Ozon, Wildberries, Yandex.Market. Coût à partir de 1500 roubles/mois pour la surveillance de 100 produits.
- Mpstats — analyse et surveillance des concurrents. Montre non seulement les prix, mais aussi les ventes, les stocks, les positions dans la recherche. À partir de 2000 roubles/mois.
- SellerFox — outil complet pour la gestion des ventes sur Ozon. Inclut la surveillance des prix, la tarification automatique, l'analyse. À partir de 3000 roubles/mois.
- Marketguru — option économique avec des fonctionnalités de base. À partir de 900 roubles/mois pour 50 produits.
Avantages : pas besoin de se soucier des proxies et du parsing, tout fonctionne "clé en main", il y a des rapports prêts à l'emploi et des notifications de changement de prix.
Inconvénients : paiement mensuel, limitations sur le nombre de produits, pas de flexibilité dans la configuration (par exemple, impossible de parser des données supplémentaires comme les caractéristiques ou les avis).
Parseurs de bureau (Datacol, Octoparse, ParseHub)
Ce sont des programmes que vous installez sur votre ordinateur et qui vous permettent de configurer le parsing de n'importe quelles données sur les sites sans programmation. Vous indiquez visuellement quels éléments vous souhaitez collecter (prix, nom, note), et le programme les extrait automatiquement.
Comment fonctionne l'association "parseur + proxy" pour Ozon :
- Vous créez une tâche de parsing dans le programme (par exemple, collecter les prix à partir d'une liste d'URL de produits)
- Dans les paramètres, vous indiquez le serveur proxy (IP:PORT:LOGIN:PASSWORD)
- Le programme effectue automatiquement des requêtes via le proxy avec le délai spécifié
- Les résultats sont exportés vers Excel, CSV ou Google Sheets
Parseurs populaires pour travailler avec Ozon :
- Datacol — parseur russe avec une interface simple. Prend en charge les proxies, la rotation des User-Agent, le travail avec les captchas. Coût à partir de 4000 roubles pour une licence.
- Octoparse — service international avec parsing cloud. Il existe un tarif gratuit (jusqu'à 10 tâches). Tarifs payants à partir de 75$ par mois.
- ParseHub — parseur facile à utiliser. Gratuit pour parser jusqu'à 200 pages par lancement. Tarifs payants à partir de 149$ par mois.
Avantages : flexibilité de configuration, possibilité de parser n'importe quelles données, paiement unique (pour certains programmes), fonctionne localement sur votre ordinateur.
Inconvénients : vous devez acheter et configurer vous-même les proxies, cela nécessite du temps pour maîtriser le programme, l'ordinateur doit être allumé pendant le parsing (si vous n'utilisez pas la version cloud).
Scripts personnalisés en Python ou Node.js
Si vous avez des compétences de base en programmation ou si vous avez un développeur dans votre équipe, vous pouvez écrire votre propre parseur. Cela offre une flexibilité maximale et un coût minimal pour de grands volumes.
Stack typique pour le parsing Ozon :
- Python + requests + BeautifulSoup — pour le parsing simple de HTML (si Ozon renvoie des données dans le code source de la page)
- Python + Selenium/Playwright — pour le parsing via le navigateur (si les données sont chargées via JavaScript)
- Node.js + Puppeteer — alternative en JavaScript, fonctionne bien avec les sites dynamiques
- Scrapy — framework professionnel pour le parsing à grande échelle (si vous devez surveiller 10000+ produits)
Avantages : contrôle total sur le processus, possibilité de parser n'importe quelles données dans n'importe quel format, pas de paiements mensuels pour le service, facilement évolutif.
Inconvénients : nécessite des compétences en programmation, vous devez gérer vous-même les erreurs et les blocages, nécessite du temps pour le développement et le support.
| Outil | Difficulté de configuration | Des proxies sont-ils nécessaires ? | Coût | Pour qui |
|---|---|---|---|---|
| Services SaaS | Faible (5 minutes) | Non (intégrés) | À partir de 900 roubles/mois | Débutants, petites entreprises |
| Parseurs de bureau | Moyenne (1-2 heures) | Oui (à acheter séparément) | À partir de 4000 roubles une fois + proxies | Moyennes entreprises, besoin de flexibilité |
| Scripts personnalisés | Élevée (à partir de 8 heures) | Oui (à acheter séparément) | Temps de développement + proxies | Grandes entreprises, grands volumes |
Guide étape par étape pour configurer la surveillance via des proxies
Examinons la configuration pratique de la surveillance des prix à l'aide du parseur populaire Datacol et des proxies résidentiels. Cette méthode convient à la plupart des vendeurs qui souhaitent suivre 50 à 500 produits sans programmation.
Étape 1 : Préparation de la liste des produits à surveiller
Commencez par déterminer quels produits vous devez suivre. En général, ce sont :
- Vos propres produits (pour contrôler si d'autres vendeurs pratiquent le dumping sur le même produit)
- Concurrents directs (top 10 des produits dans votre catégorie)
- Produits analogues (similaires en caractéristiques et en prix)
Créez un fichier Excel avec les colonnes suivantes :
- URL du produit — lien complet vers la fiche produit sur Ozon (par exemple : https://www.ozon.ru/product/naushniki-apple-airpods-pro-123456789/)
- Référence — pour votre suivi
- Nom — description courte du produit
- Catégorie — pour le regroupement dans les rapports
Cette liste sera la base pour le parseur. Enregistrez le fichier au format CSV pour un chargement facile dans le parseur.
Étape 2 : Achat et configuration des proxies
Pour surveiller 100 à 200 produits une fois par heure, des proxies résidentiels avec un pool d'au moins 1000 IP suffisent. Voici ce qu'il faut prendre en compte lors de l'achat :
- Géolocalisation — choisissez des proxies en Russie (si vous surveillez Ozon russe). Vous pouvez choisir une région spécifique si les prix régionaux sont importants pour vous.
- Type de rotation — pour Ozon, la rotation par requête (chaque requête = nouvelle IP) ou avec un intervalle de 5 à 10 minutes est optimale.
- Protocole — les proxies HTTP/HTTPS conviennent à la plupart des parseurs. SOCKS5 n'est nécessaire que pour des tâches spécifiques.
- Format d'accès — il est plus pratique de travailler avec le format IP:PORT:LOGIN:PASSWORD ou via API avec rotation automatique.
Après l'achat, vous recevrez les données de connexion. Format typique :
Serveur proxy: gate.proxycove.com:8080
Login: user12345
Mot de passe: pass67890
Ou format direct : gate.proxycove.com:8080:user12345:pass67890
Étape 3 : Configuration du parseur Datacol
Datacol est un parseur visuel qui ne nécessite pas de programmation. Voici comment le configurer pour surveiller Ozon :
- Installez Datacol — téléchargez le programme depuis le site officiel et activez la licence.
- Créez un nouveau projet — cliquez sur "Créer un projet" et choisissez le mode "Liste d'URL" (puisque vous avez déjà une liste de liens vers les produits).
- Importez la liste des produits — importez votre fichier CSV avec les URL des produits.
- Configurez le proxy — ouvrez "Paramètres" → "Proxy" → sélectionnez "Proxy HTTP" → entrez les données de votre serveur proxy (IP:PORT:LOGIN:PASSWORD). Activez l'option "Rotation des proxies" et définissez un intervalle de 5 à 10 minutes.
- Indiquez les éléments à parser — ouvrez n'importe quelle fiche produit dans le navigateur intégré de Datacol. Cliquez avec le bouton droit sur le prix → "Ajouter au schéma". Répétez pour le nom, la note, le nombre d'avis.
- Configurez les délais — dans les paramètres du projet, définissez un délai entre les requêtes de 3 à 7 secondes (aléatoire). Cela imite le comportement d'un utilisateur réel.
- Configurez le User-Agent — activez la rotation du User-Agent à partir d'une liste de navigateurs populaires (Chrome, Firefox, Safari).
Après la configuration, cliquez sur "Démarrer le parsing". Datacol commencera à parcourir votre liste de produits, en changeant automatiquement d'IP et de User-Agent. Les résultats seront enregistrés dans un tableau en temps réel.
Étape 4 : Configuration du calendrier et exportation des données
Pour automatiser la surveillance, configurez un calendrier pour le démarrage du parsing :
- Dans Datacol, ouvrez "Planificateur de tâches"
- Créez une tâche "Démarrer le parsing" avec la fréquence souhaitée (par exemple, toutes les 6 heures)
- Configurez l'exportation des résultats vers Google Sheets ou Excel (ajout automatique de nouvelles lignes avec un horodatage)
- Activez les notifications par email lors d'un changement de prix supérieur à 10%
Vous avez maintenant un système de surveillance des prix entièrement automatisé qui fonctionne 24 heures sur 24 sans votre intervention.
Conseil : Créez un tableau de bord dans Google Sheets avec des formules qui mettent automatiquement en surbrillance les produits où les concurrents ont baissé les prix. Cela vous permettra de réagir rapidement aux changements du marché.
Configuration de la rotation IP et des délais entre les requêtes
Une bonne configuration de la rotation des proxies et des délais est la clé d'un parsing stable sans blocages. Même avec des proxies résidentiels de qualité, vous pouvez être bloqué si vous ne configurez pas correctement la fréquence des requêtes.
Fréquence optimale de rotation IP pour Ozon
Ozon analyse non seulement le nombre de requêtes d'une seule IP, mais aussi les modèles de comportement. Voici les paramètres recommandés :
| Volume de parsing | Rotation IP | Délai entre les requêtes | Max. requêtes depuis 1 IP |
|---|---|---|---|
| Jusqu'à 50 produits | Toutes les 10-15 minutes | 5-10 secondes (aléatoire) | Jusqu'à 50 |
| 50-200 produits | Toutes les 5-10 minutes | 3-7 secondes (aléatoire) | Jusqu'à 30 |
| 200-1000 produits | Chaque requête (ou toutes les 2-3 requêtes) | 2-5 secondes (aléatoire) | Jusqu'à 10-15 |
| 1000+ produits | Chaque requête | 1-3 secondes (aléatoire) | Jusqu'à 5-10 |
Point clé : les délais doivent être aléatoires ! Si votre parseur effectue des requêtes exactement toutes les 5 secondes, c'est un signe évident de bot. Utilisez la randomisation : par exemple, entre 3 et 7 secondes.
Configuration de la rotation dans des outils populaires
Dans Datacol :
- Ouvrez "Paramètres" → "Proxy"
- Activez "Rotation automatique des proxies"
- Choisissez le mode : "Par temps" (toutes les X minutes) ou "Par nombre de requêtes" (toutes les X requêtes)
- Définissez le délai dans la section "Paramètres" → "Délais" → choisissez "Délai aléatoire" et indiquez la plage (par exemple, 3000-7000 ms)
Dans Octoparse :
- Dans les paramètres de la tâche, sélectionnez "Paramètres avancés" → "Paramètres de proxy"
- Activez "Rotation de l'IP du proxy" et définissez l'intervalle
- Dans la section "Paramètres AJAX/Paging", définissez "Temps d'attente" avec randomisation
Dans des scripts personnalisés en Python :
import time
import random
import requests
proxies_list = [
"http://user1:pass1@gate.proxycove.com:8080",
"http://user2:pass2@gate.proxycove.com:8080",
# ... autres proxies
]
for url in urls_to_parse:
proxy = random.choice(proxies_list) # Choix aléatoire du proxy
proxies = {"http": proxy, "https": proxy}
response = requests.get(url, proxies=proxies)
# ... traitement des données
delay = random.uniform(3, 7) # Délai aléatoire de 3 à 7 secondes
time.sleep(delay)
Mesures supplémentaires de protection contre la détection
En plus de la rotation IP et des délais, utilisez ces techniques pour une invisibilité maximale :
- Rotation du User-Agent — utilisez une liste de 10 à 20 User-Agent populaires provenant de véritables navigateurs. Changez-le avec l'IP.
- Référents — ajoutez dans les en-têtes des requêtes un Referer provenant de pages internes d'Ozon (par exemple, depuis la page de catégorie ou de recherche) pour imiter la navigation sur le site.
- Cookies — conservez les cookies pour chaque IP et réutilisez-les lors des prochaines requêtes depuis la même IP.
- Accept-Language — définissez l'en-tête Accept-Language : ru-RU,ru;q=0.9 pour imiter un utilisateur russe.
Important : N'utilisez pas de navigateurs sans tête (Selenium, Puppeteer) sans un masquage supplémentaire. Ozon détecte facilement le mode sans tête par l'absence de WebGL, de plugins et d'autres signes. Si vous utilisez un navigateur, connectez des plugins comme Puppeteer-extra-plugin-stealth.
Erreurs courantes qui entraînent des blocages
Au fil des ans de travail avec des vendeurs, nous avons identifié plusieurs erreurs critiques qui entraînent des blocages même avec des proxies de qualité. Examinons chacune d'elles et voyons comment les éviter.
Erreur 1 : Vitesse de parsing trop élevée
Beaucoup essaient de parser le maximum de données en un minimum de temps, en définissant un délai de 0,5 à 1 seconde entre les requêtes. C'est le moyen le plus rapide d'être bloqué.
Pourquoi c'est un problème : Un utilisateur réel ne peut pas consulter 60 produits par minute. Ozon voit une activité anormale et bloque l'IP.
Solution : Délai minimum — 2-3 secondes pour les proxies résidentiels, 5-7 secondes pour les proxies de centres de données. Oui, le parsing prendra plus de temps, mais il sera stable.
Erreur 2 : Utilisation d'une seule IP pour toutes les requêtes
Certains achètent un seul proxy et l'utilisent pour parser des centaines de produits. Cela ne fonctionne que pour des volumes très faibles (jusqu'à 20-30 produits par jour).
Pourquoi c'est un problème : Ozon voit qu'une seule IP a reçu 200 requêtes sur différents produits en une heure. C'est un signe évident de parseur.
Solution : Utilisez un pool de proxies avec rotation automatique. Pour 100 produits, 10-20 IP différentes avec rotation toutes les 5-10 requêtes suffisent.
Erreur 3 : Ignorer les captchas et les erreurs
Lorsque le parseur reçoit un captcha ou une erreur 429 (Trop de requêtes), certains l'ignorent simplement et continuent d'envoyer des requêtes.
Pourquoi c'est un problème : Cela aggrave la situation — Ozon voit que le bot ignore la protection et bloque l'IP pendant longtemps (parfois définitivement).
Solution : Configurez le traitement des erreurs dans le parseur :
- En cas de captcha — arrêtez le parsing pendant 5-10 minutes, changez d'IP
- En cas d'erreur 429 — doublez le délai, changez d'IP
- En cas d'erreur 403 (Interdit) — changez immédiatement d'IP et de User-Agent
- Utilisez des services de résolution automatique de captcha (2Captcha, Anti-Captcha) pour les tâches critiques
Erreur 4 : Parsing uniquement pendant les heures de travail
Beaucoup lancent le parseur manuellement à la même heure (par exemple, chaque jour à 10h00). Cela crée un modèle prévisible.
Solution : Répartissez le parsing uniformément tout au long de la journée. Si vous devez vérifier les prix 4 fois par jour, lancez-le à des heures aléatoires avec un intervalle de 6±1 heure.
Erreur 5 : Utilisation de proxies publics bon marché
Les proxies gratuits ou très bon marché provenant de listes publiques sont déjà blacklistés par tous les grands sites, y compris Ozon.
Solution : Utilisez des proxies payants de qualité provenant de fournisseurs fiables. Économiser 500-1000 roubles par mois ne vaut pas le temps perdu à lutter contre les blocages.
Comment évoluer la surveillance sur 1000+ produits
Lorsque votre entreprise se développe, il devient nécessaire de suivre non pas 50-100, mais 1000-5000 produits. À ce stade, les parseurs de bureau deviennent inefficaces, et il faut passer à des solutions plus sérieuses.
Parsing cloud plutôt que local
Pour de grands volumes, utilisez des serveurs cloud (VPS/VDS) qui fonctionnent 24/7. Avantages :
- Pas besoin de garder l'ordinateur allumé
- Accès à des ressources plus puissantes pour le parsing
- Possibilité d'exécuter plusieurs tâches simultanément
- Évolutivité facile en fonction des besoins
En utilisant des solutions cloud, vous pouvez surveiller efficacement un grand nombre de produits sans craindre les blocages.
Conclusion
La surveillance des prix sur Ozon est un processus complexe qui nécessite une approche réfléchie et des outils appropriés. En utilisant des proxies de qualité, en configurant correctement les délais et en évitant les erreurs courantes, vous pouvez établir un système de surveillance efficace qui vous aidera à rester compétitif sur le marché.