Retour au blog

Comment collecter des données sur les vendeurs sur Wildberries et Ozon : méthodes de parsing et contournement de la protection

Guide complet sur la collecte de données sur les vendeurs sur les marketplaces : méthodes de scraping, choix des outils, configuration des proxies et contournement des systèmes anti-bots pour surveiller la concurrence.

📅25 janvier 2026
```html

La surveillance des concurrents sur les marketplaces est une tâche clé pour tout vendeur en ligne. Connaître l'assortiment, les prix, les avis et les stratégies des autres vendeurs permet de prendre des décisions éclairées et de devancer la concurrence. Dans ce guide, nous examinerons les méthodes pratiques de collecte de données sur les vendeurs sur Wildberries, Ozon, Yandex.Market et d'autres plateformes, ainsi que les moyens de contourner les protections anti-bot.

Pourquoi collecter des données sur les vendeurs sur les marketplaces

La collecte d'informations sur les concurrents n'est pas simplement une curiosité, mais une nécessité pour mener à bien des affaires sur les marketplaces. Voici les principales raisons pour lesquelles les vendeurs surveillent régulièrement les autres participants de la plateforme :

Analyse de la politique de prix des concurrents. En connaissant les prix auxquels d'autres vendeurs vendent des produits similaires, vous pouvez ajuster vos prix pour améliorer votre compétitivité. De nombreux vendeurs performants utilisent la tarification dynamique — ils modifient automatiquement les prix en fonction des actions des concurrents.

Étude de l'assortiment et des tendances. Suivre quels produits apparaissent chez les concurrents aide à identifier de nouvelles niches et une demande croissante. Si plusieurs vendeurs ajoutent simultanément une certaine catégorie de produits, cela peut signaler une direction prometteuse.

Surveillance des avis et de la réputation. L'analyse des avis sur les produits des concurrents permet de comprendre ce qui plaît aux clients et ce qui suscite des mécontentements. Ces informations peuvent être utilisées pour améliorer vos propres produits et descriptions.

Évaluation des stratégies de promotion. Étudier comment les concurrents utilisent des photos, des descriptions, des mots-clés et des promotions donne des idées pour vos propres activités marketing. Il est particulièrement utile d'analyser les vendeurs performants dans votre niche.

Recherche de fournisseurs et de fabricants. Parfois, les données sur un vendeur peuvent vous mener à des fournisseurs communs ou vous aider à comprendre d'où les concurrents se procurent leurs produits. Cela aide à optimiser votre propre chaîne d'approvisionnement.

Quelles données sur les vendeurs peuvent être collectées

Les marketplaces fournissent différents volumes d'informations publiques sur les vendeurs. Voici les principaux types de données qui peuvent être collectées pour l'analyse des concurrents :

Informations de base sur le vendeur : nom du magasin, note, nombre d'avis, date d'inscription sur la plateforme, entité juridique (si indiquée), informations de contact.

Assortiment de produits : liste de tous les produits du vendeur, catégories, marques, références, caractéristiques, photos, descriptions, disponibilité en stock.

Informations sur les prix : prix actuels, remises, historique des changements de prix, participation aux promotions de la marketplace, prix tenant compte des codes promo.

Avis et évaluations : nombre d'avis pour chaque produit, note moyenne, texte des avis, photos des clients, réponses du vendeur aux avis.

Indicateurs de vente : nombre de commandes (si disponible), dynamique des stocks, popularité des produits, positions dans les résultats de recherche de la marketplace.

Différentes marketplaces offrent différents niveaux d'accès à l'information. Par exemple, sur Wildberries, vous pouvez voir le nombre de commandes récentes, tandis que sur Ozon, cette information est cachée. Sur Avito, l'historique d'activité du vendeur est accessible, tandis que sur Yandex.Market, des caractéristiques détaillées de livraison sont disponibles.

Méthodes de parsing des marketplaces : manuel vs automatique

Il existe plusieurs approches pour collecter des données sur les vendeurs sur les marketplaces. Le choix de la méthode dépend du volume de données, de la fréquence de mise à jour et des compétences techniques.

Collecte manuelle de données

La méthode la plus simple consiste à parcourir manuellement les pages des vendeurs et à enregistrer les informations nécessaires dans un tableau Excel ou Google Sheets. Cette méthode convient pour des recherches ponctuelles ou pour analyser un petit nombre de concurrents (5-10 vendeurs).

Avantages de la collecte manuelle : ne nécessite pas de compétences techniques, aucun outil supplémentaire n'est nécessaire, faible risque de blocage, possibilité de collecter des informations de qualité en tenant compte du contexte.

Inconvénients : très lent, coûteux en temps, impossible de suivre les changements en temps réel, forte probabilité d'erreurs lors de la saisie manuelle, non évolutif.

Services prêts à l'emploi pour le parsing

Il existe sur le marché des services spécialisés pour la surveillance des marketplaces, qui fournissent des solutions prêtes à l'emploi pour la collecte de données. Exemples : MpStats, SellerFox, Moneyplace, DataOx, Price Tracker et d'autres.

Avantages des services prêts à l'emploi : fonctionnent "prêts à l'emploi", ne nécessitent pas de configuration, fournissent des analyses et des visualisations de données, contournent automatiquement les protections des marketplaces, se mettent à jour régulièrement lors des changements de structure des sites.

Inconvénients : abonnement mensuel (de 2000 à 15000 roubles), limitations sur le nombre de requêtes, ne collectent qu'un ensemble standard de données, dépendance à la stabilité du service.

Parsing automatique avec des parseurs

Pour ceux qui souhaitent avoir un contrôle total sur le processus de collecte de données, il existe des programmes de parsing spécialisés. Ils chargent automatiquement les pages de la marketplace, extraient les informations nécessaires et les enregistrent dans un format pratique.

Outils populaires pour le parsing : Octoparse, ParseHub, WebHarvy, Scrapy (pour les programmeurs), Selenium (pour l'automatisation du navigateur). Ces outils permettent de configurer la collecte précisément des données dont vous avez besoin, sans les limitations des services prêts à l'emploi.

Avantages des parseurs : configuration flexible pour toutes les tâches, possibilité de collecter des données uniques, pas de limitations sur le nombre de requêtes, achat unique ou solutions gratuites, contrôle total sur le processus.

Inconvénients : nécessite du temps pour la configuration, compétences techniques de base requises, nécessité de configurer soi-même le contournement des protections, en cas de changement de la structure du site, il faudra ajuster les paramètres.

Comment les marketplaces se protègent contre le parsing

Les marketplaces luttent activement contre la collecte automatique de données, car le parsing massif crée une charge supplémentaire sur les serveurs et peut être utilisé par des concurrents. Voici les principales méthodes de protection auxquelles vous serez confronté :

Restriction par adresse IP. La protection la plus courante consiste à bloquer les adresses IP à partir desquelles trop de requêtes arrivent en peu de temps. Wildberries et Ozon surveillent la fréquence des requêtes et bloquent temporairement les IP suspectes pendant plusieurs heures ou jours.

Captcha et vérification anti-bot. Lorsqu'une activité suspecte est détectée, la marketplace peut afficher un captcha ou une page de vérification "Êtes-vous un robot ?". Cela arrête le parsing automatique jusqu'à ce que le captcha soit résolu manuellement.

Analyse de l'User-Agent et des en-têtes. Les sites vérifient d'où provient la requête — d'un navigateur ou d'un programme. Les requêtes sans en-têtes appropriés (User-Agent, Referer, Accept-Language) sont souvent bloquées automatiquement.

Protection par JavaScript et chargement dynamique. De nombreuses marketplaces chargent des données via JavaScript après l'ouverture de la page. Les parseurs simples qui téléchargent simplement le HTML ne voient pas ces données et obtiennent des pages vides.

Pièges Honeypot. Des liens cachés peuvent être présents sur les pages, invisibles pour les utilisateurs ordinaires, mais accessibles aux parseurs. Cliquer sur ces liens identifie le bot et entraîne un blocage.

Changement de la structure HTML. Les marketplaces changent périodiquement les noms des classes CSS et la structure des pages pour briser les parseurs configurés. Cela nécessite une mise à jour régulière des paramètres de collecte de données.

Choix des proxy pour le parsing des données des vendeurs

L'utilisation de proxy est une condition essentielle pour un parsing réussi des marketplaces. Les proxy permettent de contourner les restrictions par adresse IP et de faire des requêtes au nom de différents utilisateurs. Le choix du type de proxy dépend de la tâche et du budget.

Comparaison des types de proxy pour le parsing

Type de proxy Vitesse Risque de blocage Prix Quand utiliser
Proxy de centre de données Très élevé Élevé Faible Parsing massif avec rotation, collecte de données publiques
Proxy résidentiels Moyenne Faible Moyenne Parsing avec protection contre les blocages, surveillance à long terme
Proxy mobiles Moyenne Très faible Élevée Parsing avec protection maximale, contournement de protections complexes

Proxy de centre de données pour le parsing

C'est l'option la plus rapide et la moins chère pour le parsing de grandes quantités de données. Les proxy de centre de données sont situés sur des serveurs de fournisseurs d'hébergement et offrent une vitesse de chargement élevée des pages.

Quand les utiliser : pour la collecte de données publiques qui ne nécessitent pas d'authentification ; lors de l'utilisation d'un pool de 50-100+ IP avec rotation automatique ; pour le parsing de petites marketplaces avec peu de protection.

Limitations : les IP de centres de données sont facilement identifiables par les marketplaces et sont souvent bloquées ; Wildberries et Ozon filtrent activement ces IP ; un grand pool d'adresses est nécessaire et la vitesse des requêtes peut être lente.

Proxy résidentiels pour le parsing

Les proxy résidentiels utilisent des adresses IP de véritables fournisseurs d'accès Internet domestiques. Pour les marketplaces, ces requêtes apparaissent comme des actions d'acheteurs ordinaires, ce qui réduit considérablement le risque de blocage.

Quand les utiliser : pour la surveillance régulière des concurrents sur Wildberries et Ozon ; lors du parsing de données nécessitant une authentification ; pour des projets à long terme avec collecte quotidienne de données ; lorsque la stabilité et le faible risque de blocage sont importants.

Particularités d'utilisation : il est possible de faire des requêtes plus lentement, imitant le comportement des utilisateurs réels ; adaptés pour le parsing via l'automatisation du navigateur (Selenium, Puppeteer) ; offrent un accès aux versions régionales des marketplaces.

Proxy mobiles pour des cas complexes

Les proxy mobiles utilisent des adresses IP de fournisseurs de services mobiles. C'est le type de proxy le plus fiable pour contourner les protections, car les marketplaces bloquent très prudemment les IP mobiles — derrière une seule adresse peuvent se trouver des milliers d'utilisateurs réels.

Quand les utiliser : lors du parsing de marketplaces avec des protections très strictes ; lorsque d'autres types de proxy sont déjà bloqués ; pour la collecte de données via les applications mobiles des marketplaces ; lorsque la fiabilité maximale est nécessaire.

Limitations : coût plus élevé par rapport aux proxy résidentiels ; généralement, plusieurs utilisateurs se trouvent derrière une seule IP (IP partagée) ; la vitesse peut être inférieure à celle des proxy filaires.

Services et outils prêts à l'emploi pour la collecte de données

Pour ceux qui ne souhaitent pas configurer le parsing eux-mêmes, il existe des solutions prêtes à l'emploi. Examinons les services populaires pour la surveillance de différentes marketplaces.

Services pour Wildberries

MpStats — l'un des services les plus populaires pour l'analyse de Wildberries. Permet de suivre les ventes des concurrents, de surveiller les prix, d'analyser les avis et de trouver des niches prometteuses. Coût à partir de 3990 roubles par mois. Fournit des rapports et des graphiques prêts à l'emploi, ne nécessite pas de compétences techniques.

SellerFox — service axé sur l'analyse des vendeurs. Montre la dynamique des ventes, les stocks, l'historique des prix. Possède une fonction de suivi de vendeurs spécifiques et d'alertes sur les changements. Prix à partir de 2500 roubles par mois.

Moneyplace — plateforme complète pour l'analyse des marketplaces axée sur la recherche de produits à vendre. Inclut la surveillance des concurrents, l'analyse des niches, le suivi des tendances. Abonnement à partir de 5000 roubles par mois.

Services pour Ozon

Ozon Seller — le cabinet officiel du vendeur Ozon fournit une analyse de base des concurrents. Permet de voir les prix moyens dans la catégorie et les positions de vos produits par rapport à d'autres vendeurs. Gratuit pour les vendeurs Ozon.

DataOx — service spécialisé pour le parsing d'Ozon et d'autres marketplaces. Collecte des données sur les produits, les prix, les vendeurs. Fonctionne via API, adapté pour l'intégration avec vos propres systèmes. Le prix dépend du volume des requêtes.

Price Tracker — service pour suivre les changements de prix sur Ozon. Vous pouvez ajouter des produits concurrents et recevoir des notifications sur les baisses ou hausses de prix. Il existe un tarif gratuit avec des limitations.

Parseurs universels

Octoparse — parseur visuel sans nécessité de programmation. Permet de configurer la collecte de données depuis n'importe quel site, y compris les marketplaces. Dispose de modèles prêts à l'emploi pour les plateformes populaires. Version gratuite avec limitations, version payante à partir de 75 $ par mois.

ParseHub — analogue d'Octoparse avec une interface plus simple. Convient aux débutants. Peut travailler avec des sites JavaScript et l'authentification. Version gratuite permettant de créer jusqu'à 5 projets, version payante à partir de 149 $ par mois.

WebHarvy — programme de parsing de bureau. Fonctionne sur votre ordinateur, ne nécessite pas de services cloud. Convient pour des tâches ponctuelles. Achat unique d'environ 139 $, version d'essai gratuite de 15 jours.

Instructions étape par étape : configuration du parsing avec des proxy

Examinons un exemple pratique de configuration du parsing des données des vendeurs sur Wildberries en utilisant un outil prêt à l'emploi et des proxy. Pour cet exemple, nous prendrons Octoparse — l'un des parseurs visuels les plus accessibles.

Étape 1 : Préparation des outils

Téléchargez et installez Octoparse depuis le site officiel. Inscrivez-vous et connectez-vous au programme. La version gratuite permet de créer jusqu'à 10 tâches de parsing, ce qui est suffisant pour commencer.

Obtenez l'accès aux proxy. Pour le parsing de Wildberries, des proxy résidentiels avec des adresses IP russes sont recommandés. Vous aurez besoin de : l'adresse IP du serveur proxy, du port, du nom d'utilisateur et du mot de passe (si une authentification est requise).

Étape 2 : Configuration des proxy dans Octoparse

Ouvrez Octoparse et allez dans les paramètres (icône d'engrenage en haut à droite). Sélectionnez la section "Network" ou "Proxy". Activez l'option "Use proxy server" (Utiliser un serveur proxy).

Entrez les données de votre proxy : dans le champ "Proxy Host", indiquez l'adresse IP, dans le champ "Port" — le port. Si le proxy nécessite une authentification, cochez la case "Authentication required" et entrez le nom d'utilisateur et le mot de passe. Enregistrez les paramètres.

Vérifiez la connexion : cliquez sur le bouton "Test" ou "Vérifier". Le programme doit confirmer la connexion réussie au proxy. Si une erreur apparaît, vérifiez l'exactitude des données saisies.

Étape 3 : Création d'une tâche de parsing

Créez une nouvelle tâche : cliquez sur "New Task" ou "Créer une tâche". Entrez l'URL de la page du vendeur sur Wildberries dont vous souhaitez collecter les données. Par exemple, la page avec tous les produits d'un magasin spécifique.

Octoparse ouvrira un navigateur intégré et chargera la page spécifiée via le proxy. Attendez le chargement complet de la page. Si tout est configuré correctement, vous verrez le contenu de Wildberries comme si vous accédiez avec l'adresse IP du proxy.

Étape 4 : Sélection des données à collecter

Utilisez l'outil de sélection d'éléments d'Octoparse : cliquez sur le nom du produit sur la page. Le programme identifiera automatiquement tous les éléments similaires (tous les noms de produits) et les mettra en surbrillance. Cliquez sur "Select all" (Sélectionner tout).

Répétez le processus pour d'autres données : prix, note, nombre d'avis, images. Chaque fois, Octoparse ajoutera un nouveau champ dans le tableau de données à droite. Vérifiez que toutes les données nécessaires sont sélectionnées.

Si les produits sont répartis sur plusieurs pages, configurez la pagination : trouvez le bouton "Page suivante" et indiquez à Octoparse qu'il doit y accéder. Le programme collectera automatiquement les données de toutes les pages.

Étape 5 : Configuration des paramètres de collecte

Définissez des délais entre les requêtes : dans les paramètres de la tâche, trouvez "Action Settings" et définissez "Wait time" (Temps d'attente) à 3-5 secondes entre le chargement des pages. Cela imite le comportement d'un utilisateur réel et réduit le risque de blocage.

Configurez l'User-Agent : dans les paramètres avancés, choisissez un User-Agent aléatoire du navigateur Chrome ou Firefox. Cela rend les requêtes plus similaires aux actions des utilisateurs ordinaires.

Activez le traitement des erreurs : définissez l'option "Retry on error" (Réessayer en cas d'erreur) avec 2-3 tentatives. Si la page ne se charge pas du premier coup, Octoparse essaiera automatiquement à nouveau.

Étape 6 : Lancement du parsing

Enregistrez la tâche et cliquez sur "Run" (Lancer). Choisissez le mode d'exécution : "Local" (sur votre ordinateur) pour de petits volumes ou "Cloud" (dans le cloud) pour de grandes tâches. Le mode cloud fonctionne plus rapidement, mais n'est disponible que dans la version payante.

Surveillez le processus : Octoparse affichera la progression de la collecte de données en temps réel. Vous verrez combien de pages ont été traitées et combien d'enregistrements ont été collectés. En cas d'erreurs, le programme affichera une notification.

Après la fin, exportez les données : cliquez sur "Export" et choisissez le format — Excel, CSV, JSON ou chargement direct dans la base de données. Les données seront enregistrées sur votre ordinateur dans un format pratique pour l'analyse.

Étape 7 : Automatisation de la collecte régulière

Pour une surveillance régulière des concurrents, configurez un calendrier : dans les paramètres de la tâche, sélectionnez "Schedule" (Calendrier) et indiquez la fréquence de lancement — quotidiennement, hebdomadairement ou à un moment précis.

Configurez des notifications : activez l'envoi de notifications par e-mail à la fin du parsing ou en cas d'erreurs. Cela permettra de réagir rapidement aux problèmes.

Pour les utilisateurs avancés : configurez le chargement automatique des données dans Google Sheets ou votre système CRM. Octoparse prend en charge l'intégration via API et webhooks.

Important : Même en utilisant des proxy, respectez des intervalles raisonnables entre les requêtes. Il est recommandé de ne pas dépasser 1 requête toutes les 3-5 secondes. Un parsing trop agressif peut entraîner un blocage même des proxy de qualité.

Le parsing de sites se situe dans une zone grise de la législation. D'une part, les informations publiques sur les sites sont accessibles à tous les utilisateurs. D'autre part, la collecte automatique massive de données peut violer les conditions d'utilisation de la plateforme.

Que dit la loi

En Russie, il n'existe pas de loi spécifique interdisant le parsing de sites. La collecte d'informations publiquement accessibles n'est pas en soi une violation. Cependant, il existe plusieurs risques juridiques :

Violation des conditions d'utilisation. La plupart des marketplaces interdisent explicitement la collecte automatique de données dans leurs Conditions de Service. Techniquement, ce n'est pas un crime pénal, mais la plateforme peut bloquer votre compte si vous êtes enregistré en tant que vendeur.

Création de charge sur le serveur. Si votre parsing crée une charge substantielle sur l'infrastructure du site (activité similaire à un DDoS), cela peut être qualifié de crime informatique en vertu de l'article 273 du Code pénal de la Fédération de Russie. Cependant, cela nécessite une charge vraiment énorme.

Utilisation des données collectées. Le parsing en lui-même est une chose, mais l'utilisation des données en est une autre. Si vous publiez les données collectées ou les utilisez pour une concurrence déloyale, cela peut entraîner des poursuites judiciaires de la part des titulaires de droits.

Comment minimiser les risques

Pour réduire les risques juridiques lors du parsing des marketplaces, suivez ces recommandations :

Collectez uniquement des données publiques. Ne tentez pas de contourner l'authentification ou d'accéder à des sections privées. Parsez uniquement les informations accessibles à tout visiteur du site sans inscription.

Ne créez pas de charge excessive. Utilisez des délais entre les requêtes, ne lancez pas des dizaines de flux de parsing parallèles. Votre activité ne doit pas affecter le fonctionnement du site pour les utilisateurs ordinaires.

Utilisez les données pour une analyse interne. Les informations collectées doivent être utilisées pour votre entreprise — analyse des concurrents, tarification, étude de marché. Ne publiez pas des ensembles de données publiquement et ne les vendez pas.

Ne vous faites pas passer pour un autre utilisateur. N'utilisez pas de comptes d'autres personnes pour le parsing. Si une authentification est nécessaire, utilisez votre compte ou parsez sans authentification.

Étudiez le fichier robots.txt. Bien que ce fichier n'ait pas de force juridique, il montre l'attitude du propriétaire du site envers la collecte automatique de données. Respecter les indications du robots.txt démontre la bonne foi.

Alternatives au parsing

Certaines marketplaces fournissent des API officielles pour obtenir des données. Par exemple, Yandex.Market a une API pour les partenaires, Ozon fournit une API pour les vendeurs. Utiliser des API officielles est un moyen légal et sûr d'obtenir des données.

Il existe également des services d'analyse spécialisés pour les marketplaces (MpStats, SellerFox) qui prennent en charge les risques juridiques et fournissent des données dans le cadre de leurs accords de licence. Utiliser de tels services transfère la responsabilité au fournisseur de services.

Conclusion

La collecte de données sur les vendeurs sur les marketplaces est un outil important de renseignement concurrentiel pour toute entreprise en ligne. La surveillance régulière des prix, de l'assortiment et des stratégies des concurrents permet de prendre des décisions éclairées et de rester compétitif.

Le choix de la méthode de parsing dépend de vos objectifs et de vos ressources : la collecte manuelle convient pour des recherches ponctuelles, les services prêts à l'emploi — pour une surveillance régulière sans compétences techniques, et la configuration autonome des parseurs — pour un contrôle total et de la flexibilité.

La clé d'un parsing réussi est le choix et la configuration appropriés des proxy. Pour la plupart des tâches sur les marketplaces russes, la solution optimale sera des proxy résidentiels avec des adresses IP russes — ils offrent un faible risque de blocage à un coût raisonnable et permettent de mener une surveillance à long terme des concurrents sans problèmes techniques.

N'oubliez pas de respecter des limites raisonnables lors du parsing : utilisez des délais entre les requêtes, ne créez pas de charge excessive sur les serveurs des marketplaces et appliquez les données collectées de manière éthique — pour l'analyse et le développement de votre propre entreprise, et non pour une concurrence déloyale.

```