L'analisi delle recensioni dei concorrenti è un compito critico per qualsiasi venditore di marketplace. Le recensioni mostrano i problemi reali dei prodotti, aiutano a migliorare le schede e a trovare nicchie non occupate. Ma i marketplace bloccano severamente il parsing di massa: Wildberries banna l'IP dopo 50-100 richieste, Ozon mostra un captcha, Yandex.Market chiude completamente l'accesso all'API per le persone fisiche. In questo articolo vedremo come raccogliere recensioni in modo sicuro, quali strumenti utilizzare e come configurare i proxy per non perdere l'accesso ai dati.
Perché i marketplace bloccano il parsing delle recensioni
I marketplace proteggono i propri dati per diverse ragioni. In primo luogo, il parsing di massa crea un alto carico sui server: migliaia di richieste al minuto da parte dei parser possono rallentare il funzionamento del sito per i normali acquirenti. In secondo luogo, le recensioni sono dati preziosi che le piattaforme monetizzano tramite analisi a pagamento (ad esempio, Ozon Analytics o WB Analitica costano a partire da 5000 rubli al mese). In terzo luogo, i concorrenti possono utilizzare le recensioni per azioni sleali: copiare strategie di successo, gonfiare le recensioni o addirittura cercare clienti insoddisfatti dei concorrenti.
Tecnologicamente, i marketplace monitorano le attività sospette in base a diversi parametri:
- Frequenza delle richieste da un IP: Se dal tuo IP arrivano 100+ richieste al minuto, non è chiaramente un umano. Wildberries banna tali IP per 24 ore dopo 50-70 richieste.
- Pattern comportamentali: I parser aprono le pagine troppo rapidamente (meno di 1 secondo per pagina), non muovono il mouse, non scorrono. I moderni sistemi anti-bot (ad esempio, Kasada o DataDome) possono facilmente riconoscerli.
- User-Agent e fingerprint del browser: Se il tuo script invia richieste con un User-Agent di una vecchia versione di Chrome o senza JavaScript, è un segnale di allerta.
- Assenza di cookies e sessioni: Gli utenti normali hanno una cronologia di navigazione, cookies di autenticazione. I parser spesso arrivano "puliti".
Ozon utilizza una protezione particolarmente aggressiva: dopo 20-30 richieste mostra un captcha, e in caso di tentativi ripetuti di bypassare blocca l'IP a livello CDN (Cloudflare). Yandex.Market ha chiuso l'API pubblica per le persone fisiche nel 2023: ora l'accesso è solo per le persone giuridiche con contratto. Avito banna non solo per IP, ma anche per numero di telefono, se rileva attività automatica.
Cosa succede se si fa parsing senza protezione: conseguenze dei ban
Le conseguenze del blocco dipendono da come si fa parsing. Se utilizzi un IP domestico senza proxy, riceverai un ban temporaneo di 24 ore. Questo non è critico per una raccolta dati una tantum, ma è un problema per il monitoraggio regolare. Se fai parsing tramite un account venditore (ad esempio, utilizzando il tuo account WB per accedere a statistiche avanzate), rischi di ricevere un ban dell'account. Ripristinarlo è difficile: devi contattare il supporto, dimostrare che non sei stato tu, ma un "virus sul computer". Il processo richiede da una settimana a un mese.
Un caso reale: un venditore di giocattoli per bambini su Wildberries ha impostato il parsing automatico delle recensioni dei concorrenti tramite uno script in Python. Lo script funzionava con il suo IP di lavoro, raccoglieva 500 recensioni ogni ora. Dopo 3 giorni, Wildberries ha bloccato non solo l'IP, ma anche l'account del venditore: l'algoritmo ha collegato l'IP del parser con l'IP da cui accedeva al proprio account. Risultato: perdita di accesso al negozio per 2 settimane, mancato guadagno di circa 400.000 rubli (i prodotti erano disponibili, ma gestire le forniture era impossibile).
Importante: Non fare mai parsing dallo stesso IP da cui accedi al tuo account venditore. I marketplace collegano gli indirizzi IP agli account e possono bloccare il tuo negozio per attività sospette.
Un altro problema è giuridico. Formalmente, il parsing viola il contratto utente della maggior parte dei marketplace (sezione "Attività vietate"). Nella pratica, le piattaforme raramente arrivano in tribunale con i parser, ma ci sono dei precedenti. Nel 2022, Ozon ha fatto causa a un servizio di analisi che raccoglieva dati sui prezzi e sulle scorte. Il tribunale ha dato ragione a Ozon, il servizio ha chiuso. Per le persone fisiche, il rischio di azioni legali è minimo, ma per le aziende che vendono il parsing come servizio, questa è una minaccia reale.
3 modi per raccogliere recensioni: manuale, API, parsing automatico
Metodo 1: Raccolta manuale (per piccoli volumi)
Se hai bisogno di raccogliere recensioni su 5-10 prodotti concorrenti una volta a settimana, puoi farlo manualmente. Apri la scheda del prodotto su Wildberries o Ozon, scorri le recensioni, copia il testo in Excel. Vantaggi: non sono necessarie competenze tecniche, rischio di ban nullo. Svantaggi: molto lento (per 100 recensioni ci vogliono 30-40 minuti), impossibile monitorare la dinamica, nessuna automazione.
Questo metodo è adatto per micro-imprese: vendi 2-3 prodotti, vuoi capire cosa dicono dei concorrenti per migliorare la tua scheda. Per il monitoraggio regolare di decine di prodotti, la raccolta manuale non è scalabile.
Metodo 2: API ufficiale (accesso limitato)
Alcuni marketplace forniscono API per i partner. L'API di Wildberries per i venditori consente di ottenere recensioni solo sui propri prodotti (non sui concorrenti). L'API di Ozon è simile: accesso solo ai propri dati. L'API di Yandex.Market per i partner di contenuto richiede un contratto legale ed è disponibile solo per le aziende con un fatturato di almeno 10 milioni di rubli all'anno.
Vantaggi dell'API: accesso stabile, non violi le regole della piattaforma, dati strutturati in JSON. Svantaggi: non puoi ottenere recensioni sui concorrenti (obiettivo principale della maggior parte dei venditori), soglia di ingresso alta per l'API ufficiale.
Metodo 3: Parsing automatico tramite proxy (universale)
Questo è il metodo principale per venditori professionisti e agenzie. Utilizzi strumenti speciali (parser) o scrivi uno script che apre automaticamente le pagine dei prodotti, raccoglie le recensioni e le salva in un database. Per non ricevere un ban, tutte le richieste passano attraverso proxy: ogni richiesta da un nuovo indirizzo IP, il marketplace vede normali utenti da diverse città.
Vantaggi: puoi raccogliere recensioni di qualsiasi prodotto (tuoi e dei concorrenti), automazione completa, scalabilità (fino a 10.000 prodotti al giorno). Svantaggi: sono necessarie competenze tecniche o strumenti a pagamento, costi per i proxy (da 3000 rubli al mese).
Quali proxy sono adatti per il parsing dei marketplace
La scelta del tipo di proxy dipende dal tuo budget, dai volumi di parsing e dai requisiti di qualità dei dati. Esaminiamo tre tipi principali e la loro applicabilità per i marketplace.
| Tipo di proxy | Adatto per | Prezzo | Vantaggi/Svantaggi |
|---|---|---|---|
| Proxy di data center | Parsing di Avito, AliExpress, piccole piattaforme | Da 50₽/IP al mese | + Economici, veloci − Facilmente riconoscibili da WB e Ozon |
| Proxy residenziali | Wildberries, Ozon, Yandex.Market — scelta principale | Da 300₽/GB | + IP reali di utenti domestici, non vengono bannati − Più costosi dei data center |
| Proxy mobili | Parsing con alto rischio di ban, raccolta tramite app mobili | Da 500₽/IP al mese | + Massima protezione, IP di operatori mobili − I più costosi, più lenti dei residenziali |
Per il parsing di Wildberries e Ozon, raccomandiamo proxy residenziali. Questi marketplace utilizzano sistemi anti-bot avanzati che riconoscono facilmente gli IP dei data center (che si trovano in intervalli noti di numeri AS dei fornitori di hosting). I proxy residenziali sono IP di normali fornitori di internet domestici (Rostelecom, MTS, Beeline), impossibili da distinguere da un reale acquirente.
Un punto importante: per i marketplace sono necessari proxy con rotazione IP. Ciò significa che ogni tua richiesta deve provenire da un nuovo indirizzo IP. Ad esempio, se fai parsing di 1000 recensioni, avrai 1000 IP diversi da diverse città della Russia. Il marketplace vede che il prodotto viene visitato da utenti reali di tutto il paese, senza alcuna attività sospetta.
Consiglio: Per il parsing dei marketplace russi, scegli proxy con IP russi. Wildberries e Ozon mostrano spesso captcha agli utenti dall'estero (protezione contro i parser stranieri). I proxy residenziali con geolocalizzazione in Russia risolvono questo problema.
Strumenti pronti per la raccolta delle recensioni: panoramica dei servizi
Se non sei un programmatore, non è necessario scrivere uno script di parsing da zero: ci sono soluzioni pronte. Esaminiamo gli strumenti popolari per i venditori di marketplace.
1. Mpstats (mpstats.io) — analisi di Wildberries e Ozon
Il servizio più popolare tra i venditori russi. Raccoglie non solo recensioni, ma anche prezzi, scorte, posizioni nella ricerca, storia delle vendite. Le recensioni vengono aggiornate una volta al giorno, è possibile esportare in Excel. Prezzo: a partire da 3000 rubli al mese (tariffa "Start"). Vantaggi: non è necessario configurare i proxy da soli (funziona tutto out-of-the-box), interfaccia comoda, report pronti. Svantaggi: costoso se scalato (se monitori 100+ prodotti, la tariffa aumenta a 15.000 rubli), i dati vengono aggiornati con ritardo.
2. Moneyplace (moneyplace.io) — parser per Ozon
Strumento specializzato per Ozon. Raccoglie recensioni, domande dei clienti, valutazioni dei venditori. Ha una funzione di analisi del sentiment delle recensioni (determina automaticamente quelle negative e positive). Prezzo: a partire da 2500 rubli al mese. Vantaggi: analisi approfondita specifica per Ozon, API per integrazione con i tuoi sistemi. Svantaggi: funziona solo con Ozon, non con Wildberries e altre piattaforme.
3. Parser.ru — parser universale senza codice
Servizio cloud per il parsing di qualsiasi sito, inclusi i marketplace. Funziona secondo il principio "indica cosa parsare — ricevi il risultato". Non è necessario programmare, tutto viene configurato tramite un'interfaccia visiva. Prezzo: a partire da 1500 rubli al mese + pagamento separato per i proxy (se utilizzi i tuoi — gratis). Vantaggi: flessibilità (puoi configurare il parsing di qualsiasi dato, non solo recensioni), funziona con qualsiasi marketplace. Svantaggi: è necessario tempo per la configurazione (1-2 ore per studiare l'interfaccia).
4. Octoparse — parser desktop per Windows/Mac
Programma per il parsing con editor visivo. Installalo sul computer, apri il sito del marketplace, clicca sugli elementi che desideri raccogliere (testo della recensione, valutazione, data). Il programma memorizza la struttura e fa parsing automaticamente. Prezzo: versione gratuita (fino a 10.000 record al mese), a pagamento da $75/mese. Vantaggi: non è necessario conoscere HTML/CSS, ci sono modelli pronti per siti popolari. Svantaggi: funziona solo sul tuo computer (se lo spegni, il parsing si ferma), interfaccia in inglese.
5. Script personale in Python (per chi ha competenze tecniche)
Se hai competenze di programmazione di base, puoi scrivere uno script in Python utilizzando le librerie Selenium (emulazione del browser) o Scrapy (parsing veloce). Vantaggi: controllo completo, costo di abbonamento nullo (paghi solo per i proxy), puoi fare parsing di qualsiasi dato in qualsiasi formato. Svantaggi: è necessario tempo per lo sviluppo (da 5 ore per un parser semplice), è necessario mantenere il codice (i marketplace cambiano la struttura del sito — lo script si rompe).
Per la maggior parte dei venditori, raccomandiamo di iniziare con servizi pronti come Mpstats o Moneyplace. Si ripagano se guadagni dai marketplace almeno 200.000 rubli al mese. Se il budget è limitato o hai bisogno di una logica di parsing non standard, guarda verso Octoparse o uno script personale.
Guida passo passo per configurare il parsing tramite proxy
Esaminiamo la configurazione utilizzando la combinazione Octoparse (parser senza codice) + proxy residenziali. Questo metodo è adatto ai principianti e non richiede programmazione.
Passo 1: Ottieni accesso ai proxy residenziali
Registrati presso un fornitore di proxy residenziali (ad esempio, ProxyCove). Dopo la registrazione, riceverai i dati per la connessione:
Proxy server: gate.proxycove.com
Porta: 8080
Nome utente: user_tuo_id
Password: tua_password
Tipo: HTTP/HTTPS (con rotazione IP)
Importante: scegli un piano con rotazione per richiesta (ogni richiesta HTTP = nuovo IP). Per il parsing dei marketplace, questo è critico.
Passo 2: Installa e configura Octoparse
Scarica Octoparse dal sito ufficiale (octoparse.com), installalo sul computer. Al primo avvio, il programma ti chiederà di creare un account: utilizza la versione gratuita per il test (limite di 10.000 record al mese, sufficiente per 50-100 prodotti).
Apri le impostazioni (Settings → Proxy Settings) e aggiungi i tuoi proxy:
- Tipo di proxy: HTTP
- Server: gate.proxycove.com
- Porta: 8080
- Nome utente: tuo nome utente
- Password: tua password
- Attiva la casella "Usa proxy per tutte le attività"
Clicca su "Test Proxy": il programma verificherà la connessione. Se tutto è configurato correttamente, vedrai il messaggio "Proxy is working".
Passo 3: Crea un'attività di parsing delle recensioni di Wildberries
Clicca su "New Task" → "Advanced Mode". Incolla l'URL della scheda del prodotto su Wildberries (ad esempio, https://www.wildberries.ru/catalog/12345678/detail.aspx). Octoparse aprirà il browser integrato e caricherà la pagina tramite proxy.
Ora insegna al programma cosa parsare:
- Scorri la pagina verso il basso fino alla sezione delle recensioni.
- Clicca sul testo della prima recensione → seleziona "Extract text" → il programma evidenzierà tutte le recensioni sulla pagina.
- Clicca sulla valutazione (stelle) → "Extract text" → il programma memorizzerà la valutazione.
- Clicca sulla data della recensione → "Extract text".
- Trova il pulsante "Mostra di più" (paginazione) → clicca con il tasto destro → "Click to paginate" → il programma sfoglierà automaticamente le pagine.
Imposta i limiti: nella sezione "Pagination" indica un massimo di 50 pagine (circa 500 recensioni). Questo è un volume sicuro per una sessione.
Passo 4: Imposta ritardi tra le richieste
Questo è critico! Se il parser sfoglia le pagine troppo rapidamente, Wildberries sospetterà un bot anche tramite proxy. Apri "Task Settings" → "Speed" e imposta:
- Ritardo di caricamento della pagina: 3-5 secondi (ritardo tra le pagine)
- Ritardo di azione: 1-2 secondi (ritardo tra i clic)
- Abilita ritardo casuale: attiva (aggiunge casualità, simula un umano)
Passo 5: Avvia il parsing e esporta i dati
Clicca su "Run" → il programma inizierà il parsing. In tempo reale vedrai come vengono raccolti i dati. Al termine (di solito 10-15 minuti per 500 recensioni), clicca su "Export" → scegli il formato Excel o CSV. Fatto: hai una tabella con tutte le recensioni, valutazioni e date.
Errore comune: Non avviare il parsing subito su 100 prodotti. Inizia con 5-10 prodotti, assicurati che tutto funzioni senza blocchi. Poi scala fino a 50-100 prodotti al giorno.
Regole per un parsing sicuro: limiti, ritardi, rotazione
Anche con i proxy, puoi ricevere un ban se violi le "regole di buona condotta". I marketplace analizzano non solo gli IP, ma anche i pattern comportamentali. Ecco un checklist per un parsing sicuro:
1. Rispetta i limiti delle richieste
Limiti sicuri per i marketplace russi:
- Wildberries: non più di 100 richieste all'ora da un'unica attività di parsing. Se fai parsing di 10 prodotti, fai una pausa di 30-40 secondi tra i prodotti.
- Ozon: non più di 50 richieste all'ora (hanno una protezione più aggressiva). Pausa tra i prodotti — 1 minuto.
- Yandex.Market: non più di 30 richieste all'ora. Dopo ogni 10 richieste, fai una pausa di 5 minuti.
Questi limiti sono calcolati per il parsing tramite proxy residenziali con rotazione. Se utilizzi data center, dividi i limiti per 2.
2. Usa ritardi casuali
Non impostare ritardi fissi (ad esempio, esattamente 5 secondi tra le richieste). Questo appare sospetto. Imposta ritardi casuali: da 3 a 7 secondi. La maggior parte dei parser (Octoparse, Scrapy) supporta questa funzione di default.
3. Cambia User-Agent
User-Agent è la stringa che informa il sito quale browser stai utilizzando. I parser spesso inviano User-Agent obsoleti (ad esempio, Chrome 90, mentre la versione attuale è 120). Imposta la rotazione dell'User-Agent: ogni richiesta a nome di diversi browser (Chrome, Firefox, Safari) e diverse versioni.
Ecco un esempio di lista di User-Agent per la rotazione:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/120.0.0.0
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) Safari/605.1.15
Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:121.0) Firefox/121.0
Mozilla/5.0 (X11; Linux x86_64) Chrome/119.0.0.0
4. Non fare parsing durante le ore di punta
I marketplace intensificano la protezione anti-bot durante le ore di massimo traffico (di solito dalle 18:00 alle 23:00 ora di Mosca — quando gli acquirenti tornano dal lavoro). In questo momento, il rischio di ricevere un captcha o un ban è più alto. Il momento ottimale per il parsing: dalle 2:00 alle 8:00 del mattino o dalle 10:00 alle 16:00 del giorno.
5. Ruota i proxy per sessioni
Se fai parsing di un prodotto (ad esempio, scorri 50 pagine di recensioni), utilizza un solo IP per l'intera sessione. Se cambi IP su ogni pagina, il marketplace potrebbe sospettare qualcosa di strano (un "utente" salta da un IP di Mosca a uno di Vladivostok in un secondo). Ma quando passi al prodotto successivo, cambia IP.
6. Imita il comportamento umano
Parser avanzati (ad esempio, Selenium) possono emulare le azioni umane: movimento del mouse, scrolling, clic su elementi casuali. Questo aumenta l'"umanità" del parser. Se utilizzi un semplice parser HTTP (senza browser), non è necessario, ma allora rispetta rigorosamente i limiti delle richieste.
Come analizzare le recensioni raccolte per aumentare le vendite
Raccogliere recensioni è solo metà del lavoro. La cosa principale è analizzarle correttamente e applicare gli insight. Ecco alcuni scenari pratici di utilizzo.
1. Ricerca dei difetti dei prodotti concorrenti
Apri Excel con le recensioni raccolte, filtra quelle negative (valutazione 1-2 stelle). Guarda a cosa si lamentano gli acquirenti: la taglia non corrisponde, imballaggio scadente, consegna lenta, bassa qualità del materiale. Queste lamentele sono il tuo vantaggio competitivo. Se i concorrenti ricevono il 30% di recensioni negative a causa di una taglia errata, indica nella tua scheda una dettagliata tabella delle taglie con foto del metro. Se si lamentano dell'imballaggio, inserisci nel prodotto una bella scatola e menzionalo nella descrizione.
Un caso reale: un venditore di leggings sportivi ha raccolto 500 recensioni sui top 5 concorrenti. Ha scoperto che il 40% delle recensioni negative erano legate al fatto che il tessuto si vedeva durante gli squat. Ha ordinato un tessuto più spesso dal fornitore, ha registrato un video-test "i leggings non si vedono" e l'ha aggiunto alla scheda. Risultato: la conversione è aumentata dal 3% al 7%, le vendite sono raddoppiate in un mese.
2. Miglioramento della scheda del prodotto sulla base delle domande dei clienti
Oltre alle recensioni, raccogli le domande dei clienti (sono presenti su Wildberries e Ozon). Le domande mostrano quali informazioni mancano nella scheda. Se 20 persone chiedono "È 100% cotone o con sintetico?" significa che la composizione non è chiara. Aggiungi nella descrizione un grande blocco "Composizione: 95% cotone, 5% elastan" con un'icona. Se chiedono della compatibilità con l'iPhone 15, aggiungi un elenco di modelli compatibili.
3. Ricerca di esigenze non soddisfatte (nuove nicchie)
Analizza le recensioni positive dei concorrenti. Cerca frasi come "ottimo, ma vorrei che ci fosse...", "peccato che non ci sia...". Questi sono segnali di esigenze non soddisfatte. Ad esempio, nelle recensioni degli zaini per bambini si legge spesso "buon zaino, ma senza riflettori". Puoi lanciare uno zaino con riflettori e catturare questo pubblico.
4. Monitoraggio della dinamica delle recensioni (rilevamento precoce dei problemi)
Imposta il parsing automatico dei tuoi prodotti una volta al giorno. Se il numero di recensioni negative aumenta drasticamente (ad esempio, in una settimana sono arrivate 10 recensioni con lamentele su difetti) — è un segnale per controllare il lotto dal fornitore. Potrebbe aver inviato prodotti difettosi. Prima scopri il problema, minore sarà la perdita nel ranking.
5. Raccolta di semantica per SEO all'interno del marketplace
Le recensioni dei clienti sono una fonte di "parole chiave vive". Le persone scrivono come cercano il prodotto: "comprato per la dacia", "cercavo un regalo per mio marito per il 23 febbraio", "avevo bisogno di una tazza termica per la macchina". Queste frasi possono essere aggiunte nel titolo e nella descrizione della tua scheda — aumenterà la visibilità nella ricerca del marketplace.
Conclusione
La raccolta di recensioni dai marketplace non è solo un compito tecnico, ma uno strumento strategico per aumentare le vendite. Le recensioni dei concorrenti raccolte e analizzate correttamente ti danno un vantaggio competitivo: sai cosa manca sul mercato, quali problemi risolvere, come migliorare la tua scheda. L'importante è farlo in modo sicuro, per non ricevere un ban.
Conclusioni chiave dall'articolo: utilizza proxy residenziali per il parsing di Wildberries e Ozon (non vengono bannati, a differenza dei data center), rispetta i limiti delle richieste (non più di 100 richieste all'ora su Wildberries), imposta ritardi casuali tra le richieste (3-7 secondi), non fare parsing dallo stesso IP da cui accedi al tuo account venditore. Per i principianti, raccomandiamo di iniziare con strumenti pronti come Mpstats o Octoparse: si ripagano se il tuo fatturato è di almeno 200.000 rubli al mese.
Se prevedi di raccogliere regolarmente dati dai marketplace, ti consigliamo di provare proxy residenziali — forniscono un alto livello di anonimato, IP reali di fornitori russi e un rischio minimo di blocchi. È un investimento che si ripaga mantenendo l'accesso a dati critici per il tuo business.