Torna al blog

Come raccogliere dati sui prodotti di tendenza nei marketplace tramite proxy senza blocchi

Guida completa alla configurazione dei proxy per la raccolta di dati sui prodotti di tendenza nei marketplace: quale tipo di proxy scegliere, come evitare i blocchi e automatizzare il monitoraggio dei concorrenti.

📅30 gennaio 2026
```html

Il successo nei marketplace dipende direttamente dalla velocità di reazione alle tendenze. Mentre sfogli manualmente i cataloghi di Wildberries e Ozon, i concorrenti hanno già automatizzato la raccolta di dati tramite proxy e ricevono informazioni sui best seller in tempo reale. Ma i marketplace bloccano attivamente il parsing: senza la corretta configurazione dei proxy, rischi di perdere l'accesso alla piattaforma o di ottenere dati incompleti.

In questa guida vedremo come configurare un sistema di raccolta automatica di dati sui prodotti di tendenza, quale tipo di proxy scegliere per diversi marketplace e come evitare errori comuni che portano ai blocchi.

Perché i marketplace bloccano il parsing e come i proxy risolvono il problema

I marketplace spendono milioni per proteggersi dalla raccolta automatica di dati. La ragione è semplice: il parsing crea un carico sui server e consente ai concorrenti di ottenere informazioni commerciali. Wildberries, Ozon e altre piattaforme utilizzano un sistema di protezione multilivello che monitora attività sospette.

Il sistema anti-parsing analizza diversi parametri contemporaneamente. Se da un indirizzo IP arrivano 100 richieste al minuto, questo è un chiaro segnale di un bot. Un normale acquirente visualizza 5-10 schede prodotto in questo tempo. Viene anche monitorato l'User-Agent del browser, la frequenza dei clic, il movimento del mouse e persino il tempo trascorso sulla pagina.

I proxy risolvono un problema chiave: distribuiscono le richieste tra diversi indirizzi IP. Invece di inviare 1000 richieste dal tuo vero IP, il sistema fa 10-20 richieste da ciascuno dei 50-100 indirizzi diversi. Per il marketplace, questo appare come l'attività di normali utenti provenienti da diverse città.

Importante: L'uso dei proxy non garantisce una protezione totale dai blocchi. È necessario anche configurare correttamente la rotazione degli IP, mantenere intervalli tra le richieste e imitare il comportamento di un utente reale. Di questo parleremo in dettaglio nella sezione sulla configurazione.

Quale tipo di proxy scegliere per la raccolta di dati sui prodotti

Per il parsing dei marketplace sono adatti tre tipi di proxy, ognuno con i propri vantaggi e limitazioni. La scelta dipende dal volume di dati, dal budget e dai requisiti di velocità nella raccolta delle informazioni.

Tipo di proxy Velocità Fiducia delle piattaforme Prezzo Raccomandazione
Proxy dei data center Alta (100+ Mbit/s) Bassa (facilmente rilevabili) Da $1-3/IP Parsing massivo con alta rotazione
Proxy residenziali Media (20-50 Mbit/s) Alta (IP reali degli utenti) Da $5-15/GB di traffico Parsing di marketplace protetti (Wildberries, Ozon)
Proxy mobili Media (10-30 Mbit/s) Massima (operatori mobili) Da $50-100/IP Parsing con massima protezione, versioni mobili dei siti

Proxy dei data center: quando la velocità è più importante dell'anonimato

Se hai bisogno di raccogliere rapidamente un grande volume di dati da piattaforme meno protette (ad esempio, AliExpress o Yandex.Market), i proxy dei data center sono la scelta ottimale. Funzionano su server di provider di hosting, quindi garantiscono un'alta velocità di caricamento delle pagine.

Il principale svantaggio è che i marketplace possono facilmente identificare gli IP dei data center e possono bloccarli in caso di attività sospette. La soluzione è utilizzare un ampio pool di IP (da 50-100 indirizzi) e configurare una rapida rotazione: cambiare IP dopo ogni 10-15 richieste.

Proxy residenziali: il giusto compromesso per la maggior parte delle esigenze

I proxy residenziali utilizzano indirizzi IP di veri provider di internet, assegnati a normali utenti. Per Wildberries o Ozon, questo traffico appare assolutamente legittimo, come se i prodotti fossero visualizzati da un acquirente di Mosca, San Pietroburgo o Kazan.

Questo tipo di proxy è adatto per il monitoraggio regolare delle tendenze, quando raccogli dati quotidianamente o più volte al giorno. Il costo è calcolato in base al traffico: per il parsing di 10.000 schede prodotto sono necessari circa 5-10 GB a seconda del volume delle immagini e delle descrizioni.

Proxy mobili: massima protezione per compiti critici

I proxy mobili utilizzano indirizzi IP di operatori mobili (MTS, Beeline, MegaFon). I marketplace raramente bloccano tali indirizzi, perché dietro un singolo IP possono trovarsi migliaia di utenti reali: gli operatori utilizzano la tecnologia CGNAT (IP condiviso tra più abbonati).

I proxy mobili hanno senso per il parsing di sezioni particolarmente protette dei marketplace o quando hai già ricevuto blocchi utilizzando altri tipi di proxy. Sono anche indispensabili per raccogliere dati dalle app mobili di Wildberries e Ozon, dove la protezione è ancora più rigorosa.

Caratteristiche del parsing di diversi marketplace: Wildberries, Ozon, AliExpress

Ogni marketplace utilizza il proprio sistema di protezione contro il parsing. Comprendere queste caratteristiche aiuterà a configurare i proxy nel modo più efficace possibile e a evitare i blocchi.

Wildberries: protezione rigorosa e geolocalizzazione

Wildberries utilizza uno dei sistemi di protezione più avanzati tra i marketplace russi. La piattaforma analizza non solo la frequenza delle richieste, ma anche fattori comportamentali: tempo sulla pagina, scroll, clic sugli elementi. Per un parsing di successo è necessario imitare le azioni di un utente reale.

Una caratteristica importante è la geolocalizzazione dei prezzi e della disponibilità dei prodotti. Wildberries mostra assortimenti diversi per Mosca, regioni e aree remote. Se stai raccogliendo dati sulle tendenze per vendere in tutta la Russia, utilizza proxy da diverse regioni: Mosca, San Pietroburgo, Ekaterinburg, Novosibirsk, Krasnodar.

Consiglio pratico: Per il parsing di Wildberries utilizza proxy residenziali con rotazione ogni 50-100 richieste. Assicurati di aggiungere ritardi casuali di 2-5 secondi tra le richieste e cambia l'User-Agent del browser. Questo ridurrà al minimo la probabilità di blocco.

Ozon: API per partner e protezione del catalogo pubblico

Ozon fornisce un'API ufficiale per i venditori, ma non consente l'accesso ai dati dei concorrenti. Per analizzare le tendenze è comunque necessario eseguire il parsing del catalogo pubblico. La protezione di Ozon è meno aggressiva rispetto a quella di Wildberries, ma la piattaforma utilizza attivamente CAPTCHA in caso di attività sospette.

Una caratteristica di Ozon è il caricamento dinamico dei contenuti tramite JavaScript. Le semplici richieste HTTP non funzioneranno, è necessario un parser con supporto per JavaScript (Selenium, Puppeteer) o un browser headless. Questo aumenta il carico sui proxy, quindi prevedi un maggiore consumo di traffico: fino a 15-20 GB per 10.000 schede.

AliExpress: parsing massivo con limitazioni regionali

AliExpress mostra prezzi e condizioni di spedizione diversi a seconda del paese dell'utente. Per i venditori russi è fondamentale utilizzare proxy con IP russi: altrimenti otterrai dati per un'altra regione, il che distorcerà l'analisi delle tendenze.

La protezione di AliExpress è relativamente tollerante nei confronti del parsing: la piattaforma è interessata al traffico. Puoi utilizzare proxy dei data center con rotazione moderata (ogni 100-200 richieste). L'importante è non superare la velocità di 5-10 richieste al secondo da un singolo IP.

Strumenti per l'automazione della raccolta di dati sulle tendenze

Esistono due approcci al parsing dei marketplace: servizi pronti e configurazione autonoma dei parser. Le soluzioni pronte sono più costose, ma risparmiano tempo. Un parser personale richiede conoscenze tecniche, ma offre il pieno controllo sul processo.

Servizi pronti per il parsing dei marketplace

Per coloro che non vogliono occuparsi dei dettagli tecnici, esistono piattaforme pronte. Sono già configurate per specifici marketplace, hanno un sistema proxy integrato e una rotazione automatica degli IP.

  • Mpstats — specializzato in Wildberries e Ozon, raccoglie dati su vendite, giacenze, posizioni nei risultati. Prezzo a partire da 3000 rubli al mese.
  • SellerFox — analisi per Wildberries con monitoraggio delle tendenze e delle nicchie. Adatto per la ricerca di prodotti con domanda crescente.
  • Moneyplace — monitoraggio dei concorrenti su Ozon e Wildberries, monitoraggio delle variazioni di prezzo e rating.
  • ParseHub — parser universale per qualsiasi sito, inclusi i marketplace. Richiede configurazione, ma funziona con qualsiasi piattaforma.

Il principale svantaggio dei servizi pronti è che paghi non solo per i dati, ma anche per la loro infrastruttura proxy. Con grandi volumi di parsing, questo può costare decine di migliaia di rubli al mese.

Configurazione autonoma del parser: strumenti e librerie

Se hai competenze tecniche di base (o se hai uno sviluppatore nel team), puoi configurare il tuo sistema di parsing. Questo è più economico in fase di scalabilità e offre il pieno controllo sul processo.

Strumenti popolari per il parsing:

  • Selenium (Python) — automazione del browser, supporto per JavaScript, facile integrazione dei proxy. Adatto per Wildberries e Ozon.
  • Puppeteer (Node.js) — browser headless basato su Chrome, più veloce di Selenium, minore consumo di memoria.
  • Scrapy (Python) — framework per il parsing, adatto per siti semplici senza JavaScript. Veloce, ma non funziona con contenuti dinamici.
  • Playwright (Python/Node.js) — alternativa moderna a Selenium, supporto per tutti i browser, lavoro integrato con i proxy.

Per il parsing dei marketplace, ti consigliamo Selenium o Playwright: gestiscono correttamente JavaScript e consentono di imitare le azioni di un utente reale (scroll, clic, ritardi).

Configurazione passo-passo dei proxy per il parser di prodotti

La corretta configurazione dei proxy è un fattore chiave per il successo. Anche i migliori proxy residenziali non ti salveranno dai blocchi se non configuri correttamente la rotazione o superi i limiti di richieste. Analizziamo il processo di configurazione utilizzando strumenti popolari come esempio.

Passo 1: Ottenere i dati del proxy e verificare il funzionamento

Dopo aver acquistato i proxy, ricevi un elenco nel formato: IP:PORT:LOGIN:PASSWORD. Prima di configurare il parser, assicurati di verificare il funzionamento di ciascun proxy.

Il modo più semplice per verificare è aprire il browser, configurare il proxy nelle impostazioni di rete e visitare un sito di verifica IP (ad esempio, 2ip.ru o whoer.net). Assicurati che venga visualizzato l'IP del proxy e non il tuo vero indirizzo. Controlla anche la velocità di caricamento: se le pagine si aprono in più di 5 secondi, il proxy non è di buona qualità.

Passo 2: Configurare il proxy nel parser (esempio con Selenium)

Se utilizzi Selenium per il parsing, la configurazione del proxy appare come segue. Crei un elenco di proxy in un file separato, quindi il parser sceglie casualmente un proxy dall'elenco per ogni sessione.

La logica di base è: il parser avvia il browser con il proxy configurato, esegue 50-100 richieste (visualizzazione delle schede prodotto), quindi chiude la sessione e ne avvia una nuova con un altro proxy. Questo imita il comportamento di diversi utenti e riduce il rischio di blocco.

Passo 3: Configurazione della rotazione degli indirizzi IP

La rotazione dei proxy è il cambio automatico dell'indirizzo IP a intervalli prestabiliti. Esistono due approcci: rotazione temporale (ogni 5-10 minuti) e rotazione in base al numero di richieste (ogni 50-100 richieste).

Per il parsing dei marketplace, ti consigliamo la rotazione in base alle richieste: è più prevedibile. Se stai eseguendo il parsing di Wildberries, cambia IP ogni 50 richieste. Per piattaforme meno protette (AliExpress) puoi aumentare fino a 200-300 richieste per un IP.

Importante: Alcuni provider di proxy offrono rotazione automatica sul loro lato: ricevi un endpoint (indirizzo:porta), e l'IP cambia automaticamente ad ogni richiesta o secondo un timer. Questo semplifica la configurazione, ma offre meno controllo sul processo.

Passo 4: Configurazione dei ritardi tra le richieste

Anche con la rotazione dei proxy, non puoi inviare richieste in un flusso continuo. Un utente reale impiega tempo a visualizzare una scheda prodotto, leggere recensioni, confrontare prezzi. Il tuo parser deve imitare questo comportamento.

Ritardi ottimali per diversi marketplace:

  • Wildberries: 2-5 secondi tra le richieste, variazione casuale ±1 secondo
  • Ozon: 3-7 secondi (a causa del CAPTCHA in caso di richieste rapide)
  • AliExpress: 1-3 secondi (protezione più tollerante)

Utilizza ritardi casuali, non fissi. Se ogni richiesta viene effettuata esattamente dopo 3 secondi, questo è anche un segnale di un bot. Aggiungi casualità: da 2 a 5 secondi con distribuzione uniforme.

Rotazione IP e limiti di richieste: come non essere bannati

Anche con la corretta configurazione dei proxy, puoi ricevere un blocco se non consideri le peculiarità del funzionamento dei sistemi anti-parsing. I marketplace analizzano non solo la frequenza delle richieste, ma anche i modelli di comportamento.

Limiti di richieste per diversi tipi di proxy

Ogni tipo di proxy ha i propri limiti di utilizzo sicuri. Superare questi limiti aumenta drasticamente la probabilità di blocco.

Tipo di proxy Richieste per IP all'ora Richieste per IP al giorno Rotazione consigliata
Data center 50-100 300-500 Ogni 10-20 richieste
Residenziali 100-200 1000-2000 Ogni 50-100 richieste
Mobili 200-300 2000-3000 Ogni 100-200 richieste

Questi numeri sono indicativi. I limiti reali dipendono dal marketplace specifico e dall'orario del giorno. Durante le ore di punta (sera, fine settimana) puoi aumentare l'attività, poiché ci sono più utenti reali sulla piattaforma.

Strategie di rotazione per diversi volumi di parsing

La strategia di rotazione dipende da quanti dati hai bisogno di raccogliere. Per monitorare i top 100 prodotti in una categoria, è sufficiente uno schema semplice. Per il parsing dell'intero catalogo (decine di migliaia di posizioni) è necessario un sistema più complesso.

Piccolo volume (fino a 1000 prodotti al giorno): Utilizza 5-10 proxy residenziali con rotazione ogni 100 richieste. Questo è sufficiente per monitorare le tendenze in 2-3 categorie.

Volume medio (1000-10000 prodotti al giorno): Pool di 20-50 proxy residenziali, rotazione ogni 50 richieste. Aggiungi pause casuali di 1-2 ore tra le sessioni di parsing.

Grande volume (oltre 10000 prodotti al giorno): Combinazione di proxy residenziali (per richieste critiche) e proxy dei data center (per raccolta massiva). Utilizza 100+ proxy con rotazione aggressiva e distribuzione del carico nel tempo.

Quali dati raccogliere per l'analisi delle tendenze

Il parsing fine a se stesso non ha senso. È importante raccogliere le metriche giuste che aiutino a identificare i prodotti di tendenza prima che la nicchia diventi saturata dai concorrenti.

Metriche chiave per identificare le tendenze

Per ogni scheda prodotto raccogli i seguenti dati:

  • Nome e codice del prodotto — per identificazione e monitoraggio della dinamica
  • Prezzo (attuale e scontato) — le tendenze spesso iniziano con un brusco abbassamento dei prezzi
  • Numero di recensioni — un aumento delle recensioni in una settimana indica un incremento delle vendite
  • Media dei voti — i prodotti con un voto di 4.5+ diventano di tendenza più rapidamente
  • Numero di ordini (se disponibile) — indicatore diretto della domanda
  • Giacenze nei magazzini — una brusca diminuzione delle giacenze = aumento della domanda
  • Posizione nei risultati per le parole chiave — i prodotti nella top 10 ricevono l'80% dei clic
  • Data di apparizione del prodotto — nuovi prodotti con rapida crescita delle vendite = potenziale tendenza

Raccogli questi dati quotidianamente e salvali in un database (PostgreSQL, MySQL) o Google Sheets per progetti semplici. L'analisi della dinamica per 7-14 giorni mostrerà i prodotti con domanda crescente.

Come identificare una tendenza nelle fasi iniziali

I venditori di successo guadagnano sulle tendenze proprio perché entrano nella nicchia prima dei concorrenti. Quando di una tendenza si parla già nei canali Telegram, è troppo tardi per guadagnare su di essa: il margine diminuisce a causa della concorrenza.

Segnali di una tendenza emergente:

  • Aumento del numero di recensioni del 50-100% in una settimana con un piccolo database (10-50 recensioni)
  • Comparsa di 5-10 nuovi venditori nella nicchia nelle ultime 2 settimane
  • Diminuzione brusca delle giacenze presso i leader di categoria (da 1000+ a 100-200 pz)
  • Aumento delle posizioni nei risultati: il prodotto è salito dalla 50ª alla 10ª posizione in una settimana
  • Menzioni del prodotto sui social media (TikTok, Instagram) — segnale indiretto

Configura notifiche automatiche (bot Telegram, email) al rilevamento di tali segnali. Questo ti darà un vantaggio di 1-2 settimane rispetto alla massa principale dei concorrenti.

Errori comuni nel parsing e come evitarli

La maggior parte dei blocchi durante il parsing avviene a causa degli stessi errori. Analizziamo i problemi più comuni e le soluzioni.

Errore 1: Utilizzo di un solo IP per tutte le richieste

I principianti spesso acquistano 1-2 proxy e cercano di eseguire il parsing dell'intero catalogo tramite essi. Il risultato è prevedibile: blocco entro un'ora. I marketplace identificano facilmente i bot a causa dell'attività anomala da un singolo IP.

Soluzione: Utilizza almeno 10-20 proxy anche per progetti piccoli. Distribuisci il carico in modo uniforme: non più di 100-200 richieste per un IP all'ora.

Errore 2: Parsing durante la notte

Molti avviano i parser di notte, per avere dati freschi al mattino. Il problema è che di notte (dalle 2 alle 6 del mattino, ora di Mosca) il traffico sui marketplace è minimo. La tua attività diventa più evidente rispetto al basso carico generale.

Soluzione: Avvia il parsing durante le ore di punta — dalle 18:00 alle 23:00, quando sulla piattaforma ci sono il massimo di utenti reali. Le tue richieste si dissolveranno nel flusso generale di traffico.

Errore 3: Ignorare l'User-Agent e altri header

I parser inviano per impostazione predefinita richieste con User-Agent come "Python-requests/2.28" o "Selenium WebDriver". Questo è un chiaro segnale di un bot. I marketplace bloccano automaticamente tali richieste.

Soluzione: Utilizza User-Agent realistici dei browser moderni. Cambia l'User-Agent ad ogni rotazione dei proxy. Aggiungi anche header come Accept-Language, Referer e altri, caratteristici dei browser reali.

Errore 4: Parsing solo della prima pagina dei risultati

Molti si limitano a raccogliere dati sui top 50 prodotti in una categoria. Questo è un errore: le tendenze spesso nascono nella 3-5 pagina dei risultati, dove la concorrenza è più bassa e i prodotti iniziano a guadagnare popolarità.

Soluzione: Esegui il parsing di almeno le prime 5-10 pagine dei risultati (200-500 prodotti in categoria). Monitora i prodotti che salgono rapidamente dalla 5ª pagina alla 1-2ª: queste sono le tendenze emergenti.

Errore 5: Mancanza di gestione dei CAPTCHA e dei blocchi

Anche con la corretta configurazione dei proxy, a volte appare un CAPTCHA o un blocco temporaneo. Se il parser non è in grado di gestire tali situazioni, si fermerà con un errore e perderai dati.

Soluzione: Aggiungi nel parser la gestione degli errori. In caso di CAPTCHA, passa a un altro proxy e ripeti la richiesta dopo 5-10 minuti. Salva i risultati intermedi per non perdere dati in caso di errore.

Conclusione

La raccolta di dati sui prodotti di tendenza tramite proxy non è solo un processo tecnico, ma un vantaggio competitivo per i venditori dei marketplace. Mentre alcuni monitorano manualmente i concorrenti, tu ottieni dati strutturati su decine di migliaia di prodotti ogni giorno e identifichi le tendenze nelle fasi iniziali.

Punti chiave da ricordare: scegli il tipo di proxy in base alla protezione del marketplace (residenziali per Wildberries e Ozon, proxy dei data center per piattaforme meno protette), configura correttamente la rotazione degli IP tenendo conto dei limiti di richieste, aggiungi ritardi casuali tra le richieste e imita il comportamento di un utente reale, raccogli dati durante le ore di punta, quando la tua attività è meno evidente rispetto al traffico generale.

Inizia in piccolo: configura il parsing di 1-2 categorie di prodotti utilizzando 10-20 proxy. Affina il processo, assicurati che non ci siano blocchi e scala gradualmente il sistema. L'automazione della raccolta dei dati si ripaga già nel primo mese grazie a un più rapido accesso a nicchie di tendenza.

Se prevedi di raccogliere regolarmente dati da Wildberries, Ozon o altri marketplace protetti, ti consigliamo di utilizzare proxy residenziali: garantiscono un alto livello di fiducia da parte delle piattaforme e un rischio minimo di blocchi. Per il parsing massivo di siti meno protetti, sono adatti proxy dei data center con una corretta configurazione della rotazione.

```