Il monitoraggio automatico della disponibilità dei prodotti (stock availability) è un'attività di importanza critica per venditori e rivenditori. Il tracciamento delle scorte dei concorrenti su Wildberries, Ozon, Amazon consente di correggere tempestivamente prezzi e acquisti. Ma i marketplace bloccano severamente le richieste massive da un singolo IP — senza proxy il vostro parser verrà bloccato dopo 10-50 richieste.
In questa guida analizzeremo come configurare un monitoraggio stabile della stock availability tramite proxy: quale tipo di proxy scegliere, come configurare la rotazione IP, quali parametri di richiesta utilizzare e come evitare i blocchi sui marketplace più popolari.
Perché i marketplace bloccano il monitoraggio della disponibilità dei prodotti
I marketplace proteggono la propria infrastruttura dal parsing con diversi livelli di protezione. Quando avviate un monitoraggio automatico della disponibilità dei prodotti, il vostro script effettua centinaia o migliaia di richieste alle API o alle pagine web del marketplace. Per la piattaforma questo appare come un attacco o una raccolta dati scorretta.
Principali metodi di rilevamento dei parser:
- Frequenza delle richieste da un singolo IP — se da un indirizzo arrivano 100+ richieste al minuto, è un chiaro segno di bot. Un utente normale non può fisicamente aprire 2-3 schede prodotto al secondo.
- Assenza di cookies e cronologia di sessione — i parser spesso effettuano richieste senza un preventivo accesso alla pagina principale, il che rivela l'automazione.
- User-Agent identici — se tutte le richieste provengono con la stessa intestazione del browser, è sospetto.
- Pattern di comportamento — scansione sequenziale dei prodotti per ID, assenza di pause casuali, perfetta regolarità delle richieste.
Il blocco avviene a livello di indirizzo IP. Inizialmente il marketplace può mostrare un captcha, poi limitare temporaneamente l'accesso (rate limiting), e in caso di violazioni sistematiche — bloccare completamente l'IP per diverse ore o giorni.
Caso reale: Un venditore su Wildberries ha configurato il monitoraggio di 500 prodotti dei concorrenti con verifica ogni 10 minuti. Senza proxy il suo IP è stato bloccato dopo 2 ore di funzionamento. Dopo il passaggio a proxy residenziali con rotazione ogni 5 minuti, il parser funziona stabilmente da 6 mesi senza un singolo blocco.
Quale tipo di proxy scegliere per il parsing della stock availability
La scelta del tipo di proxy influisce direttamente sulla stabilità del monitoraggio e sulla probabilità di blocchi. Diversi marketplace reagiscono in modo diverso a vari tipi di indirizzi IP. Esaminiamo tre opzioni principali e la loro applicazione per il parsing della disponibilità dei prodotti.
| Tipo di proxy | Velocità | Rischio di blocco | Quando utilizzare |
|---|---|---|---|
| Proxy datacenter | Alta (50-200 ms) | Medio | Parsing massivo di marketplace semplici, verifica rapida di grandi volumi |
| Proxy residenziali | Media (200-800 ms) | Basso | Wildberries, Ozon, Amazon — piattaforme con protezione severa |
| Proxy mobile | Media (300-1000 ms) | Molto basso | Verifiche di importanza critica, quando serve massima affidabilità |
I proxy residenziali — la scelta ottimale per la maggior parte delle attività di monitoraggio della stock availability. Utilizzano indirizzi IP di utenti domestici reali, quindi i marketplace percepiscono le richieste come legittime. Per Wildberries e Ozon questo è praticamente un requisito obbligatorio — queste piattaforme bloccano aggressivamente i datacenter.
I proxy datacenter sono adatti per piattaforme meno protette o quando serve la massima velocità di parsing. Ad esempio, per il monitoraggio di marketplace regionali o piccoli negozi online. Il principale vantaggio — alta velocità e stabilità della connessione. Ma sulle grandi piattaforme vengono bloccati più frequentemente.
I proxy mobile — l'opzione più affidabile, ma anche la più costosa. Utilizzateli per prodotti di importanza critica o quando i proxy residenziali iniziano a essere bloccati. Gli IP mobile sono praticamente impossibili da bloccare, poiché dietro un indirizzo possono esserci migliaia di utenti reali dell'operatore telefonico.
Raccomandazione per la scelta:
- Wildberries, Ozon — solo proxy residenziali o mobile
- Amazon, eBay — proxy residenziali con rotazione
- Yandex.Market — si possono utilizzare datacenter con frequenza moderata di richieste
- Avito — proxy residenziali con associazione alla città necessaria
- Piattaforme regionali — i datacenter di solito funzionano normalmente
Configurazione della rotazione IP: con quale frequenza cambiare gli indirizzi
La rotazione IP — parametro chiave per prevenire i blocchi. La corretta configurazione della frequenza di cambio degli indirizzi consente di distribuire il carico in modo che da ogni IP arrivi il minimo numero di richieste, imitando il comportamento degli utenti normali.
Due approcci principali alla rotazione:
1. Rotazione temporale (Time-based rotation)
L'indirizzo IP cambia dopo un intervallo di tempo prestabilito, indipendentemente dal numero di richieste. Questo è un metodo semplice e prevedibile, adatto per il monitoraggio regolare con frequenza costante di verifiche.
- Ogni 5-10 minuti — per il monitoraggio frequente di prodotti di importanza critica (posizioni top, prodotti con alta concorrenza)
- Ogni 15-30 minuti — modalità standard per la maggior parte delle attività di monitoraggio stock availability
- Ogni ora — per il monitoraggio in background di un grande assortimento, quando non serve alta frequenza di aggiornamenti
2. Rotazione per richieste (Request-based rotation)
L'IP cambia dopo un determinato numero di richieste eseguite. Questo metodo offre un controllo più preciso sul carico per ogni indirizzo.
- Ogni 10-20 richieste — per Wildberries e Ozon (protezione severa)
- Ogni 50-100 richieste — per Amazon, eBay (protezione moderata)
- Ogni 200-500 richieste — per piattaforme meno protette
Importante: Non utilizzate una rotazione troppo frequente (ogni 1-2 minuti o ogni richiesta) — può sembrare sospetto. Un utente normale non cambia indirizzo IP ogni minuto. L'equilibrio ottimale — 5-15 minuti o 20-100 richieste per IP.
Approccio combinato (raccomandato):
Impostate la rotazione temporale come metodo principale, ma aggiungete un limite di richieste come protezione aggiuntiva. Ad esempio: l'IP cambia ogni 10 minuti OPPURE dopo 50 richieste — qualunque cosa accada prima. Questo protegge da picchi casuali di attività.
| Marketplace | Rotazione raccomandata | Max richieste/IP |
|---|---|---|
| Wildberries | 5-10 minuti | 15-30 richieste |
| Ozon | 7-12 minuti | 20-40 richieste |
| Amazon | 10-15 minuti | 50-100 richieste |
| Yandex.Market | 15-20 minuti | 100-200 richieste |
| Avito | 10-15 minuti | 30-60 richieste |
Caratteristiche del monitoraggio su diversi marketplace
Ogni marketplace ha le proprie caratteristiche di protezione dal parsing e richiede un approccio individuale alla configurazione del monitoraggio della stock availability. Esaminiamo le specificità del lavoro con le piattaforme russe e internazionali più popolari.
Wildberries
Wildberries ha uno dei sistemi di protezione dal parsing più aggressivi tra i marketplace russi. La piattaforma utilizza una verifica multilivello delle richieste, inclusa l'analisi di intestazioni, cookies, frequenza di accesso e pattern comportamentali.
Caratteristiche chiave:
- Utilizzo obbligatorio di proxy residenziali — i datacenter vengono bloccati praticamente istantaneamente
- Necessario trasmettere un set completo di intestazioni del browser, inclusi Referer e Accept-Language
- Le API di Wildberries richiedono token speciali per alcune richieste
- Il cambio frequente di IP (ogni 5-10 minuti) è di importanza critica
- Aggiungete ritardi casuali tra le richieste: 2-5 secondi
Per il monitoraggio della disponibilità dei prodotti su Wildberries utilizzate le API pubbliche o il parsing delle schede prodotto. Le API sono più stabili, ma hanno limiti severi. Nel parsing HTML è obbligatorio imitare il comportamento di un browser reale: caricare immagini, eseguire JavaScript, salvare cookies tra le richieste.
Ozon
Ozon utilizza una protezione meno aggressiva rispetto a Wildberries, ma richiede comunque un approccio attento. La piattaforma utilizza attivamente Cloudflare per la protezione dai bot, aggiungendo un ulteriore livello di complessità.
- I proxy residenziali sono raccomandati, ma datacenter di qualità possono funzionare con bassa frequenza di richieste
- La Cloudflare challenge richiede l'esecuzione di JavaScript — utilizzate browser headless o librerie speciali
- La rotazione IP ogni 10-15 minuti è solitamente sufficiente
- Ritardi tra le richieste: 3-7 secondi
- Obbligatorio salvare i cookies dopo aver superato Cloudflare
Amazon
Amazon ha un sistema di protezione complesso che analizza numerosi parametri delle richieste. La piattaforma è particolarmente sensibile alla frequenza di accesso e alla posizione geografica degli indirizzi IP.
- Utilizzate proxy residenziali dello stesso paese del marketplace target (amazon.com — USA, amazon.de — Germania)
- Amazon mostra spesso captcha in caso di attività sospetta — preparate un sistema per risolverli
- Rotazione IP ogni 15-20 minuti o ogni 50-100 richieste
- Ritardi tra le richieste: 5-10 secondi (Amazon è molto sensibile alla velocità)
- Obbligatorio utilizzare User-Agent aggiornati di browser popolari
Avito
Avito ha una caratteristica specifica — l'associazione geografica degli annunci. Per un corretto monitoraggio della disponibilità dei prodotti in una città specifica servono proxy proprio da quella regione.
- Utilizzate proxy residenziali con geolocalizzazione nella città necessaria
- Avito mostra risultati diversi per regioni diverse — un IP può vedere solo parte degli annunci
- La rotazione ogni 10-15 minuti è sufficiente
- Ritardi tra le richieste: 3-5 secondi
- La piattaforma utilizza cookies per tracciare le sessioni — salvateli obbligatoriamente
Raccomandazioni generali per tutti i marketplace:
- Aggiungete sempre ritardi casuali — non utilizzate intervalli fissi
- Imitate il comportamento di un utente reale: transizioni dalla pagina principale, visualizzazione categorie
- Ruotate lo User-Agent insieme agli indirizzi IP
- Salvate cookies e session storage tra le richieste
- Monitorate i codici di risposta: 429 (Too Many Requests) — segnale per ridurre la frequenza
Limiti di richieste e ritardi tra le verifiche
La corretta configurazione della frequenza delle richieste — equilibrio tra attualità dei dati e rischio di blocco. Verifiche troppo frequenti porteranno al ban, troppo rare — alla perdita del vantaggio competitivo. Analizziamo come trovare la frequenza ottimale per diversi scenari.
Ritardi raccomandati tra le richieste allo stesso prodotto:
| Scenario | Frequenza di verifica | Applicazione |
|---|---|---|
| Prodotti critici | Ogni 5-10 minuti | Posizioni top, prodotti con alta concorrenza, offerte promozionali |
| Monitoraggio standard | Ogni 30-60 minuti | Assortimento principale, monitoraggio regolare dei concorrenti |
| Monitoraggio in background | Ogni 2-6 ore | Grande catalogo prodotti, analisi generale del mercato |
| Monitoraggio archivio | 1-2 volte al giorno | Dati storici, analisi a lungo termine |
Ritardi tra richieste sequenziali (nel parsing di più prodotti consecutivi):
- Ritardo minimo: 2-3 secondi — minimo assoluto per imitare il comportamento umano. Un utente reale non può aprire schede prodotto più velocemente.
- Ritardo ottimale: 4-7 secondi — raccomandato per la maggior parte delle attività. Aggiungete casualità: random(4000, 7000) millisecondi.
- Ritardo sicuro: 8-15 secondi — utilizzate per piattaforme particolarmente protette o dopo aver ricevuto avvisi di superamento limiti.
Principio importante — casualità: Non utilizzate mai intervalli fissi. Invece di un ritardo di esattamente 5 secondi fate un casuale da 4 a 6 secondi. Questo è di importanza critica per imitare il comportamento umano. Gli utenti reali non cliccano con perfetta regolarità.
Consiglio pratico: Iniziate con impostazioni conservative (grandi ritardi, rotazione rara), poi aumentate gradualmente la frequenza delle richieste, monitorando i codici di risposta. Se iniziate a ricevere 429 (Too Many Requests) o 403 (Forbidden) — riducete immediatamente il carico e aumentate i ritardi.
Distribuzione del carico per fasce orarie:
I marketplace hanno ore di punta di carico (solitamente sera 18:00-22:00), quando i sistemi di protezione sono particolarmente sensibili. Si raccomanda di ridurre la frequenza delle richieste in questi periodi o fare una pausa completa nel monitoraggio, se i dati non sono critici.
Strumenti pronti per il monitoraggio tramite proxy
Per il monitoraggio della stock availability non è obbligatorio scrivere un parser da zero. Esistono numerose soluzioni pronte che supportano il lavoro tramite proxy e hanno meccanismi integrati di protezione dai blocchi. Esaminiamo gli strumenti popolari per diversi livelli di preparazione tecnica.
Servizi SaaS pronti (senza programmazione)
1. Keepa (per Amazon)
Servizio specializzato per il monitoraggio di Amazon. Traccia prezzi, disponibilità prodotti, valutazioni. Ha un sistema di proxy integrato, non richiede conoscenze tecniche. Svantaggio — funziona solo con Amazon.
2. Parsehub
Parser visuale che permette di configurare la raccolta dati tramite interfaccia grafica. Supporta la configurazione di proxy, rotazione IP, ritardi tra le richieste. Adatto per utenti senza competenze di programmazione.
3. Octoparse
Analogo di Parsehub con possibilità di automazione più avanzate. Ha template integrati per marketplace popolari, inclusi Amazon, eBay. Supporta l'esecuzione cloud delle attività e la rotazione automatica dei proxy.
Soluzioni software (richiedono configurazione)
1. Scrapy (Python)
Potente framework per il parsing in Python. Ha supporto integrato per proxy, middleware per la rotazione, gestione degli errori. Richiede competenze di programmazione, ma offre massima flessibilità di configurazione.
Un esempio di configurazione proxy in Scrapy si trova nel file settings.py — aggiungete middleware per la rotazione e l'elenco dei server proxy. Il framework distribuisce automaticamente le richieste tra gli IP disponibili.
2. Puppeteer / Playwright (JavaScript)
Browser headless per l'automazione di Chrome/Firefox. Ideali per il parsing di siti con JavaScript e protezione complessa. Supportano la configurazione di proxy a livello di browser, emulazione del comportamento reale dell'utente.
3. Selenium
Strumento classico di automazione browser. Funziona più lentamente di Puppeteer, ma ha più soluzioni ed esempi pronti. Adatto per sviluppatori principianti.
Soluzioni specializzate per marketplace
1. MoySklad (integrazione con Wildberries, Ozon)
Sistema di contabilità con integrazione incorporata con marketplace russi. Sincronizza automaticamente le scorte, ma funziona solo tramite API ufficiali — non adatto per il monitoraggio dei concorrenti.
2. Mpstats
Servizio analitico per Wildberries e Ozon. Raccoglie dati su prodotti, prezzi, disponibilità. Ha una propria infrastruttura di proxy, non richiede configurazione aggiuntiva. A pagamento, ma stabile.
3. SellerFox
Soluzione completa per venditori su marketplace russi. Include monitoraggio concorrenti, analisi, automazione prezzi. Funziona tramite proxy propri.
Come scegliere lo strumento:
- Nessuna competenza di programmazione — utilizzate servizi SaaS (Parsehub, Octoparse) o soluzioni specializzate (Mpstats)
- Competenze base di codice — Scrapy o Puppeteer daranno più controllo e minori costi
- Serve massima flessibilità — scrivete una soluzione propria in Python o Node.js
- Solo un marketplace — cercate uno strumento specializzato (Keepa per Amazon, Mpstats per Wildberries)
Configurazione passo-passo dei proxy per il parser
Analizziamo la configurazione pratica dei proxy per il monitoraggio della stock availability con l'esempio di uno scenario tipico: monitoraggio di 100 prodotti su Wildberries con verifica ogni 30 minuti. L'istruzione è adatta per la maggior parte dei parser pronti e soluzioni personalizzate.
Passo 1: Scelta e acquisto dei proxy
Per Wildberries servono proxy residenziali. Calcoliamo la quantità necessaria:
- 100 prodotti × 2 verifiche all'ora = 200 richieste/ora
- Limite sicuro per Wildberries: 20 richieste per IP
- Necessari: 200 ÷ 20 = 10 indirizzi IP minimo
Si raccomanda di prendere con margine: 15-20 IP per un funzionamento stabile. Nell'acquisto dei proxy assicuratevi che il provider supporti la rotazione temporale o per richieste.
Passo 2: Ottenimento dati per la connessione
Dopo l'acquisto riceverete i dati nel formato:
Host: proxy.example.com
Porta: 8080
Login: user123
Password: pass456
Tipo: HTTP/HTTPS o SOCKS5
Alcuni provider forniscono URL per la rotazione automatica:
http://user123:[email protected]:8080
Questo URL può essere utilizzato direttamente nella maggior parte dei parser — il server proxy cambierà autonomamente l'IP secondo le impostazioni.
Passo 3: Configurazione nello strumento pronto (Octoparse)
1. Aprite le impostazioni dell'attività di parsing
In Octoparse andate nella sezione "Advanced Options" → "Proxy Settings"
2. Inserite i dati del proxy:
- Proxy Type: selezionate HTTP o SOCKS5 (a seconda del vostro proxy)
- Server: proxy.example.com
- Port: 8080
- Username: user123
- Password: pass456
3. Configurate la rotazione:
Se il vostro provider supporta la rotazione automatica — semplicemente attivate l'opzione "Use rotating proxy". Se no — aggiungete manualmente l'elenco IP e attivate "Rotate IP addresses" con intervallo di 10 minuti.
4. Configurate i ritardi:
Nella sezione "Speed Settings" impostate il ritardo tra le richieste: 4-7 secondi (Random delay between 4000 and 7000 ms).
Passo 4: Test delle impostazioni
Prima di avviare il monitoraggio completo testate obbligatoriamente le impostazioni:
- Verificate la connessione al proxy — la maggior parte degli strumenti ha il pulsante "Test connection"
- Avviate il parsing di 5-10 prodotti — assicuratevi che i dati vengano raccolti correttamente
- Controllate i log per errori — i codici 403, 429, 503 indicano problemi con i proxy o frequenza troppo alta
- Assicuratevi che l'IP cambi — nei log dovrebbero apparire indirizzi diversi secondo le impostazioni di rotazione
Importante: Le prime ore di funzionamento monitorate attentamente i log del parser. Se vedete errori frequenti o blocchi — aumentate i ritardi tra le richieste e la frequenza di rotazione IP. Meglio ottenere dati più lentamente, ma stabilmente, che velocemente ricevere un ban.
Passo 5: Monitoraggio e ottimizzazione
Dopo l'avvio controllate regolarmente:
- Success rate — la percentuale di richieste riuscite deve essere superiore al 95%
- Codici di risposta — se appaiono 429 o 503 più del 5% — riducete il carico
- Velocità di funzionamento dei proxy — se i ritardi superano i 2-3 secondi, forse vale la pena cambiare provider
- Attualità dei dati — confrontate i dati ottenuti con quelli reali sul sito del marketplace
Ottimizzate gradualmente le impostazioni: se tutto funziona stabilmente per una settimana, potete aumentare leggermente la frequenza delle verifiche o diminuire i ritardi. Ma fatelo gradualmente, passo dopo passo.
Errori tipici e come evitarli
Anche con una corretta configurazione dei proxy, i principianti commettono spesso errori che portano a blocchi o funzionamento instabile del parser. Analizziamo i problemi più comuni e i modi per risolverli.
Errore 1: Utilizzo di un unico User-Agent per tutte le richieste
Problema: Il parser invia tutte le richieste con la stessa intestazione User-Agent, anche cambiando IP. Questo appare sospetto — lo stesso "browser" appare da indirizzi diversi.
Soluzione: Ruotate lo User-Agent insieme agli indirizzi IP. Create un elenco di browser popolari (Chrome, Firefox, Safari di diverse versioni) e selezionate casualmente da esso ad ogni cambio di proxy. La maggior parte delle librerie per il parsing ha supporto integrato per la rotazione dello User-Agent.
Errore 2: Rotazione IP troppo frequente
Problema: Alcuni configurano il cambio IP dopo ogni richiesta, pensando che sia il massimo della sicurezza. In realtà questo appare innaturale — gli utenti reali non cambiano IP ogni secondo.
Soluzione: Utilizzate intervalli di rotazione ragionevoli: 5-15 minuti o 20-100 richieste per IP. Questo imita il comportamento di un utente reale, che naviga dallo stesso dispositivo per un certo tempo, poi cambia.
Errore 3: Ignorare i cookies
Problema: Il parser effettua richieste senza salvare i cookies tra di esse. I marketplace utilizzano i cookies per tracciare le sessioni — se non li salvate, ogni richiesta appare come una nuova sessione.
Soluzione: Salvate sempre i cookies dopo la prima richiesta e trasmetteteli nelle successive. Cambiando IP create una nuova sessione con nuovi cookies — questo imita un nuovo utente.
Errore 4: Ritardi fissi tra le richieste
Problema: È impostato un ritardo di esattamente 5 secondi tra tutte le richieste. Questo crea un pattern perfetto, facilmente rilevabile dai sistemi anti-bot.
Soluzione: Utilizzate ritardi casuali in un intervallo. Invece di 5 secondi fate random(4, 7) secondi. Aggiungete a volte pause più lunghe (10-20 secondi), imitando la distrazione dell'utente.
Errore 5: Utilizzo di proxy pubblici economici
Problema: Tentativo di risparmiare sui proxy, utilizzando elenchi pubblici gratuiti o molto economici. Questi IP sono già bloccati sulla maggior parte dei marketplace, poiché utilizzati da migliaia di altri parser.
Soluzione: Investite in proxy residenziali di qualità da provider affidabili. Questa è la base del funzionamento stabile. Il risparmio sui proxy porterà a perdita di tempo nella lotta contro i blocchi e potenziale perdita di dati.
Errore 6: Assenza di gestione degli errori
Problema: Il parser non gestisce gli errori e continua a bombardare il server con richieste anche dopo aver ricevuto 429 (Too Many Requests) o 503 (Service Unavailable).
Soluzione: Implementate una gestione intelligente degli errori:
- Ricevendo 429 — aumentate i ritardi del doppio e cambiate IP
- Ricevendo 503 — fate una pausa di 5-10 minuti
- Ricevendo 403 — cambiate immediatamente IP e controllate le impostazioni
- Utilizzate exponential backoff: in caso di errori ripetuti aumentate la pausa esponenzialmente
Checklist prima di avviare il monitoraggio:
- ✅ Utilizzati proxy residenziali di qualità
- ✅ Configurata rotazione IP ogni 5-15 minuti
- ✅ Rotazione User-Agent attivata
- ✅ Cookies salvati tra le richieste
- ✅ Ritardi casuali tra le richieste (4-7 secondi)
- ✅ Gestione errori implementata
- ✅ Test effettuato su piccolo campione di prodotti
Conclusione
Il monitoraggio della disponibilità dei prodotti tramite proxy è un'attività tecnica che richiede attenzione ai dettagli e configurazione corretta. La scelta del tipo di proxy giusto, la configurazione della rotazione IP, i ritardi appropriati tra le richieste e la gestione intelligente degli errori — tutti questi elementi insieme garantiscono un funzionamento stabile del parser senza blocchi.
Ricordate i principi chiave: utilizzate proxy residenziali di qualità per marketplace con protezione severa, ruotate gli IP ogni 5-15 minuti, aggiungete ritardi casuali tra le richieste, salvate i cookies e monitorate i codici di risposta. Iniziate con impostazioni conservative e aumentate gradualmente il carico, osservando la reazione del sistema.
Il monitoraggio correttamente configurato della stock availability vi darà un vantaggio competitivo significativo, permettendovi di reagire tempestivamente ai cambiamenti del mercato, ottimizzare i prezzi e gestire efficacemente l'assortimento. Investite tempo nella configurazione iniziale — ripagherà con un funzionamento stabile e dati affidabili per mesi a venire.