Torna al blog

Parsing delle offerte di lavoro da LinkedIn e HeadHunter senza ban: strumenti e proxy per recruiter

Analizziamo come raccogliere automaticamente le offerte di lavoro da LinkedIn e HeadHunter senza ricevere un ban: strumenti, proxy e impostazioni passo dopo passo per reclutatori e specialisti HR.

📅13 marzo 2026
```html

Se ti occupi di reclutamento o analisi HR, sicuramente ti sei trovato nella situazione di dover raccogliere rapidamente oltre 500 offerte di lavoro dei concorrenti, monitorare il mercato salariale o estrarre i contatti dei datori di lavoro — e le piattaforme ti bloccano già dopo 20-30 richieste. LinkedIn e HeadHunter proteggono attivamente i loro dati e senza un approccio corretto, il parsing si trasforma in una lotta infinita contro i captcha e i ban.

In questa guida analizzeremo quali strumenti funzionano realmente nel 2024, come configurare i proxy per una raccolta dati stabile e quali errori evitare per non perdere l'account.

Perché LinkedIn e HeadHunter bloccano il parsing

Entrambe le piattaforme guadagnano dai dati. LinkedIn vende accesso al database tramite piani a pagamento Recruiter e Recruiter Lite, HeadHunter tramite API e pubblicazioni a pagamento. Quando qualcuno inizia a raccogliere questi dati in massa gratuitamente, le piattaforme reagiscono in modo severo. Ecco i meccanismi di protezione specifici con cui ti imbatterai:

Rate Limiting — limitazione della frequenza delle richieste

LinkedIn monitora il numero di visualizzazioni dei profili e delle pagine delle offerte in un dato periodo di tempo. Un account gratuito può visualizzare circa 300 profili al mese — dopo di che ricevi un avviso o un blocco temporaneo. Durante il parsing automatico senza ritardi tra le richieste, questo limite viene esaurito in pochi minuti. HeadHunter limita il numero di richieste di ricerca da un singolo IP — se superato, mostra un captcha o blocca temporaneamente l'accesso.

Analisi del comportamento e User-Agent

Le piattaforme analizzano i modelli di comportamento: un utente reale scorre la pagina, si sofferma sui contenuti, clicca in modo non sequenziale. Un bot fa richieste con intervalli identici, non scorre, invia intestazioni non tipiche. LinkedIn controlla inoltre la presenza di una sessione autorizzata — senza accesso all'account, vedi dati limitati e ricevi rapidamente un blocco IP.

Blocco per indirizzo IP

Questa è la protezione più comune. Se da un singolo IP arrivano troppe richieste, l'IP finisce nella blacklist. Gli IP dei data center (AWS, Google Cloud, Hetzner) vengono bloccati molto rapidamente: le piattaforme conoscono questi intervalli di indirizzi e li trattano con maggiore sospetto. Gli IP domestici e mobili vengono bloccati meno frequentemente, poiché possono appartenere a utenti reali.

⚠️ È importante sapere

LinkedIn ha notevolmente inasprito la protezione nel 2023: ora anche durante la visualizzazione manuale dei profili con VPN o proxy di data center, l'account può essere bloccato. Per lavorare con LinkedIn, è fondamentale utilizzare proxy residenziali o mobili.

Cosa esattamente estraggono i reclutatori e gli analisti HR

Prima di configurare gli strumenti, definisci l'obiettivo — da esso dipende la scelta dell'approccio e del tipo di proxy. Ecco i principali scenari con cui lavorano gli specialisti HR e le agenzie di reclutamento:

Obiettivo Piattaforma Volume di dati
Monitoraggio dei salari di mercato HeadHunter, LinkedIn 500–5000 offerte/giorno
Raccolta dei contatti dei datori di lavoro LinkedIn 100–1000 profili/giorno
Analisi delle richieste ai candidati HeadHunter, LinkedIn 1000–10 000 offerte
Monitoraggio delle nuove offerte dei concorrenti HeadHunter Monitoraggio giornaliero
Ricerca di candidati passivi LinkedIn 50–500 profili/giorno

Punto chiave: le attività con un grande volume di dati (migliaia di offerte al giorno) richiedono un pool di proxy con rotazione. Le attività con un volume ridotto (monitoraggio di 50-100 posizioni quotidianamente) possono essere risolte con 1-2 proxy statici rispettando i ritardi tra le richieste.

Strumenti pronti per il parsing delle offerte di lavoro

Buone notizie: non è necessario scrivere codice da zero. Esistono soluzioni pronte per diverse esigenze e livelli di preparazione tecnica. Analizziamo le principali categorie.

Strumenti No-code (senza programmazione)

Apify — piattaforma cloud con "attori" pronti per LinkedIn e HeadHunter. È disponibile un LinkedIn Jobs Scraper e un HH.ru Scraper. Devi solo specificare i parametri di ricerca, la piattaforma fa tutto il resto. Supporta la connessione di proxy propri. Tariffe a partire da $49/mese, c'è un limite gratuito.

Phantombuster — specializzato in LinkedIn. È in grado di raccogliere offerte di lavoro, profili, contatti delle aziende. Funziona tramite un account LinkedIn autorizzato. Supporta i proxy. Importante: un account LinkedIn = un profilo proxy, altrimenti ricevi un ban per cambio IP.

Octoparse — costruttore visivo di parser. Permette di configurare la raccolta di dati da qualsiasi sito senza codice, specificando gli elementi desiderati con il mouse. Supporta la rotazione dei proxy. Adatto per HeadHunter — l'interfaccia è semplice e intuitiva.

Strumenti per utenti tecnici

ParseHub — applicazione desktop con interfaccia visiva, ma più flessibile rispetto a Octoparse. È in grado di lavorare con contenuti dinamici (pagine JavaScript). Per LinkedIn questo è cruciale — la maggior parte dei dati viene caricata dinamicamente.

Bright Data (Web Scraper IDE) — piattaforma professionale con proxy integrati. Sono disponibili modelli pronti per LinkedIn. Costosa, ma affidabile per volumi industriali.

HH.ru API — API ufficiale di HeadHunter. Gratuito per uso non commerciale, a pagamento per le aziende. Se il tuo obiettivo è monitorare le offerte di lavoro, e non raccogliere contatti in massa, l'API ufficiale è l'opzione più stabile. Limiti: 50 richieste al secondo per applicazioni autorizzate.

💡 Consiglio

Per HeadHunter inizia con l'API ufficiale — è legale, stabile e gratuito fino a determinati limiti. Per LinkedIn non puoi fare a meno di strumenti di terze parti e proxy, poiché non esiste un'API pubblica ufficiale per le offerte di lavoro.

A cosa servono i proxy e quale tipo scegliere

I proxy sono server intermedi attraverso cui passano le tue richieste. La piattaforma vede l'IP del proxy, non il tuo indirizzo reale. Con la rotazione dei proxy (cambio automatico di IP) ogni richiesta appare come una richiesta di un nuovo utente — questo consente di bypassare i limiti e i blocchi.

Ma non tutti i proxy sono ugualmente efficaci per LinkedIn e HeadHunter. La scelta del tipo di proxy influisce in modo critico sul risultato:

Tipo di proxy LinkedIn HeadHunter Velocità Prezzo
Residenziali ✅ Ottimo ✅ Ottimo Media $$
Mobili ✅ Ottimo ✅ Buono Media $$$
Data center ❌ Spesso bloccati ⚠️ Moderatamente Alta $

Proxy residenziali — la scelta ottimale per LinkedIn

I proxy residenziali utilizzano indirizzi IP reali di utenti domestici. Dal punto di vista di LinkedIn — è una persona normale che sta a casa. Questi IP raramente finiscono nelle blacklist, e la piattaforma non può distinguerli da un utente reale. Per il parsing di LinkedIn, questo è lo standard del settore.

Parametri chiave nella scelta dei proxy residenziali per il parsing delle offerte di lavoro:

  • Geolocalizzazione: scegli IP del paese da cui stai estraendo le offerte (per HeadHunter — Russia, per LinkedIn — il paese desiderato)
  • Rotazione: cambio automatico di IP dopo ogni richiesta o a intervalli
  • Pool di IP: più è grande, meglio è, riduce il rischio di riutilizzare un IP bloccato
  • Supporto HTTP/HTTPS e SOCKS5 — la maggior parte degli strumenti di parsing richiede questi protocolli

Proxy mobili — per lavorare con gli account LinkedIn

Se stai estraendo LinkedIn tramite un account autorizzato (come funziona Phantombuster), i proxy mobili offrono un vantaggio aggiuntivo: LinkedIn vede l'operatore mobile come fonte e si fida ancora di più di questi IP. Un IP mobile può servire migliaia di utenti reali (dietro il NAT dell'operatore), quindi anche un'attività elevata da esso non suscita sospetti.

Proxy dei data center — solo per HeadHunter

I proxy dei data center sono veloci e economici, ma LinkedIn li blocca aggressivamente. Per HeadHunter funzionano meglio: la piattaforma è meno paranoica nei confronti degli IP dei data center, soprattutto se si rispettano i ritardi tra le richieste. Adatti per un monitoraggio economico delle offerte su HH a volumi ridotti.

Parsing di LinkedIn: configurazione passo-passo

LinkedIn è la piattaforma più difficile da estrarre. Qui è importante agire con cautela per non perdere l'account. Analizziamo uno schema di lavoro usando Phantombuster — uno degli strumenti più popolari tra i reclutatori.

Passo 1: Prepara l'account LinkedIn

Non utilizzare mai l'account di lavoro principale per il parsing. Crea un account separato o utilizza uno secondario. Se viene bloccato, non perderai contatti preziosi e la storia. L'account deve essere "riscaldato": profilo compilato, alcuni contatti, almeno una settimana di attività prima di iniziare il parsing.

Passo 2: Collega il proxy all'account

Regola critica: un account LinkedIn = un indirizzo IP. Se oggi accedi con l'IP 1 e domani con l'IP 2 — questo è un segnale rosso per il sistema di sicurezza di LinkedIn. Utilizza un proxy residenziale statico (sticky session) per ogni account.

In Phantombuster la configurazione del proxy appare così:

  1. Accedi a Settings → Proxies nel tuo account Phantombuster
  2. Clicca su Add Proxy
  3. Inserisci i dati del proxy: host, porta, login, password
  4. Scegli il tipo: HTTP o SOCKS5 (dipende dal tuo fornitore di proxy)
  5. Clicca su Test Proxy — assicurati che il proxy funzioni
  6. Assegna questo proxy a un "fantasma" specifico (compito) che lavora con il tuo account

Passo 3: Configura l'esportazione delle offerte di lavoro di LinkedIn

In Phantombuster trova il fantasma "LinkedIn Jobs Search Export". Impostazioni:

  • Search URL: incolla l'URL di ricerca delle offerte di lavoro di LinkedIn con i filtri desiderati (posizione, città, tipo di occupazione)
  • Number of jobs per launch: inizia con 25-50. Non impostare 500 fin dal primo giorno
  • Launch frequency: 1 volta ogni 2-3 ore. Non avviare continuamente
  • Session cookie: copia il cookie li_at dal browser (le istruzioni sono disponibili in Phantombuster)

Passo 4: Imposta limiti di sicurezza

LinkedIn blocca per aggressività, non per il semplice fatto del parsing. Limiti di sicurezza per un account:

  • Non più di 80-100 visualizzazioni di offerte al giorno
  • Ritardo tra le richieste: minimo 3-5 secondi
  • Fai pause durante la notte (simula il comportamento umano)
  • Non avviare il parsing nei fine settimana — appare sospetto per una piattaforma B2B

⚠️ Se hai bisogno di un grande volume di dati da LinkedIn

Se hai bisogno di estrarre migliaia di offerte al giorno — utilizza più account, ciascuno con il proprio proxy residenziale. Un account + un IP = massimo 100 offerte al giorno senza rischio di blocco. 10 account × 100 = 1000 offerte al giorno.

Parsing di HeadHunter: caratteristiche e configurazione

HeadHunter è più semplice di LinkedIn per il parsing per due motivi: c'è un'API ufficiale e la protezione è meno aggressiva. Ma durante la raccolta di dati in massa senza una corretta configurazione, riceverai comunque un blocco.

Opzione 1: API ufficiale di HeadHunter (raccomandata)

Se il tuo obiettivo è monitorare le offerte di lavoro e analizzare il mercato (senza raccogliere contatti), utilizza l'API ufficiale di hh.ru. È completamente legale e offre accesso stabile ai dati.

  1. Registrati per un'applicazione su dev.hh.ru
  2. Ottieni client_id e client_secret
  3. Utilizza l'endpoint GET /vacancies per cercare offerte di lavoro
  4. Parametri di filtraggio: text, area (regione), salary, experience, schedule
  5. Limite: 50 richieste al secondo per applicazioni autorizzate

Il risultato arriva in formato JSON — è facile caricarlo in Excel o Google Sheets tramite strumenti come Zapier o Make (ex Integromat) senza scrivere codice.

Opzione 2: Parsing tramite Apify (senza codice)

Se hai bisogno di dati che non sono nell'API ufficiale (ad esempio, contatti dei datori di lavoro o dati in formato non standard), utilizza Apify con un attore pronto per HH.ru:

  1. Accedi a apify.com e trova l'attore "HH.ru Scraper"
  2. Clicca su Try for free
  3. Nei parametri specifica la query di ricerca (posizione, città)
  4. Nella sezione Proxy configuration seleziona "Custom proxies" e incolla i dati dei tuoi proxy
  5. Per HeadHunter, sono adatti i proxy residenziali con IP russi — la piattaforma è regionale
  6. Clicca su Start e attendi i risultati
  7. Esporta i dati in CSV, JSON o Excel

Opzione 3: Octoparse per compiti avanzati

Octoparse consente di configurare il parsing di qualsiasi elemento della pagina HH.ru — inclusi quelli non presenti nell'API. Ad esempio, puoi raccogliere descrizioni complete delle offerte, dati di contatto (se visibili), link alle aziende.

  1. Scarica e installa Octoparse
  2. Crea un nuovo compito, incolla l'URL di ricerca delle offerte su hh.ru
  3. Utilizza la modalità Auto-detect — Octoparse determinerà automaticamente la struttura dell'elenco
  4. Controlla che tutti i campi necessari siano evidenziati (titolo, azienda, stipendio, città)
  5. Nei parametri del compito attiva IP Rotation e aggiungi i tuoi proxy
  6. Imposta un ritardo tra le richieste: 2-4 secondi
  7. Avvia nel cloud (Cloud Extraction) per una raccolta continua

💡 Geolocalizzazione dei proxy per HeadHunter

HeadHunter determina la regione dell'utente tramite l'IP e mostra offerte regionali. Se desideri estrarre offerte da una città specifica (ad esempio, solo Mosca o San Pietroburgo), utilizza proxy con IP di quella regione. Per un monitoraggio nazionale, è sufficiente qualsiasi IP russo.

Errori comuni e come evitarli

La maggior parte dei problemi durante il parsing di LinkedIn e HeadHunter deriva dagli stessi errori. Ecco un elenco di ciò che non si deve fare:

❌ Errore 1: Utilizzare un solo IP per tutto

L'errore più comune tra i principianti è avviare il parsing dal proprio IP domestico o da un solo proxy. Non appena la piattaforma rileva un'attività anomala, l'IP viene bloccato per sempre. Soluzione: proxy rotazionali con cambio automatico di IP o un pool di più proxy statici.

❌ Errore 2: Velocità delle richieste troppo alta

Estrarre 1000 pagine in 10 minuti è un modo sicuro per ricevere un ban. Un utente reale non può fisicamente visualizzare le pagine a tale velocità. Imposta dei ritardi: minimo 2-3 secondi tra le richieste per HeadHunter, 5-10 secondi per LinkedIn. Aggiungi una variazione casuale del ritardo (non esattamente 3 secondi, ma da 2 a 5 — questo simula un comportamento umano).

❌ Errore 3: Cambio di IP per l'account LinkedIn

Se utilizzi proxy rotazionali per lavorare con un account LinkedIn autorizzato, ogni richiesta proviene da un nuovo IP. LinkedIn lo vede come un tentativo di hacking dell'account (qualcuno si connette da luoghi diversi) e lo blocca. Per le sessioni autorizzate, utilizza solo proxy sticky (IP fisso per un lungo periodo) o proxy residenziali statici.

❌ Errore 4: Ignorare l'User-Agent

L'User-Agent è la stringa che il browser invia al server, identificandosi. Molti strumenti di parsing inviano per impostazione predefinita un User-Agent del tipo "python-requests/2.28.0" — questo rivela immediatamente un bot. Configura un User-Agent realistico di un browser moderno. In Apify e Phantombuster viene fatto automaticamente, in Octoparse — nelle impostazioni del compito.

❌ Errore 5: Parsing senza controllare robots.txt

LinkedIn vieta il parsing nel proprio robots.txt e fa causa attivamente a aziende che lo fanno su scala industriale. Questo non significa che non si possano raccogliere dati per analisi personali — ma è importante comprendere i rischi legali per un uso commerciale. HeadHunter è più permissivo, soprattutto se si utilizza l'API ufficiale.

❌ Errore 6: Proxy pubblici economici

Proxy gratuiti o molto economici da elenchi pubblici sono una trappola. Sono già stati bloccati dalla maggior parte delle piattaforme, funzionano in modo instabile e spesso intercettano i dati. Per un lavoro serio sono necessari proxy a pagamento da fornitori affidabili con veri IP residenziali o mobili.

Checklist prima di avviare il parsing

  • ✅ Utilizza un account separato (non quello di lavoro principale)
  • ✅ Collega proxy residenziali o mobili
  • ✅ Per LinkedIn: un account = un IP fisso
  • ✅ Ritardi tra le richieste impostati (minimo 3 sec)
  • ✅ User-Agent impostato come quello di un browser reale
  • ✅ Limite giornaliero delle richieste limitato a valori ragionevoli
  • ✅ Proxy testati prima dell'avvio
  • ✅ Geolocalizzazione dei proxy corrispondente alla regione target

Conclusione

Il parsing delle offerte di lavoro da LinkedIn e HeadHunter è uno strumento utile per reclutatori, analisti HR e ricercatori di mercato del lavoro. La cosa principale è scegliere l'approccio giusto: per HeadHunter inizia con l'API ufficiale, per LinkedIn utilizza strumenti specializzati come Phantombuster o Apify con proxy configurati correttamente.

Le conclusioni chiave dalla guida: LinkedIn richiede proxy residenziali o mobili con IP fisso per account, HeadHunter è meno rigoroso, ma ha comunque bisogno di proxy per grandi volumi. Rispetta i limiti delle richieste, simula il comportamento umano e non utilizzare mai l'account principale per l'automazione.

Se prevedi un monitoraggio regolare delle offerte o una raccolta dati su larga scala da LinkedIn, ti consigliamo di utilizzare proxy residenziali — offrono la massima compatibilità con entrambe le piattaforme e il minimo rischio di blocchi anche durante un utilizzo prolungato.

```