Ozon ist einer der am besten geschützten Marktplätze im russischen Internet: Anti-Bot-Systeme, Captchas, Anfragenlimits und IP-Blockierungen machen das automatische Sammeln von Daten zu einer echten Herausforderung. Wenn Sie die Preise der Wettbewerber überwachen, das Sortiment analysieren oder Bewertungen für die Analyse sammeln – ohne gut konfigurierte Proxys wird Ihr Parser bereits nach wenigen Minuten blockiert. In diesem Leitfaden werden wir besprechen, welche Proxys für Ozon geeignet sind, wie man sie richtig konfiguriert und welche Fehler Projekte zum Datensammeln ruinieren.
Warum Ozon das Parsen blockiert: Wie der Schutz funktioniert
Bevor Sie Proxys einrichten, ist es wichtig zu verstehen, womit Sie es zu tun haben. Ozon verwendet ein mehrschichtiges Schutzsystem gegen automatische Anfragen, und jedes Element muss bei der Erstellung des Parsers berücksichtigt werden.
Rate Limiting – Anfragerate begrenzen
Wenn von einer IP-Adresse mehr als 30–50 Anfragen pro Minute kommen, beginnt Ozon, den Fehler 429 (Too Many Requests) zurückzugeben oder die IP vollständig zu blockieren. Für einen normalen Benutzer gibt es eine solche Anfragerate nicht – das bedeutet, es handelt sich um einen Bot. Deshalb reicht ein einzelner Proxy-Server nicht aus: Es wird ein Pool aus Dutzenden oder Hunderten von IP-Adressen mit Rotation benötigt.
Analyse von User-Agent und HTTP-Headern
Das Ozon-System überprüft die Header jeder Anfrage. Wenn der User-Agent wie ein Skript aussieht (zum Beispiel python-requests/2.28), wird die Anfrage sofort blockiert. Es ist notwendig, die Header eines echten Browsers zu imitieren: den richtigen User-Agent, Accept-Language, Accept-Encoding, Referer.
Fingerprinting des Browsers
Auf den Ozon-Seiten läuft JavaScript, das einen Fingerabdruck des Browsers sammelt: Bildschirmauflösung, installierte Schriftarten, WebGL, Canvas. Wenn Sie über einen Headless-Browser (Puppeteer, Playwright) ohne Maskierung parsen – wird das System dies erkennen. Daher ist es wichtig, entweder Tools im Stealth-Modus zu verwenden oder über die API ohne JS-Rendering zu parsen.
Geoblocking und Überprüfung des IP-Rufs
Ozon ist ein russischer Marktplatz, und es erwartet Anfragen von russischen IPs. Wenn Sie sich über einen Datacenter-Proxy aus Deutschland oder den USA verbinden, weckt das sofort Verdacht. Darüber hinaus sind IP-Adressen von Datencentern häufig in Anti-Bot-Datenbanken (Cloudflare, DataDome) aufgeführt – deshalb werden für Ozon russische Residential- oder mobile IPs benötigt.
Zusammenfassung: Was Ozon blockiert
- IP von Datencentern und VPN-Servern (auf schwarzen Listen)
- Zu hohe Anfragerate von einer IP
- Unrealistische HTTP-Header (Skript-User-Agent)
- Ausländische IP-Adressen für einen russischen Marktplatz
- Fehlende Cookies und Sitzungsdaten
Welche Proxys für Ozon geeignet sind: Vergleich der Typen
Nicht alle Proxys sind gleich gut geeignet für den Schutz von Ozon. Lassen Sie uns drei Haupttypen und deren Anwendbarkeit für Aufgaben auf diesem Marktplatz untersuchen.
| Proxy-Typ | Wie es für Ozon aussieht | Geschwindigkeit | Blockierungsrisiko | Geeignet für Ozon? |
|---|---|---|---|---|
| Datacenter | Hosting-/Cloud-IP | Sehr hoch | Hoch | ⚠️ Nur für leichte Aufgaben |
| Residential | IP von Wohnnutzern | Mittel | Niedrig | ✅ Ausgezeichnet |
| Mobile | IP von Mobilfunkanbietern | Mittel | Minimal | ✅ Ideal |
Residential Proxys – das Arbeitstier für Ozon
Residential Proxys verwenden IP-Adressen von echten Wohnnutzern. Für Ozon sieht eine solche Anfrage aus wie ein normaler Mensch, der über das Heimnetzwerk auf die Website zugreift. Das Anti-Bot-System erkennt keine Anzeichen von Automatisierung auf IP-Ebene. Das macht Residential Proxys zur Hauptwahl für großflächiges Parsen: Preisüberwachung über Tausende von SKUs, Sammlung von Produktkarten, Analyse des Wettbewerbersortiments.
Der Schlüsselvorteil ist der große Pool von IP-Adressen mit der Möglichkeit, eine russische Geolokalisierung auszuwählen. Ozon erwartet Anfragen von russischen Adressen, und Residential Proxys mit Geotargeting auf Russland bieten ein minimales Maß an Verdacht.
Mobile Proxys – maximale Zuverlässigkeit
Mobile Proxys arbeiten über IP von Mobilfunkanbietern (MTS, Beeline, MegaFon, Tele2). Dies ist der "sauberste" Typ von Verkehr aus Sicht von Anti-Bot-Systemen: Mobile IPs landen fast nie auf schwarzen Listen, und eine IP kann gleichzeitig von Tausenden von echten Nutzern verwendet werden. Wenn eine Residential IP blockiert wird – ist das verdächtig. Wenn eine mobile IP blockiert wird – riskiert Ozon, Tausende von echten Käufern abzuschneiden, was für sie nachteilig ist.
Mobile Proxys sind besonders gut für Aufgaben geeignet, bei denen hohe Zuverlässigkeit erforderlich ist: Sammlung von Bewertungen, Überwachung von Aktionen und Verkäufen in Echtzeit.
Datacenter Proxys – nur für einfache Aufgaben
Datacenter Proxys arbeiten schnell und sind günstiger, aber ihre Verwendung für Ozon ist eingeschränkt. Die meisten dieser IPs sind bereits in Anti-Bot-Datenbanken aufgeführt. Sie können für einmalige Aufgaben mit niedriger Anfragerate geeignet sein – zum Beispiel um die Verfügbarkeit eines bestimmten Produkts einmal pro Stunde zu überprüfen. Für regelmäßige großflächige Überwachung sind sie nicht geeignet.
Anwendungsszenarien: Preise, Produkte, Bewertungen
Die Aufgaben zum Datensammeln von Ozon sind unterschiedlich, und für jede ist eine eigene Strategie erforderlich. Lassen Sie uns drei Hauptszenarien untersuchen.
📊 Überwachung der Preise der Wettbewerber
Dies ist das beliebteste Szenario unter Verkäufern. Aufgabe: die Preise für Hunderte oder Tausende von Positionen der Wettbewerber zu überwachen, um die eigene Preisgestaltung schnell anzupassen. Ozon ändert die Preise oft mehrmals am Tag – insbesondere während Aktionen.
Anforderungen an Proxys: Ein Pool von 50–200 Residential IPs mit russischer Geolokalisierung ist erforderlich. Die Anfragen sollten mit einer Verzögerung von 2–5 Sekunden zwischen jeder Anfrage erfolgen, und die IP sollte nach jeweils 5–10 Anfragen gewechselt werden. Bei diesem Modus kann der Parser 500–1000 Produktkarten pro Stunde ohne Blockierungen verarbeiten.
Was zu sammeln ist: aktueller Preis, Preis vor Rabatt, Verfügbarkeit auf Lager, Verkäuferbewertung, Anzahl der Bewertungen, Status der Teilnahme an der Ozon-Aktion.
🛍️ Datensammlung zu Produkten und Sortiment
Analysten und Marketer sammeln Daten über das Sortiment: Welche Kategorien wachsen, welche Produkte kommen in die Top-Suche, wie sich die Anzahl der Verkäufer in der Nische ändert. Dies sind umfangreichere Aufgaben – es müssen Tausende von Katalogseiten durchlaufen werden.
Anforderungen an Proxys: Ein Pool von 200 IPs mit Rotation. Es ist wichtig, Sticky-Sessions zu verwenden (wenn eine IP für eine Sitzung für mehrere Minuten "fixiert" ist), um die Paginierung korrekt zu durchlaufen – andernfalls erhalten Sie bei einem IP-Wechsel auf der nächsten Katalogseite möglicherweise eine andere Ausgabe.
Was zu sammeln ist: Produktname, Artikelnummer (SKU), Kategorie, Marke, Beschreibung, Eigenschaften, Fotos, Anzahl der Verkäufer, Position in der Suche.
⭐ Parsen von Bewertungen und Ratings
Bewertungen sind eine wertvolle Datenquelle zur Analyse von Verbraucherpräferenzen, zur Identifizierung von Schwächen der Wettbewerber und zur Verbesserung der eigenen Produkte. Die Bewertungsseiten auf Ozon sind besonders gut geschützt: Für deren Laden wird JavaScript benötigt, und die Daten werden häufig über AJAX-Anfragen geladen.
Anforderungen an Proxys: Für das Parsen von Bewertungen sind mobile Proxys mit russischen IPs am besten geeignet. Da jede Bewertungsseite mehrere Anfragen erfordert (Hauptseite + AJAX zum Laden des Inhalts), gewährleisten mobile IPs die Stabilität der Sitzung.
Was zu sammeln ist: Bewertungstext, Bewertung (1–5 Sterne), Veröffentlichungsdatum, Nützlichkeit der Bewertung (Likes), Antwort des Verkäufers, Fotos in den Bewertungen, verifiziertem Kauf.
IP-Rotation und Sitzungsmanagement: Wie man nicht blockiert wird
Selbst mit guten Proxys kann es zu Blockierungen kommen, wenn Sitzungen und Rotation nicht richtig verwaltet werden. Dies ist einer der Schlüsseltechnischen Aspekte des Parsens von Ozon.
Zwei Rotationsmodi: rotating vs sticky
Rotating (zufällige Rotation) – jede Anfrage erfolgt von einer neuen IP. Dies ist gut für unabhängige Anfragen: Zum Beispiel, wenn Sie den Preis eines einzelnen Produkts überprüfen. Ozon sieht keinen Zusammenhang zwischen den Anfragen.
Sticky Sessions (fixierte Sitzungen) – eine IP wird für mehrere aufeinanderfolgende Anfragen innerhalb einer "Sitzung" (normalerweise 1–30 Minuten) verwendet. Dies ist notwendig, wenn Sie die Paginierung des Katalogs durchlaufen, mehrere Seiten von Bewertungen eines Produkts sammeln oder mit dem Warenkorb/der Autorisierung arbeiten. Ein plötzlicher IP-Wechsel mitten in einer Sitzung sieht verdächtig aus.
Regeln für Verzögerungen zwischen Anfragen
| Aufgabentyp | Verzögerung zwischen Anfragen | IP-Wechsel |
|---|---|---|
| Preisüberwachung (1000+ SKU) | 2–4 Sekunden | Alle 5–10 Anfragen |
| Katalogdurchlauf (Paginierung) | 3–6 Sekunden | Alle 20–30 Seiten |
| Sammlung von Bewertungen | 4–8 Sekunden | Jedes Produkt – neue IP |
| Einmalige Verfügbarkeitsprüfung | 1–2 Sekunden | Jede Anfrage |
Verwaltung von Cookies und Sitzungsdaten
Ozon verfolgt Cookies: Wenn jede Anfrage ohne Cookies oder mit neuen Cookies kommt, ist das ein Zeichen für einen Bot. Es wird empfohlen, bei der ersten Anfrage von einer neuen IP die Sitzung "aufzuheizen" – zuerst die Hauptseite zu laden, dann in die Kategorie zu wechseln und erst dann die benötigten Daten anzufordern. Dies imitiert das Verhalten eines echten Nutzers und reduziert das Risiko einer Blockierung um das 3–5-fache.
Proxy-Einrichtung für das Parsen von Ozon: Schritt-für-Schritt-Anleitung
Lassen Sie uns die praktische Einrichtung am Beispiel beliebter Tools durchgehen. Wir beginnen mit einer grundlegenden Konfiguration, die für die meisten Szenarien geeignet ist.
Schritt 1. Erhalten Sie die Proxy-Daten
Nach der Verbindung mit Residential- oder Mobile-Proxys erhalten Sie die Verbindungsdaten im Format:
host: proxy.example.com port: 8080 username: your_username password: your_password protocol: HTTP / HTTPS / SOCKS5
Für Ozon wird empfohlen, das Protokoll HTTPS oder SOCKS5 zu verwenden. SOCKS5 ist vorzuziehen, wenn Ihr Tool es unterstützt – es überträgt weniger identifizierende Header.
Schritt 2. Richten Sie Geotargeting auf Russland ein
Wählen Sie im Proxy-Service die Region: Russland (RU). Für einige Aufgaben ist eine bestimmte Stadt wichtig – zum Beispiel, wenn Sie Preise unter Berücksichtigung der Lieferung nach Moskau oder St. Petersburg sehen möchten. In diesem Fall wählen Sie Geotargeting auf Stadtebene.
Wenn der Service einen Endpunkt mit einem Geolokalisierungsparameter in der URL bereitstellt, sieht das etwa so aus:
proxy.example.com:8080?country=ru&city=moscow&session=random
Schritt 3. Richten Sie die richtigen HTTP-Header ein
Dies ist ein kritischer Schritt. Die Anfrage an Ozon sollte wie eine Anfrage von einem echten Chrome-Browser unter Windows aussehen. Das minimale Set an Headern:
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36
(KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: ru-RU,ru;q=0.9,en-US;q=0.8,en;q=0.7
Accept-Encoding: gzip, deflate, br
Connection: keep-alive
Upgrade-Insecure-Requests: 1
Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: none
Schritt 4. Richten Sie Rotation und Verzögerungen ein
In den meisten fertigen Parsern und No-Code-Tools gibt es Einstellungen für Verzögerung und Rotation. Stellen Sie ein:
- Verzögerung zwischen Anfragen: 3–5 Sekunden (Sie können Zufälligkeit hinzufügen: von 2 bis 7 Sekunden)
- IP-Rotation: alle 5–10 Anfragen für die Preisüberwachung, jede Anfrage für einmalige Prüfungen
- Timeout der Anfrage: 15–30 Sekunden (Ozon antwortet manchmal langsam)
- Wiederholungsversuche bei Fehlern: 3 Versuche mit neuer IP bei Erhalt von 403/429/503
Schritt 5. Überprüfen Sie die Funktion vor dem Start
Führen Sie vor dem Start des vollständigen Parsens einen Test durch: Machen Sie 20–30 Anfragen an verschiedene Ozon-Seiten mit einem Intervall von 5 Sekunden. Wenn alle Anfragen den Status 200 und korrektes HTML zurückgeben – wurde die Einrichtung richtig durchgeführt. Wenn Sie 403 oder eine Weiterleitung zur Captcha sehen – müssen Sie die Header anpassen oder den Proxytyp ändern.
Tools zum Parsen von Ozon ohne Code
Die meisten Verkäufer und Analysten schreiben keine Parser von Grund auf neu. Es gibt fertige Tools, die die Verbindung von Proxys unterstützen und keine Programmierkenntnisse erfordern.
Octoparse – visueller Parser mit Proxy-Unterstützung
Octoparse ist eines der beliebten No-Code-Tools zum Parsen. Sie geben visuell die Elemente auf der Seite an, die gesammelt werden sollen, und das Tool generiert automatisch den Parser. Es unterstützt die Verbindung von Proxys über die Aufgabeneinstellungen: Geben Sie Adresse, Port, Login und Passwort ein – und das Tool wird automatisch die IP rotieren.
So verbinden Sie Proxys in Octoparse: Öffnen Sie die Aufgabe → Einstellungen → Proxy-Einstellungen → Proxy hinzufügen → Geben Sie die Verbindungsdaten ein → Wählen Sie den Rotationsmodus. Für Ozon wird der Modus "IP für jede N-Anfrage rotieren" mit einem Wert von 5–10 empfohlen.
ParseHub – Cloud-Parser für komplexe Websites
ParseHub kommt gut mit Seiten zurecht, auf denen Daten über JavaScript geladen werden (was für Ozon relevant ist). Es unterstützt die Arbeit über Proxys in kostenpflichtigen Tarifen. Das Tool hat einen integrierten Browser, der JS rendert – das hilft, Daten zu sammeln, die über normale HTTP-Anfragen nicht verfügbar sind.
Spezialisierte Preisüberwachungsdienste
Für die Aufgabe der Preisüberwachung auf Ozon gibt es spezialisierte SaaS-Lösungen: Priceva, Metacommerce, Price2Spy. Sie enthalten bereits die integrierte Logik zur Umgehung des Ozon-Schutzes und arbeiten auf Abonnementbasis. Wenn Ihre Aufgabe nur die Preisüberwachung ohne benutzerdefinierte Daten ist, können solche Dienste bequemer sein als die eigenständige Einrichtung eines Parsers mit Proxys.
n8n / Make (Integromat) – Automatisierung mit HTTP-Anfragen
Für einfache Aufgaben – zum Beispiel, um den Preis eines bestimmten Produkts einmal pro Stunde zu überprüfen – können Sie Automatisierungsplattformen wie n8n oder Make verwenden. Sie senden HTTP-Anfragen an Ozon und parsen die Antwort nach einem festgelegten Muster. Proxys werden in den Einstellungen des HTTP-Knotens verbunden: Geben Sie die Proxy-Adresse im Feld Proxy-URL an. Dies ist nicht der leistungsfähigste, aber der einfachste Weg zur Automatisierung ohne Code.
💡 Tipp: Verwenden Sie die Ozon API, wo immer möglich
Ozon bietet eine offizielle Seller API für Verkäufer an. Wenn Sie ein registrierter Verkäufer sind, können Sie einen Teil der Daten (Bestellungen, Bestände, Verkaufsanalysen) über die API ohne Proxys und Risiko von Blockierungen abrufen. Das Parsen über Proxys ist für Daten erforderlich, die die API nicht bereitstellt: Preise der Wettbewerber, deren Bewertungen, Positionen in der Suche.
Top-7 Fehler beim Parsen von Ozon und wie man sie vermeiden kann
Die meisten Probleme mit Blockierungen entstehen durch die gleichen Fehler. Hier ist eine Liste von Dingen, die Sie auf keinen Fall tun sollten – und wie Sie es beheben können.
❌ Fehler 1: Verwenden Sie eine IP für alle Anfragen
Selbst die "sauberste" IP wird blockiert, wenn von ihr 500 Anfragen pro Stunde kommen. Lösung: Ein Pool von mindestens 50 IPs mit Rotation.
❌ Fehler 2: Parsen ohne Verzögerungen
Anfragen ohne Verzögerungen sind das offensichtlichste Zeichen eines Bots. Selbst 1 Sekunde zwischen Anfragen reduziert das Risiko einer Blockierung erheblich. Optimal: 3–5 Sekunden mit zufälliger Streuung.
❌ Fehler 3: Verwenden Sie den Standard-User-Agent der Bibliothek
python-requests/2.28.0 – das führt sofort zur Blockierung. Ersetzen Sie immer den User-Agent durch den aktuellen Chrome.
❌ Fehler 4: Verwenden Sie ausländische IPs für Ozon
Ozon ist ein russischer Dienst. Anfragen von deutschen oder amerikanischen IPs wecken Verdacht. Wählen Sie immer Geotargeting auf Russland.
❌ Fehler 5: Ignorieren Sie Fehler 429 und senden Sie weiterhin Anfragen
Wenn Sie 429 erhalten – stoppen Sie sofort die Anfragen von dieser IP, warten Sie 5–10 Minuten und wechseln Sie die IP. Das Fortsetzen von Anfragen bei 429 beschleunigt die dauerhafte Blockierung der IP.
❌ Fehler 6: Ignorieren Sie Weiterleitungen zur Captcha
Ozon leitet manchmal auf eine Seite mit Captcha um, anstatt zu blockieren. Der Parser sollte überprüfen, ob das erhaltene HTML die benötigten Daten enthält und nicht die Captcha-Seite – und im Falle von Captcha die IP wechseln.
❌ Fehler 7: Parsen zu Stoßzeiten
Zu Stoßzeiten (Abend, Wochenende) filtert Ozon den Verkehr aggressiver. Planen Sie umfangreiche Aufgaben in die Nachtstunden oder in die frühen Morgenstunden – die Serverlast ist geringer und die Anti-Bot-Systeme sind weniger streng.
Fazit: Wie man eine stabile Datensammlung von Ozon aufbaut
Das Parsen von Ozon ist keine einmalige Einrichtung, sondern eine ständige Arbeit mit der Infrastruktur. Der Marktplatz aktualisiert regelmäßig den Schutz, ändert die Seitenstruktur und verschärft die Anti-Bot-Filter. Erfolgreiche Überwachung basiert auf drei Säulen: dem richtigen Proxy-Typ, einer durchdachten IP-Rotation und einer korrekten Imitation des Verhaltens eines echten Nutzers.
Um alles zusammenzufassen, was wir besprochen haben:
- Für die Preis- und Sortimentüberwachung – verwenden Sie Residential Proxys mit russischer Geolokalisierung und einem Pool von mindestens 50 IPs
- Für die Sammlung von Bewertungen und Aufgaben mit hohen Anforderungen an die Zuverlässigkeit – Mobile Proxys von russischen Anbietern
- Stellen Sie immer Verzögerungen, Rotation und die richtigen HTTP-Header ein
- Verwenden Sie Sticky-Sessions beim Durchlaufen der Paginierung
- Planen Sie umfangreiche Aufgaben in die Nachtstunden
Wenn Sie gerade erst anfangen, ein Ozon-Überwachungssystem aufzubauen, empfehlen wir, mit Residential Proxys mit russischen IPs zu beginnen – sie bieten ein Gleichgewicht zwischen Kosten, Geschwindigkeit und Zuverlässigkeit für die meisten Datensammelaufgaben auf Marktplätzen. Für kritische Aufgaben, bei denen jede Anfrage ohne Ausfälle durchgehen muss, sollten Sie sich die Mobile Proxys ansehen – sie sind teurer, werden aber selbst bei intensiver Nutzung praktisch nicht blockiert.