Back to Blog

ओज़ोन पर प्रतिस्पर्धियों की कीमतों को बिना ब्लॉक किए ट्रैक करने का तरीका: 15 मिनट में सेटअप

जानें कि Ozon पर प्रतिस्पर्धियों की कीमतों की स्वचालित निगरानी कैसे सेट करें बिना IP ब्लॉक होने के जोखिम के। उपकरणों, प्रॉक्सी के प्रकारों और विक्रेताओं के लिए तैयार समाधानों की तुलना।

📅January 22, 2026
```html

यदि आप Ozon पर बेचते हैं, तो आप जानते हैं: कीमतें दिन में 10-20 बार बदलती हैं। प्रतिस्पर्धी कीमतें गिराते हैं, मार्केटप्लेस के एल्गोरिदम रेटिंग्स को फिर से गणना करते हैं, और आप अपनी कीमत को समय पर समायोजित नहीं कर पाने के कारण बिक्री खो देते हैं। मैनुअल निगरानी में घंटों लगते हैं, जबकि स्वचालित पार्सर्स 50-100 अनुरोधों के बाद IP ब्लॉक कर देते हैं। इस लेख में, हम देखेंगे कि प्रॉक्सी के माध्यम से Ozon पर कीमतों की स्थिर निगरानी कैसे सेट करें, कौन से उपकरणों का उपयोग करें और उन सामान्य गलतियों से कैसे बचें जो बैन का कारण बनती हैं।

Ozon कीमतों की निगरानी को क्यों ब्लॉक करता है

Ozon, अन्य बड़े मार्केटप्लेस (Wildberries, Yandex.Market) की तरह, स्वचालित डेटा संग्रह से सक्रिय रूप से सुरक्षा करता है। कारण सरल है: पार्सिंग सर्वरों पर अतिरिक्त लोड पैदा करता है, और कीमतों का सामूहिक संग्रह न केवल विक्रेताओं द्वारा किया जाता है, बल्कि मार्केटप्लेस के प्रतिस्पर्धियों द्वारा भी किया जाता है ताकि वे उत्पादों की रेंज का विश्लेषण कर सकें।

जब आप सुरक्षा के बिना कीमतों की निगरानी करने की कोशिश करते हैं, तो क्या होता है:

  • IP पते द्वारा ब्लॉकिंग — एक IP से 50-150 अनुरोधों के बाद Ozon कैप्चा देने या 1-24 घंटे के लिए पहुंच को पूरी तरह से ब्लॉक करना शुरू कर देता है। ऐसा इसलिए होता है क्योंकि एक सामान्य उपयोगकर्ता एक मिनट में 100 उत्पादों के कार्ड नहीं देख सकता है।
  • User-Agent द्वारा पहचान — यदि आप पार्सर का मानक User-Agent (जैसे, Python-requests/2.28) का उपयोग करते हैं, तो सिस्टम तुरंत स्वचालित अनुरोध को पहचान लेता है और उसे ब्लॉक कर देता है।
  • व्यवहार का विश्लेषण — Ozon अनुरोधों की गति, क्रियाओं की अनुपस्थिति (स्क्रॉल, क्लिक), अनुरोधों के बीच समान अंतराल पर नज़र रखता है। यदि आपका स्क्रिप्ट हर 5 सेकंड में अनुरोध करता है — तो यह बॉट का स्पष्ट संकेत है।
  • ब्राउज़र का फ़िंगरप्रिंट — हेडलेस ब्राउज़र्स (Selenium, Puppeteer) का उपयोग करते समय Ozon WebGL, कैनवास, या वास्तविक ब्राउज़र के अन्य संकेतों की अनुपस्थिति का पता लगा सकता है।

हमारे विक्रेताओं के साथ काम करने के अनुभव के अनुसार, बिना प्रॉक्सी के 20+ उत्पादों की निगरानी करना असंभव है। यदि आपको दिन में कई बार 100-500 पदों की कीमतों की जांच करनी है, तो प्रॉक्सी एक अनिवार्य उपकरण बन जाती हैं।

महत्वपूर्ण: Ozon कीमतों की निगरानी को प्रतिबंधित नहीं करता है — मार्केटप्लेस सर्वरों पर लोड से लड़ता है। यदि आप अनुरोधों के लिए उचित सीमाएँ (एक IP से प्रति सेकंड 1-2 अनुरोध से अधिक नहीं) का पालन करते हैं और प्रॉक्सी की रोटेशन का उपयोग करते हैं, तो ब्लॉकिंग को पूरी तरह से टाला जा सकता है।

Ozon पार्सिंग के लिए कौन से प्रॉक्सी उपयुक्त हैं

प्रॉक्सी के प्रकार का चयन निगरानी की स्थिरता और समाधान की लागत पर सीधे प्रभाव डालता है। आइए तीन मुख्य विकल्पों और Ozon के साथ काम करने की उनकी उपयुक्तता को देखें।

रिज़िडेंट प्रॉक्सी — Ozon के लिए सबसे अच्छा विकल्प

रिज़िडेंट प्रॉक्सी वास्तविक घरेलू उपयोगकर्ताओं के IP पतों का उपयोग करते हैं, जिन्होंने अपने उपकरणों को प्रॉक्सी प्रदाता के नेटवर्क में उपलब्ध कराया है। Ozon के लिए, ऐसे अनुरोध सामान्य वेबसाइट आगंतुकों के रूप में दिखाई देते हैं, जिससे ब्लॉकिंग की संभावना लगभग समाप्त हो जाती है।

Ozon की निगरानी के लिए लाभ:

  • उच्च ट्रस्ट स्कोर — IP वास्तविक प्रदाताओं (रॉस्टेलकम, MTS, बीलाइन) के हैं, न कि डेटा केंद्रों के
  • बैन का न्यूनतम जोखिम — यहां तक कि तीव्र पार्सिंग (रोटेशन के साथ प्रति घंटे 1000 अनुरोधों तक) के दौरान
  • भौगोलिक वितरण — आप रूस के विभिन्न क्षेत्रों (मॉस्को, सेंट पीटर्सबर्ग, एकातेरिनबर्ग) से कीमतों की निगरानी कर सकते हैं, क्योंकि Ozon डिलीवरी क्षेत्र के आधार पर विभिन्न कीमतें दिखाता है
  • सत्र का लंबा जीवन — आप बिना रोटेशन के 30 मिनट तक एक IP का उपयोग कर सकते हैं

नुकसान: डेटा केंद्र प्रॉक्सी की तुलना में उच्च लागत (आमतौर पर 1 जीबी ट्रैफ़िक के लिए 3-5 डॉलर)। हालाँकि, कीमतों की निगरानी के लिए ट्रैफ़िक न्यूनतम है — 1000 उत्पादों की जांच आमतौर पर 50-100 एमबी लेती है।

मोबाइल प्रॉक्सी — अधिकतम विश्वसनीयता

मोबाइल प्रॉक्सी मोबाइल ऑपरेटरों (MTS, बीलाइन, मेगाफोन, Tele2) के IP का उपयोग करते हैं। यह किसी भी मार्केटप्लेस के लिए सबसे विश्वसनीय प्रकार का IP है, क्योंकि Ozon के अधिकांश खरीदार मोबाइल उपकरणों से ही आते हैं।

जब मोबाइल प्रॉक्सी का चयन करना चाहिए:

  • आपने रिज़िडेंट प्रॉक्सी का उपयोग करते समय पहले ही ब्लॉक प्राप्त कर लिए हैं
  • विशेष रूप से सुरक्षित डेटा (जैसे, बंद श्रेणियों में कीमतें) को पार्स करना आवश्यक है
  • आप केवल कीमतों की निगरानी नहीं कर रहे हैं, बल्कि समीक्षाएँ, रेटिंग्स, उत्पादों के स्टॉक भी देख रहे हैं
  • आप बड़े वॉल्यूम (5000+ उत्पादों प्रति दिन) के साथ काम कर रहे हैं

मोबाइल प्रॉक्सी की विशेषता यह है कि IP स्वचालित रूप से ऑपरेटर के नेटवर्क से फिर से कनेक्ट करते समय बदलता है (आमतौर पर हर 5-15 मिनट)। यह अतिरिक्त सेटिंग्स के बिना स्वाभाविक रोटेशन प्रदान करता है।

डेटा सेंटर प्रॉक्सी — सीमाओं के साथ बजट विकल्प

डेटा सेंटर प्रॉक्सी — डेटा केंद्रों में सर्वरों के IP पते हैं। ये काफी सस्ते होते हैं (1 जीबी के लिए 0.5 डॉलर से), लेकिन Ozon आसानी से ऐसे IP को पहचानता है और अक्सर उन्हें ब्लॉक कर देता है।

Ozon के लिए डेटा सेंटर प्रॉक्सी का उपयोग कब किया जा सकता है:

  • आप छोटे संख्या में उत्पादों की निगरानी कर रहे हैं (50 पदों तक)
  • आप कीमतों की जांच कम बार करते हैं (दिन में 1-2 बार)
  • आप बड़े IP पूल का उपयोग करते हैं (कम से कम 50-100 पते) रोटेशन के साथ
  • आप रिज़िडेंट प्रॉक्सी खरीदने से पहले पार्सर का परीक्षण कर रहे हैं

हमारे अनुभव के अनुसार, डेटा सेंटर प्रॉक्सी केवल सरल कार्यों के लिए उपयुक्त हैं। यदि आप Ozon पर कीमतों की निगरानी में गंभीर हैं, तो बेहतर है कि आप तुरंत रिज़िडेंट प्रॉक्सी का उपयोग करें — इससे ब्लॉकिंग से लड़ने में समय की बचत होगी।

प्रॉक्सी का प्रकार Ozon के लिए ट्रस्ट स्कोर लागत सिफारिश
रिज़िडेंट उच्च (9/10) 3-5$ प्रति जीबी नियमित निगरानी के लिए आदर्श
मोबाइल अधिकतम (10/10) 8-15$ प्रति IP/महीना बड़े वॉल्यूम और सुरक्षित डेटा के लिए
डेटा सेंटर निम्न (4/10) 0.5-1$ प्रति जीबी केवल परीक्षण या छोटे वॉल्यूम के लिए

कीमतों की निगरानी के लिए उपकरणों की तुलना

Ozon पर कीमतों की निगरानी के लिए तीन मुख्य दृष्टिकोण हैं: तैयार SaaS सेवाएँ, डेस्कटॉप पार्सिंग प्रोग्राम और अपने स्वयं के स्क्रिप्ट। प्रत्येक विकल्प को उपयोगिता, लागत और प्रॉक्सी के उपयोग की आवश्यकता के दृष्टिकोण से देखें।

तैयार SaaS निगरानी सेवाएँ

ये क्लाउड प्लेटफॉर्म हैं, जो पहले से ही अंतर्निहित पार्सर्स और प्रॉक्सी शामिल करते हैं। आप बस उन उत्पादों के आर्टिकल्स को निर्दिष्ट करते हैं, जिन्हें ट्रैक करना है, और आपको कीमतों की गतिशीलता के साथ तैयार रिपोर्ट मिलती हैं।

Ozon के लिए लोकप्रिय सेवाएँ:

  • Moneyplace — मार्केटप्लेस विक्रेताओं के लिए विशेष सेवा। Ozon, Wildberries, Yandex.Market का समर्थन करता है। 100 उत्पादों की निगरानी के लिए प्रति माह 1500 रूबल से शुरू होता है।
  • Mpstats — प्रतिस्पर्धियों का विश्लेषण और निगरानी। केवल कीमतें नहीं, बल्कि बिक्री, स्टॉक, खोज में स्थिति भी दिखाता है। प्रति माह 2000 रूबल से।
  • SellerFox — Ozon पर बिक्री प्रबंधन के लिए एक समग्र उपकरण। इसमें कीमतों की निगरानी, स्वचालित मूल्य निर्धारण, विश्लेषण शामिल है। प्रति माह 3000 रूबल से।
  • Marketguru — बुनियादी कार्यक्षमता के साथ बजट विकल्प। 50 उत्पादों के लिए प्रति माह 900 रूबल से।

लाभ: प्रॉक्सी और पार्सिंग के साथ समझने की आवश्यकता नहीं है, सब कुछ "बॉक्स से बाहर" काम करता है, तैयार रिपोर्ट और कीमतों में बदलाव के लिए सूचनाएँ हैं।

नुकसान: मासिक भुगतान, उत्पादों की संख्या पर सीमाएँ, सेटिंग्स में लचीलापन नहीं (उदाहरण के लिए, विशेषताओं या समीक्षाओं जैसे अतिरिक्त डेटा को पार्स नहीं किया जा सकता)।

डेस्कटॉप पार्सर्स (Datacol, Octoparse, ParseHub)

ये प्रोग्राम हैं, जो आपके कंप्यूटर पर स्थापित होते हैं और बिना प्रोग्रामिंग के किसी भी साइट से डेटा पार्सिंग सेट करने की अनुमति देते हैं। आप दृश्य रूप से निर्दिष्ट करते हैं कि कौन से तत्वों को एकत्र करना है (कीमत, नाम, रेटिंग), और प्रोग्राम स्वचालित रूप से उन्हें निकालता है।

Ozon के लिए "पार्सर + प्रॉक्सी" का संयोजन कैसे काम करता है:

  1. आप प्रोग्राम में पार्सिंग कार्य बनाते हैं (उदाहरण के लिए, उत्पादों की URL सूची के लिए कीमतें एकत्र करना)
  2. सेटिंग्स में प्रॉक्सी सर्वर निर्दिष्ट करें (IP:PORT:LOGIN:PASSWORD)
  3. प्रोग्राम स्वचालित रूप से प्रॉक्सी के माध्यम से निर्धारित देरी के साथ अनुरोध करता है
  4. परिणाम Excel, CSV या Google Sheets में निर्यात होते हैं

Ozon के साथ काम करने के लिए लोकप्रिय पार्सर्स:

  • Datacol — सरल इंटरफेस वाला रूसी पार्सर। प्रॉक्सी, User-Agent की रोटेशन, कैप्चा के साथ काम का समर्थन करता है। लाइसेंस के लिए 4000 रूबल से।
  • Octoparse — अंतरराष्ट्रीय सेवा के साथ क्लाउड पार्सिंग। मुफ्त योजना है (10 कार्यों तक)। भुगतान वाले 75$ प्रति माह से।
  • ParseHub — सीखने में आसान पार्सर। मुफ्त में एक बार में 200 पृष्ठों तक पार्स कर सकते हैं। भुगतान वाले 149$ प्रति माह से।

लाभ: सेटिंग्स में लचीलापन, किसी भी डेटा को पार्स करना संभव है, एक बार का भुगतान (कुछ प्रोग्रामों के लिए), आपके कंप्यूटर पर स्थानीय रूप से काम करता है।

नुकसान: आपको प्रॉक्सी खरीदने और सेट करने की आवश्यकता है, प्रोग्राम को सीखने में समय लगता है, पार्सिंग के दौरान कंप्यूटर चालू रहना चाहिए (यदि आप क्लाउड संस्करण का उपयोग नहीं कर रहे हैं)।

Python या Node.js पर अपने स्क्रिप्ट

यदि आपके पास प्रोग्रामिंग के बुनियादी कौशल हैं या आपकी टीम में कोई डेवलपर है, तो आप अपना खुद का पार्सर लिख सकते हैं। यह अधिकतम लचीलापन और बड़े वॉल्यूम में न्यूनतम लागत देता है।

Ozon के लिए पार्सिंग के लिए सामान्य स्टैक:

  • Python + requests + BeautifulSoup — सरल HTML पार्सिंग के लिए (यदि Ozon डेटा को पृष्ठ के स्रोत कोड में देता है)
  • Python + Selenium/Playwright — ब्राउज़र के माध्यम से पार्सिंग के लिए (यदि डेटा JavaScript के माध्यम से लोड होता है)
  • Node.js + Puppeteer — JavaScript में एक विकल्प, जो गतिशील साइटों के साथ अच्छी तरह से काम करता है
  • Scrapy — बड़े पैमाने पर पार्सिंग के लिए पेशेवर ढांचा (यदि 10000+ उत्पादों की निगरानी करने की आवश्यकता है)

लाभ: प्रक्रिया पर पूर्ण नियंत्रण, किसी भी प्रारूप में किसी भी डेटा को पार्स करना संभव है, सेवा के लिए कोई मासिक शुल्क नहीं है, आसानी से स्केल किया जा सकता है।

नुकसान: प्रोग्रामिंग कौशल की आवश्यकता है, आपको स्वयं त्रुटियों और ब्लॉकिंग को संभालना होगा, विकास और समर्थन में समय लगता है।

उपकरण सेटिंग्स की जटिलता क्या प्रॉक्सी की आवश्यकता है? लागत किसके लिए
SaaS सेवाएँ कम (5 मिनट) नहीं (निर्मित) 900 रूबल/महीने से नवशिक्षित, छोटे व्यवसाय
डेस्कटॉप पार्सर्स मध्यम (1-2 घंटे) हाँ (अलग से खरीदना) 4000 रूबल एक बार + प्रॉक्सी मध्यम व्यवसाय, लचीलापन आवश्यक है
अपने स्क्रिप्ट उच्च (8 घंटे से) हाँ (अलग से खरीदना) विकास का समय + प्रॉक्सी बड़ा व्यवसाय, बड़े वॉल्यूम

प्रॉक्सी के माध्यम से निगरानी सेट करने के लिए चरण-दर-चरण गाइड

चलिए लोकप्रिय पार्सर Datacol और रिज़िडेंट प्रॉक्सी के उदाहरण के साथ कीमतों की निगरानी सेट करने की व्यावहारिक प्रक्रिया पर विचार करते हैं। यह विधि अधिकांश विक्रेताओं के लिए उपयुक्त है जो बिना प्रोग्रामिंग के 50-500 उत्पादों की निगरानी करना चाहते हैं।

चरण 1: निगरानी के लिए उत्पादों की सूची तैयार करना

सबसे पहले, यह निर्धारित करें कि किन उत्पादों की निगरानी करनी है। आमतौर पर यह:

  • आपके अपने उत्पाद (ताकि यह सुनिश्चित किया जा सके कि क्या अन्य विक्रेता उसी उत्पाद की कीमतें गिरा रहे हैं)
  • प्रत्यक्ष प्रतिस्पर्धी (आपकी श्रेणी में शीर्ष 10 उत्पाद)
  • वैकल्पिक उत्पाद (विशेषताओं और कीमतों में समान)

एक Excel फ़ाइल बनाएं जिसमें निम्नलिखित कॉलम हों:

  • उत्पाद का URL — Ozon पर उत्पाद कार्ड का पूरा लिंक (उदाहरण: https://www.ozon.ru/product/naushniki-apple-airpods-pro-123456789/)
  • आर्टिकल — आपके रिकॉर्ड के लिए
  • नाम — उत्पाद का संक्षिप्त विवरण
  • श्रेणी — रिपोर्ट में समूह बनाने के लिए

यह सूची पार्सर के लिए आधार होगी। फ़ाइल को CSV प्रारूप में सहेजें ताकि पार्सर में आसानी से लोड किया जा सके।

चरण 2: प्रॉक्सी खरीदना और सेट करना

100-200 उत्पादों की निगरानी के लिए, प्रति घंटे एक बार रिज़िडेंट प्रॉक्सी के 1000 IP के पूल की आवश्यकता होती है। खरीदते समय ध्यान में रखने योग्य बातें:

  • भौगोलिक स्थान — रूस से प्रॉक्सी चुनें (यदि आप रूसी Ozon की निगरानी कर रहे हैं)। यदि आपको क्षेत्रीय कीमतें महत्वपूर्ण हैं, तो आप विशेष क्षेत्र चुन सकते हैं।
  • रोटेशन का प्रकार — Ozon के लिए अनुरोध के अनुसार रोटेशन सबसे अनुकूल है (प्रत्येक अनुरोध = नया IP) या 5-10 मिनट के अंतराल के साथ।
  • प्रोटोकॉल — HTTP/HTTPS प्रॉक्सी अधिकांश पार्सर्स के लिए उपयुक्त हैं। SOCKS5 केवल विशिष्ट कार्यों के लिए आवश्यक है।
  • एक्सेस का प्रारूप — IP:PORT:LOGIN:PASSWORD या स्वचालित रोटेशन के साथ API के माध्यम से काम करना सबसे सुविधाजनक है।

खरीदने के बाद, आपको कनेक्शन के लिए डेटा प्राप्त होगा। सामान्य प्रारूप:

प्रॉक्सी सर्वर: gate.proxycove.com:8080
लॉगिन: user12345
पासवर्ड: pass67890
या सीधा प्रारूप: gate.proxycove.com:8080:user12345:pass67890

चरण 3: Datacol पार्सर सेट करना

Datacol एक दृश्य पार्सर है, जिसे प्रोग्रामिंग की आवश्यकता नहीं है। Ozon की निगरानी के लिए इसे सेट करने का तरीका:

  1. Datacol स्थापित करें — आधिकारिक वेबसाइट से प्रोग्राम डाउनलोड करें और लाइसेंस सक्रिय करें।
  2. एक नया प्रोजेक्ट बनाएं — "प्रोजेक्ट बनाएं" पर क्लिक करें और "URL सूची" मोड चुनें (क्योंकि आपके पास पहले से उत्पादों के लिंक की सूची है)।
  3. उत्पादों की सूची अपलोड करें — अपने उत्पादों के URL के साथ CSV फ़ाइल आयात करें।
  4. प्रॉक्सी सेट करें — "सेटिंग्स" → "प्रॉक्सी" खोलें → "HTTP प्रॉक्सी" चुनें → अपने प्रॉक्सी सर्वर के डेटा (IP:PORT:LOGIN:PASSWORD) दर्ज करें। "प्रॉक्सी रोटेशन" विकल्प को सक्षम करें और 5-10 मिनट का अंतराल सेट करें।
  5. पार्सिंग के लिए तत्व निर्दिष्ट करें — Datacol के अंतर्निहित ब्राउज़र में किसी भी उत्पाद कार्ड को खोलें। कीमत पर दाएँ क्लिक करें → "स्कीमा में जोड़ें"। नाम, रेटिंग, समीक्षाओं की संख्या के लिए दोहराएँ।
  6. देरी सेट करें — प्रोजेक्ट सेटिंग्स में अनुरोधों के बीच 3-7 सेकंड (यादृच्छिक) की देरी सेट करें। यह वास्तविक उपयोगकर्ता के व्यवहार की नकल करता है।
  7. User-Agent सेट करें — लोकप्रिय ब्राउज़रों (Chrome, Firefox, Safari) की सूची से User-Agent की रोटेशन सक्षम करें।

सेटिंग्स के बाद "पार्सिंग शुरू करें" पर क्लिक करें। Datacol आपके उत्पादों की सूची को पार करना शुरू कर देगा, स्वचालित रूप से IP और User-Agent बदलते हुए। परिणाम वास्तविक समय में एक तालिका में सहेजे जाएंगे।

चरण 4: शेड्यूलिंग और डेटा निर्यात सेट करना

निगरानी को स्वचालित करने के लिए, पार्सिंग शुरू करने के लिए शेड्यूल सेट करें:

  • Datacol में "कार्य योजनाकार" खोलें
  • आवश्यक आवृत्ति के साथ "पार्सिंग शुरू करने" का कार्य बनाएं (उदाहरण के लिए, हर 6 घंटे)
  • परिणामों को Google Sheets या Excel में निर्यात करने के लिए सेट करें (स्वचालित रूप से नए पंक्तियों को समय चिह्न के साथ जोड़ें)
  • कीमतों में 10% से अधिक परिवर्तन पर ईमेल पर सूचनाएँ सक्षम करें

अब आपके पास एक पूरी तरह से स्वचालित कीमतों की निगरानी प्रणाली है, जो आपके बिना 24/7 काम करती है।

सलाह: Google Sheets में एक डैशबोर्ड बनाएं जिसमें सूत्र हों, जो स्वचालित रूप से उन उत्पादों को हाइलाइट करते हैं, जहाँ प्रतिस्पर्धियों ने कीमतें कम की हैं। यह बाजार में परिवर्तनों पर तेजी से प्रतिक्रिया करने में मदद करेगा।

IP रोटेशन और अनुरोधों के बीच देरी सेट करना

प्रॉक्सी और देरी की सही सेटिंग्स — बिना ब्लॉकिंग के स्थिर पार्सिंग की कुंजी है। उच्च गुणवत्ता वाली रिज़िडेंट प्रॉक्सी के साथ भी, यदि अनुरोधों की आवृत्ति को सही तरीके से सेट नहीं किया गया है, तो बैन मिल सकता है।

Ozon के लिए IP रोटेशन की अनुकूलतम आवृत्ति

Ozon केवल एक IP से अनुरोधों की संख्या का विश्लेषण नहीं करता है, बल्कि व्यवहार के पैटर्न का भी विश्लेषण करता है। यहाँ अनुशंसित सेटिंग्स हैं:

पार्सिंग का वॉल्यूम IP रोटेशन अनुरोधों के बीच देरी 1 IP से अधिकतम अनुरोध
50 उत्पादों तक हर 10-15 मिनट 5-10 सेकंड (यादृच्छिक) 50 तक
50-200 उत्पादों हर 5-10 मिनट 3-7 सेकंड (यादृच्छिक) 30 तक
200-1000 उत्पादों प्रत्येक अनुरोध (या 2-3 अनुरोधों के बाद) 2-5 सेकंड (यादृच्छिक) 10-15 तक
1000+ उत्पाद प्रत्येक अनुरोध 1-3 सेकंड (यादृच्छिक) 5-10 तक

मुख्य बिंदु: देरी को यादृच्छिक होना चाहिए! यदि आपका पार्सर हर 5 सेकंड में अनुरोध करता है, तो यह बॉट का स्पष्ट संकेत है। रैंडमाइजेशन का उपयोग करें: उदाहरण के लिए, 3 से 7 सेकंड के बीच।

लोकप्रिय उपकरणों में रोटेशन सेट करना

Datacol में:

  • "सेटिंग्स" → "प्रॉक्सी" खोलें
  • "स्वचालित प्रॉक्सी रोटेशन" सक्षम करें
  • मोड चुनें: "समय के अनुसार" (हर X मिनट) या "अनुरोधों की संख्या के अनुसार" (हर X अनुरोध)
  • "सेटिंग्स" → "देरी" में देरी सेट करें → "यादृच्छिक देरी" चुनें और सीमा निर्दिष्ट करें (उदाहरण के लिए, 3000-7000 मिलीसेकंड)

Octoparse में:

  • कार्य की सेटिंग्स में "Advanced Settings" → "Proxy Settings" चुनें
  • "Rotate proxy IP" सक्षम करें और अंतराल सेट करें
  • "AJAX/Paging Settings" में "Waiting time" को यादृच्छिकता के साथ सेट करें

Python पर अपने स्क्रिप्ट में:

import time
import random
import requests

proxies_list = [
    "http://user1:pass1@gate.proxycove.com:8080",
    "http://user2:pass2@gate.proxycove.com:8080",
    # ... और प्रॉक्सी
]

for url in urls_to_parse:
    proxy = random.choice(proxies_list)  # प्रॉक्सी का यादृच्छिक चयन
    proxies = {"http": proxy, "https": proxy}
    
    response = requests.get(url, proxies=proxies)
    # ... डेटा को संसाधित करें
    
    delay = random.uniform(3, 7)  # 3 से 7 सेकंड के बीच यादृच्छिक देरी
    time.sleep(delay)

डिटेक्शन से सुरक्षा के लिए अतिरिक्त उपाय

IP रोटेशन और देरी के अलावा, अधिकतम अदृश्यता के लिए इन तकनीकों का उपयोग करें:

  • User-Agent की रोटेशन — वास्तविक ब्राउज़रों से 10-20 लोकप्रिय User-Agent की सूची का उपयोग करें। इसे IP के साथ बदलें।
  • Referers — Ozon के आंतरिक पृष्ठों से अनुरोधों में Referer हेडर जोड़ें (उदाहरण के लिए, श्रेणी या खोज पृष्ठ से), ताकि साइट पर नेविगेशन का अनुकरण किया जा सके।
  • Cookies — प्रत्येक IP के लिए कुकीज़ को सहेजें और अगले अनुरोधों में उसी IP से पुनः उपयोग करें।
  • Accept-Language — रूसी उपयोगकर्ता का अनुकरण करने के लिए Accept-Language: ru-RU,ru;q=0.9 हेडर सेट करें।

महत्वपूर्ण: बिना अतिरिक्त मास्किंग के हेडलेस ब्राउज़र्स (Selenium, Puppeteer) का उपयोग न करें। Ozon आसानी से हेडलेस मोड का पता लगा लेता है, जिसमें WebGL, प्लगइन्स और अन्य संकेतों की अनुपस्थिति होती है। यदि आप ब्राउज़र का उपयोग करते हैं, तो Puppeteer-extra-plugin-stealth जैसे प्लगइन्स को जोड़ें।

सामान्य गलतियाँ जो ब्लॉकिंग का कारण बनती हैं

विक्रेताओं के साथ काम करते हुए, हमने कुछ महत्वपूर्ण गलतियाँ खोजी हैं, जो गुणवत्ता वाली प्रॉक्सी का उपयोग करने पर भी ब्लॉकिंग का कारण बनती हैं। आइए प्रत्येक को देखें और जानें कि इससे कैसे बचें।

गलती 1: पार्सिंग की अत्यधिक गति

कई लोग न्यूनतम समय में अधिकतम डेटा पार्स करने की कोशिश करते हैं, अनुरोधों के बीच 0.5-1 सेकंड की देरी सेट करते हैं। यह बैन का सबसे तेज़ रास्ता है।

यह समस्या क्यों है: एक वास्तविक उपयोगकर्ता एक मिनट में 60 उत्पादों को नहीं देख सकता है। Ozon असामान्य गतिविधि को देखता है और IP को ब्लॉक कर देता है।

समाधान: न्यूनतम देरी — रिज़िडेंट प्रॉक्सी के लिए 2-3 सेकंड, डेटा सेंटर प्रॉक्सी के लिए 5-7 सेकंड। हाँ, पार्सिंग में अधिक समय लगेगा, लेकिन यह स्थिर रहेगा।

गलती 2: सभी अनुरोधों के लिए एक ही IP का उपयोग

कुछ लोग एक प्रॉक्सी खरीदते हैं और उसे सैकड़ों उत्पादों की पार्सिंग के लिए उपयोग करते हैं। यह केवल बहुत छोटे वॉल्यूम (20-30 उत्पादों प्रति दिन) के लिए काम करता है।

यह समस्या क्यों है: Ozon देखता है कि एक IP से एक घंटे में विभिन्न उत्पादों के लिए 200 अनुरोध आए हैं। यह पार्सर का स्पष्ट संकेत है।

समाधान: स्वचालित रोटेशन के साथ प्रॉक्सी का पूल का उपयोग करें। 100 उत्पादों के लिए 10-20 विभिन्न IP पर्याप्त हैं, जो हर 5-10 अनुरोधों के बाद रोटेट होते हैं।

गलती 3: कैप्चा और त्रुटियों की अनदेखी

जब पार्सर कैप्चा या त्रुटि 429 (बहुत अधिक अनुरोध) प्राप्त करता है, तो कुछ लोग इसे अनदेखा करते हैं और अनुरोध भेजना जारी रखते हैं।

यह समस्या क्यों है: यह स्थिति को और खराब करता है — Ozon देखता है कि बॉट सुरक्षा की अनदेखी कर रहा है, और IP को लंबे समय के लिए ब्लॉक कर देता है (कभी-कभी हमेशा के लिए)।

समाधान: पार्सर में त्रुटियों को संभालने के लिए सेटिंग्स करें:

  • कैप्चा प्राप्त होने पर — 5-10 मिनट के लिए पार्सिंग रोकें, IP बदलें
  • त्रुटि 429 होने पर — देरी को 2 गुना बढ़ाएँ, IP बदलें
  • त्रुटि 403 (प्रतिबंधित) होने पर — तुरंत IP और User-Agent बदलें
  • महत्वपूर्ण कार्यों के लिए कैप्चा को स्वचालित रूप से हल करने वाली सेवाओं (2Captcha, Anti-Captcha) का उपयोग करें

गलती 4: केवल कार्य समय में पार्सिंग

कई लोग पार्सर को एक ही समय पर मैन्युअल रूप से चलाते हैं (उदाहरण के लिए, हर दिन 10:00 बजे)। यह एक पूर्वानुमानित पैटर्न बनाता है।

समाधान: दिन के दौरान पार्सिंग को समान रूप से वितरित करें। यदि आपको दिन में 4 बार कीमतों की जांच करनी है, तो इसे यादृच्छिक समय पर 6±1 घंटे के अंतराल के साथ चलाएँ।

गलती 5: सस्ते सार्वजनिक प्रॉक्सी का उपयोग

मुफ्त या बहुत सस्ते प्रॉक्सी सार्वजनिक सूचियों से पहले से ही सभी बड़े साइटों, जिसमें Ozon शामिल है, की ब्लैकलिस्ट में हैं।

समाधान: विश्वसनीय प्रदाताओं से उच्च गुणवत्ता वाली भुगतान प्रॉक्सी का उपयोग करें। 500-1000 रूबल की बचत ब्लॉकिंग से लड़ने में बर्बाद किए गए समय के लायक नहीं है।

1000+ उत्पादों पर निगरानी कैसे बढ़ाएँ

जब आपका व्यवसाय बढ़ता है, तो 50-100 नहीं, बल्कि 1000-5000 उत्पादों की निगरानी की आवश्यकता होती है। इस चरण पर, डेस्कटॉप पार्सर्स अप्रभावी हो जाते हैं, और अधिक गंभीर समाधानों पर जाने की आवश्यकता होती है।

स्थानीय के बजाय क्लाउड पार्सिंग

बड़े वॉल्यूम के लिए, क्लाउड सर्वर (VPS/VDS) का उपयोग करें, जो 24/7 काम करते हैं। लाभ:

  • आपको अपने कंप्यूटर को चालू रखने की आवश्यकता नहीं है
  • आप एक साथ कई कार्य कर सकते हैं
  • आपकी पार्सिंग गति बढ़ जाती है
  • आप आसानी से संसाधनों को स्केल कर सकते हैं

क्लाउड पार्सिंग का उपयोग करते समय, सुनिश्चित करें कि आपके पास पर्याप्त संसाधन हैं और प्रॉक्सी का एक बड़ा पूल है।

स्वचालित निगरानी प्रणाली का निर्माण

एक बार जब आप 1000+ उत्पादों की निगरानी करने के लिए तैयार हों, तो एक स्वचालित निगरानी प्रणाली बनाना सबसे अच्छा है। यह आपको समय और प्रयास की बचत करेगा।

स्वचालित प्रणाली में निम्नलिखित घटक शामिल हो सकते हैं:

  • क्लाउड सर्वर पर पार्सिंग स्क्रिप्ट
  • प्रॉक्सी रोटेशन और देरी सेटिंग्स
  • डेटा संग्रहण और विश्लेषण के लिए डेटाबेस
  • कीमतों में बदलाव पर सूचनाएँ

इस तरह की प्रणाली आपको प्रतिस्पर्धियों की कीमतों पर नज़र रखने और बाजार के परिवर्तनों पर तेजी से प्रतिक्रिया करने में मदद करेगी।

निष्कर्ष

Ozon पर कीमतों की निगरानी एक चुनौतीपूर्ण कार्य हो सकता है, लेकिन सही उपकरणों और रणनीतियों के साथ, आप इसे सफलतापूर्वक कर सकते हैं। प्रॉक्सी का उपयोग करें, उचित सेटिंग्स लागू करें, और सामान्य गलतियों से बचें। इस तरह, आप अपने व्यवसाय को बढ़ा सकते हैं और प्रतिस्पर्धियों के खिलाफ बढ़त प्राप्त कर सकते हैं।

```