Back to Blog

Wildberries और Ozon से बिना बैन के रिव्यू कैसे इकट्ठा करें: सेलर्स के लिए पूर्ण गाइड

जानें कि कैसे Wildberries, Ozon और अन्य मार्केटप्लेस से प्रतिस्पर्धियों की समीक्षाएँ सुरक्षित रूप से इकट्ठा करें, बिना IP और खातों की ब्लॉकिंग के।

📅January 23, 2026
```html

प्रतिस्पर्धियों की समीक्षाओं का विश्लेषण किसी भी मार्केटप्लेस विक्रेता के लिए एक महत्वपूर्ण कार्य है। समीक्षाएँ उत्पादों की वास्तविक समस्याओं को दर्शाती हैं, कार्डों में सुधार करने में मदद करती हैं और अनछुई निचों को खोजने में मदद करती हैं। लेकिन मार्केटप्लेस बड़े पैमाने पर पार्सिंग को सख्ती से ब्लॉक करते हैं: Wildberries 50-100 अनुरोधों के बाद IP को ब्लॉक करता है, Ozon कैप्चा दिखाता है, और Yandex.Market ने व्यक्तिगत उपयोगकर्ताओं के लिए API का उपयोग बंद कर दिया है। इस लेख में हम देखेंगे कि सुरक्षित रूप से समीक्षाएँ कैसे इकट्ठा करें, कौन से उपकरणों का उपयोग करें और डेटा तक पहुंच खोने से बचने के लिए प्रॉक्सी को कैसे सेट करें।

मार्केटप्लेस पार्सिंग को क्यों ब्लॉक करते हैं

मार्केटप्लेस अपने डेटा की सुरक्षा कई कारणों से करते हैं। सबसे पहले, बड़े पैमाने पर पार्सिंग सर्वरों पर उच्च लोड उत्पन्न करती है — प्रति मिनट हजारों अनुरोध पार्सरों से सामान्य खरीदारों के लिए साइट के काम को धीमा कर सकते हैं। दूसरे, समीक्षाएँ मूल्यवान डेटा हैं, जिन्हें प्लेटफार्मों द्वारा भुगतान वाली विश्लेषिकी के माध्यम से मुद्रीकृत किया जाता है (उदाहरण के लिए, Ozon Analytics या WB Analytics की कीमत 5000 रूबल प्रति माह से शुरू होती है)। तीसरे, प्रतिस्पर्धी समीक्षाओं का उपयोग अनुचित कार्यों के लिए कर सकते हैं: सफल रणनीतियों की नकल, समीक्षाओं की बढ़ोतरी या यहां तक कि प्रतिस्पर्धियों के असंतुष्ट ग्राहकों को खोजने के लिए।

तकनीकी रूप से, मार्केटप्लेस संदिग्ध गतिविधियों को कई मापदंडों के आधार पर ट्रैक करते हैं:

  • एक IP से अनुरोधों की आवृत्ति: यदि आपके IP से प्रति मिनट 100+ अनुरोध आते हैं — तो यह स्पष्ट रूप से कोई व्यक्ति नहीं है। Wildberries ऐसे IP को 50-70 अनुरोधों के बाद 24 घंटे के लिए ब्लॉक करता है।
  • व्यवहार पैटर्न: पार्सर पृष्ठों को बहुत तेजी से खोलते हैं (पृष्ठ पर 1 सेकंड से कम), माउस नहीं हिलाते, स्क्रॉल नहीं करते। आधुनिक एंटी-बॉट सिस्टम (जैसे, Kasada या DataDome) इसे आसानी से पहचान लेते हैं।
  • User-Agent और ब्राउज़र का फिंगरप्रिंट: यदि आपका स्क्रिप्ट पुराने Chrome संस्करण के User-Agent के साथ या बिना JavaScript के अनुरोध भेजता है — तो यह एक लाल झंडा है।
  • कुकीज़ और सत्रों की अनुपस्थिति: सामान्य उपयोगकर्ताओं के पास विज़िट का इतिहास होता है, कुकीज़ ऑथेंटिकेशन होती हैं। पार्सर अक्सर "स्वच्छ" आते हैं।

Ozon विशेष रूप से आक्रामक सुरक्षा का उपयोग करता है: 20-30 अनुरोधों के बाद कैप्चा दिखाता है, और पुनः प्रयासों के दौरान IP को CDN (Cloudflare) स्तर पर ब्लॉक करता है। Yandex.Market ने 2023 में व्यक्तिगत उपयोगकर्ताओं के लिए सार्वजनिक API बंद कर दिया — अब केवल कंपनियों के लिए अनुबंध के साथ उपलब्ध है। Avito केवल IP के आधार पर ही नहीं, बल्कि फोन नंबर के आधार पर भी ब्लॉक करता है, यदि स्वचालित गतिविधि का पता चलता है।

यदि सुरक्षा के बिना पार्स करें: प्रतिबंधों के परिणाम

प्रतिबंध के परिणाम इस बात पर निर्भर करते हैं कि आप कैसे पार्स कर रहे हैं। यदि आप बिना प्रॉक्सी के घरेलू IP का उपयोग करते हैं — तो आपको 24 घंटे का अस्थायी प्रतिबंध मिलेगा। यह डेटा के एक बार के संग्रह के लिए गंभीर नहीं है, लेकिन नियमित निगरानी के लिए समस्या है। यदि आप विक्रेता के खाते के माध्यम से पार्स करते हैं (उदाहरण के लिए, विस्तारित आँकड़ों तक पहुँच के लिए WB के व्यक्तिगत खाते का उपयोग करते हुए) — तो आपके खाते का प्रतिबंध लगने का जोखिम है। इसे पुनर्स्थापित करना कठिन है: आपको समर्थन में लिखना होगा, यह साबित करना होगा कि यह आप नहीं थे, बल्कि "कंप्यूटर पर वायरस" था। यह प्रक्रिया एक सप्ताह से एक महीने तक लगती है।

वास्तविक मामला: एक बच्चे के खिलौनों का विक्रेता Wildberries पर प्रतिस्पर्धियों की समीक्षाओं का स्वचालित पार्सिंग सेट करता है, Python पर स्क्रिप्ट के माध्यम से। स्क्रिप्ट उसके कार्यशील IP के साथ काम करती थी, हर घंटे 500 समीक्षाएँ इकट्ठा करती थी। 3 दिन बाद Wildberries ने न केवल IP को ब्लॉक किया, बल्कि विक्रेता के खाते को भी — एल्गोरिदम ने पार्सर के IP को उस IP से जोड़ा, जिससे व्यक्तिगत खाते में प्रवेश किया गया। परिणाम: 2 सप्ताह के लिए दुकान तक पहुँच खोना, लगभग 400,000 रूबल की बिक्री का नुकसान (उत्पाद उपलब्ध थे, लेकिन आपूर्ति का प्रबंधन करना असंभव था)।

महत्वपूर्ण: कभी भी उसी IP से पार्स न करें, जिससे आप विक्रेता के व्यक्तिगत खाते में प्रवेश करते हैं। मार्केटप्लेस IP पते को खातों से जोड़ते हैं और संदिग्ध गतिविधि के लिए आपके स्टोर को ब्लॉक कर सकते हैं।

एक और समस्या — कानूनी। औपचारिक रूप से, पार्सिंग अधिकांश मार्केटप्लेस के उपयोगकर्ता समझौते का उल्लंघन करती है (अनुच्छेद "प्रतिबंधित क्रियाएँ")। व्यवहार में, प्लेटफार्मों ने पार्सरों के खिलाफ अदालत में जाने की संभावना कम होती है, लेकिन उदाहरण मौजूद हैं। 2022 में Ozon ने एक विश्लेषण सेवा के खिलाफ मुकदमा दायर किया, जिसने कीमतों और शेषों के बारे में डेटा एकत्र किया। अदालत ने Ozon के पक्ष में फैसला सुनाया, सेवा बंद हो गई। व्यक्तिगत उपयोगकर्ताओं के लिए कानूनी दावों का जोखिम न्यूनतम है, लेकिन उन कंपनियों के लिए जो पार्सिंग को सेवा के रूप में बेचती हैं, यह एक वास्तविक खतरा है।

समीक्षाएँ इकट्ठा करने के 3 तरीके: मैनुअल, API, स्वचालित पार्सिंग

तरीका 1: मैनुअल संग्रह (छोटे वॉल्यूम के लिए)

यदि आपको सप्ताह में 5-10 प्रतिस्पर्धियों के उत्पादों पर समीक्षाएँ इकट्ठा करने की आवश्यकता है — तो आप इसे मैनुअल रूप से कर सकते हैं। आप Wildberries या Ozon पर उत्पाद कार्ड खोलते हैं, समीक्षाएँ स्क्रॉल करते हैं, टेक्स्ट को Excel में कॉपी करते हैं। फायदे: तकनीकी कौशल की आवश्यकता नहीं है, प्रतिबंध का शून्य जोखिम। नुकसान: बहुत धीमा (100 समीक्षाओं के लिए 30-40 मिनट लगते हैं), गतिशीलता को ट्रैक करना असंभव है, कोई स्वचालन नहीं है।

यह तरीका माइक्रो-बिजनेस के लिए उपयुक्त है: आप 2-3 उत्पाद बेचते हैं, प्रतिस्पर्धियों के बारे में क्या लिखा जा रहा है, यह समझना चाहते हैं, ताकि आप अपने कार्ड को सुधार सकें। नियमित रूप से दर्जनों उत्पादों की निगरानी के लिए मैनुअल संग्रह का विस्तार नहीं किया जा सकता।

तरीका 2: आधिकारिक API (सीमित पहुँच)

कुछ मार्केटप्लेस भागीदारों के लिए API प्रदान करते हैं। Wildberries API विक्रेताओं के लिए केवल आपके अपने उत्पादों पर समीक्षाएँ प्राप्त करने की अनुमति देता है (प्रतिस्पर्धियों पर नहीं)। Ozon API भी इसी तरह है — केवल अपने डेटा तक पहुँच। Yandex.Market API सामग्री भागीदारों के लिए कानूनी अनुबंध की आवश्यकता होती है और केवल 10 मिलियन रूबल वार्षिक टर्नओवर वाली कंपनियों के लिए उपलब्ध है।

API के फायदे: स्थिर पहुँच, प्लेटफार्म के नियमों का उल्लंघन नहीं करते, JSON में संरचित डेटा। नुकसान: प्रतिस्पर्धियों की समीक्षाएँ प्राप्त नहीं कर सकते (अधिकांश विक्रेताओं का मुख्य कार्य), आधिकारिक API के लिए उच्च प्रवेश बाधा।

तरीका 3: प्रॉक्सी के माध्यम से स्वचालित पार्सिंग (यूनिवर्सल)

यह पेशेवर विक्रेताओं और एजेंसियों के लिए मुख्य विधि है। आप विशेष उपकरणों (पार्सर) का उपयोग करते हैं या एक स्क्रिप्ट लिखते हैं जो स्वचालित रूप से उत्पाद पृष्ठों को खोलती है, समीक्षाएँ इकट्ठा करती है और डेटाबेस में सहेजती है। प्रतिबंध से बचने के लिए, सभी अनुरोध प्रॉक्सी के माध्यम से जाते हैं — प्रत्येक अनुरोध नए IP पते से होता है, मार्केटप्लेस विभिन्न शहरों के सामान्य उपयोगकर्ताओं को देखता है।

फायदे: आप किसी भी उत्पाद (अपने और प्रतिस्पर्धियों) की समीक्षाएँ इकट्ठा कर सकते हैं, पूर्ण स्वचालन, स्केलेबिलिटी (10,000 उत्पादों तक प्रति दिन)। नुकसान: तकनीकी कौशल या भुगतान किए गए उपकरणों की आवश्यकता होती है, प्रॉक्सी पर खर्च (3000 रूबल प्रति माह से)।

कौन सी प्रॉक्सी मार्केटप्लेस पार्सिंग के लिए उपयुक्त हैं

प्रॉक्सी के प्रकार का चयन आपके बजट, पार्सिंग की मात्रा और डेटा की गुणवत्ता की आवश्यकताओं पर निर्भर करता है। हम तीन मुख्य प्रकारों और उनके मार्केटप्लेस के लिए अनुप्रयोग की समीक्षा करेंगे।

प्रॉक्सी का प्रकार के लिए उपयुक्त कीमत फायदे/नुकसान
डेटा सेंटर प्रॉक्सी Avito, AliExpress, छोटे प्लेटफार्मों का पार्सिंग 50₽/IP प्रति माह से + सस्ते, तेज़
WB और Ozon द्वारा आसानी से पहचाने जाते हैं
रिज़िडेंट प्रॉक्सी Wildberries, Ozon, Yandex.Market — मुख्य विकल्प 300₽/GB से + वास्तविक घरेलू उपयोगकर्ताओं के IP, ब्लॉक नहीं होते
डेटा सेंटर से महंगे
मोबाइल प्रॉक्सी उच्च प्रतिबंध के जोखिम के साथ पार्सिंग, मोबाइल ऐप के माध्यम से संग्रह 500₽/IP प्रति माह से + अधिकतम सुरक्षा, मोबाइल ऑपरेटरों के IP
सबसे महंगे, रेजिडेंट्स से धीमे

Wildberries और Ozon के लिए हम रेजिडेंट प्रॉक्सी की सिफारिश करते हैं। ये मार्केटप्लेस उन्नत एंटी-बॉट सिस्टम का उपयोग करते हैं, जो डेटा सेंटर के IP को आसानी से पहचान लेते हैं (वे होस्टिंग प्रदाताओं के ज्ञात AS-नंबर रेंज में होते हैं)। रेजिडेंट प्रॉक्सी सामान्य घरेलू इंटरनेट प्रदाताओं (जैसे, Ростелеком, МТС, Билайн) के IP होते हैं, जिन्हें वास्तविक खरीदार से अलग करना असंभव है।

एक महत्वपूर्ण बिंदु: मार्केटप्लेस के लिए IP रोटेशन के साथ प्रॉक्सी की आवश्यकता होती है। इसका मतलब है कि आपका प्रत्येक अनुरोध नए IP पते से होता है। उदाहरण के लिए, यदि आप 1000 समीक्षाएँ पार्स करते हैं — तो ये 1000 विभिन्न IP विभिन्न शहरों से होते हैं। मार्केटप्लेस देखता है कि उत्पाद पर वास्तविक उपयोगकर्ता पूरे देश से आ रहे हैं, कोई संदिग्ध गतिविधि नहीं है।

सलाह: रूसी मार्केटप्लेस के लिए रूसी IP के साथ प्रॉक्सी चुनें। Wildberries और Ozon अक्सर विदेश से उपयोगकर्ताओं को कैप्चा दिखाते हैं (विदेशी पार्सरों से सुरक्षा)। रूस में भू-स्थान के साथ रेजिडेंट प्रॉक्सी इस समस्या को हल करती हैं।

समीक्षाओं को इकट्ठा करने के लिए तैयार उपकरण: सेवाओं का अवलोकन

यदि आप प्रोग्रामर नहीं हैं, तो शून्य से पार्सिंग स्क्रिप्ट लिखने की आवश्यकता नहीं है — तैयार समाधान हैं। हम मार्केटप्लेस विक्रेताओं के लिए लोकप्रिय उपकरणों की समीक्षा करेंगे।

1. Mpstats (mpstats.io) — Wildberries और Ozon के लिए विश्लेषिकी

रूसी विक्रेताओं के बीच सबसे लोकप्रिय सेवा। यह न केवल समीक्षाएँ, बल्कि कीमतें, शेष, खोज में स्थिति, बिक्री का इतिहास भी इकट्ठा करती है। समीक्षाएँ प्रतिदिन अपडेट होती हैं, Excel में निर्यात किया जा सकता है। कीमत: 3000 रूबल प्रति माह से (टैरिफ "स्टार्ट")। फायदे: आपको प्रॉक्सी को स्वयं सेट करने की आवश्यकता नहीं है (सब कुछ बॉक्स से बाहर काम करता है), उपयोगकर्ता-अनुकूल इंटरफ़ेस, तैयार रिपोर्ट। नुकसान: स्केलिंग पर महंगा (यदि आप 100+ उत्पादों की निगरानी करते हैं, तो टैरिफ 15,000 रूबल तक बढ़ जाता है), डेटा में देरी से अपडेट होता है।

2. Moneyplace (moneyplace.io) — Ozon के लिए पार्सर

Ozon के लिए एक विशेष उपकरण। यह समीक्षाएँ, ग्राहकों के प्रश्न, विक्रेताओं की रेटिंग इकट्ठा करता है। समीक्षाओं की भावना का विश्लेषण करने की सुविधा है (स्वचालित रूप से नकारात्मक और सकारात्मक को पहचानता है)। कीमत: 2500 रूबल प्रति माह से। फायदे: Ozon के लिए गहरी विश्लेषिकी, आपकी प्रणालियों के साथ एकीकरण के लिए API। नुकसान: केवल Ozon के साथ काम करता है, Wildberries और अन्य प्लेटफार्मों का समर्थन नहीं है।

3. Parser.ru — बिना कोड के यूनिवर्सल पार्सर

किसी भी वेबसाइट, मार्केटप्लेस सहित पार्सिंग के लिए क्लाउड सेवा। यह "जो पार्स करना है उसे बताएं — परिणाम प्राप्त करें" के सिद्धांत पर काम करता है। प्रोग्रामिंग की आवश्यकता नहीं है, सब कुछ दृश्य इंटरफ़ेस के माध्यम से सेट किया जाता है। कीमत: 1500 रूबल प्रति माह से + प्रॉक्सी के लिए अलग से भुगतान (यदि आप अपनी प्रॉक्सी का उपयोग करते हैं — तो मुफ्त)। फायदे: लचीलापन (आप किसी भी डेटा की पार्सिंग सेट कर सकते हैं, केवल समीक्षाएँ नहीं), किसी भी मार्केटप्लेस के साथ काम करता है। नुकसान: सेटअप में समय लगता है (इंटरफ़ेस को समझने में 1-2 घंटे)।

4. Octoparse — Windows/Mac के लिए डेस्कटॉप पार्सर

दृश्य संपादक के साथ पार्सिंग के लिए प्रोग्राम। आप इसे अपने कंप्यूटर पर इंस्टॉल करते हैं, मार्केटप्लेस की वेबसाइट खोलते हैं, उन तत्वों पर क्लिक करते हैं जिन्हें इकट्ठा करना है (समीक्षा का टेक्स्ट, रेटिंग, तारीख)। प्रोग्राम संरचना को याद करता है और स्वचालित रूप से पार्स करता है। कीमत: मुफ्त संस्करण (10,000 रिकॉर्ड प्रति माह तक), भुगतान संस्करण $75/महीने से। फायदे: HTML/CSS जानने की आवश्यकता नहीं है, लोकप्रिय साइटों के लिए तैयार टेम्पलेट्स हैं। नुकसान: केवल आपके कंप्यूटर पर काम करता है (यदि आप इसे बंद करते हैं — पार्सिंग रुक जाएगी), अंग्रेजी इंटरफ़ेस।

5. Python पर अपना स्क्रिप्ट (तकनीकी रूप से सक्षम लोगों के लिए)

यदि आपके पास प्रोग्रामिंग के बुनियादी कौशल हैं, तो आप Selenium (ब्राउज़र का अनुकरण) या Scrapy (तेज पार्सिंग) पुस्तकालयों के साथ Python में एक स्क्रिप्ट लिख सकते हैं। फायदे: पूर्ण नियंत्रण, शून्य सदस्यता शुल्क (केवल प्रॉक्सी के लिए भुगतान करते हैं), आप किसी भी डेटा को किसी भी प्रारूप में पार्स कर सकते हैं। नुकसान: विकास में समय लगता है (सरल पार्सर के लिए 5 घंटे से), कोड का समर्थन करना आवश्यक है (मार्केटप्लेस वेबसाइट की संरचना बदलते हैं — स्क्रिप्ट टूट जाती है)।

अधिकांश विक्रेताओं के लिए हम Mpstats या Moneyplace जैसे तैयार सेवाओं से शुरू करने की सिफारिश करते हैं। यदि आप मार्केटप्लेस पर प्रति माह 200,000 रूबल से अधिक कमाते हैं, तो ये लाभदायक हैं। यदि बजट सीमित है या पार्सिंग के लिए असामान्य लॉजिक की आवश्यकता है — तो Octoparse या अपने स्क्रिप्ट की ओर देखें।

प्रॉक्सी के माध्यम से पार्सिंग सेटअप के लिए चरण-दर-चरण गाइड

हम Octoparse (कोड रहित पार्सर) + रेजिडेंट प्रॉक्सी के संयोजन के उदाहरण पर सेटअप देखेंगे। यह तरीका नए लोगों के लिए उपयुक्त है, प्रोग्रामिंग की आवश्यकता नहीं है।

चरण 1: रेजिडेंट प्रॉक्सी तक पहुँच प्राप्त करें

रेजिडेंट प्रॉक्सी प्रदाता (उदाहरण के लिए, ProxyCove) पर पंजीकरण करें। पंजीकरण के बाद, आपको कनेक्शन के लिए डेटा प्राप्त होगा:

प्रॉक्सी सर्वर: gate.proxycove.com
पोर्ट: 8080
लॉगिन: user_आपका_id
पासवर्ड: आपका_पासवर्ड
प्रकार: HTTP/HTTPS (IP रोटेशन के साथ)

महत्वपूर्ण: अनुरोधों के अनुसार रोटेशन वाले टैरिफ का चयन करें (प्रत्येक HTTP अनुरोध = नया IP)। मार्केटप्लेस के लिए यह महत्वपूर्ण है।

चरण 2: Octoparse स्थापित करें और सेट करें

आधिकारिक वेबसाइट (octoparse.com) से Octoparse डाउनलोड करें, अपने कंप्यूटर पर स्थापित करें। पहले लॉन्च पर, प्रोग्राम आपको एक खाता बनाने के लिए कहेगा — परीक्षण के लिए मुफ्त संस्करण का उपयोग करें (सीमा 10,000 रिकॉर्ड प्रति माह, यह 50-100 उत्पादों के लिए पर्याप्त है)।

सेटिंग्स खोलें (Settings → Proxy Settings) और अपनी प्रॉक्सी जोड़ें:

  • प्रॉक्सी प्रकार: HTTP
  • सर्वर: gate.proxycove.com
  • पोर्ट: 8080
  • उपयोगकर्ता नाम: आपका लॉगिन
  • पासवर्ड: आपका पासवर्ड
  • "सभी कार्यों के लिए प्रॉक्सी का उपयोग करें" विकल्प को सक्षम करें

"Test Proxy" पर क्लिक करें — प्रोग्राम कनेक्शन की जांच करेगा। यदि सब कुछ सही सेट किया गया है, तो आप "Proxy is working" संदेश देखेंगे।

चरण 3: Wildberries पर समीक्षाओं के पार्सिंग कार्य बनाएँ

"New Task" → "Advanced Mode" पर क्लिक करें। Wildberries पर उत्पाद कार्ड का URL डालें (उदाहरण के लिए, https://www.wildberries.ru/catalog/12345678/detail.aspx)। Octoparse अंतर्निहित ब्राउज़र खोलेगा और प्रॉक्सी के माध्यम से पृष्ठ लोड करेगा।

अब प्रोग्राम को सिखाएँ कि क्या पार्स करना है:

  1. पृष्ठ को समीक्षाओं के ब्लॉक तक स्क्रॉल करें।
  2. पहली समीक्षा के टेक्स्ट पर क्लिक करें → "Extract text" चुनें → प्रोग्राम पृष्ठ पर सभी समीक्षाओं को हाइलाइट करेगा।
  3. रेटिंग (तारे) पर क्लिक करें → "Extract text" → प्रोग्राम रेटिंग को याद रखेगा।
  4. समीक्षा की तारीख पर क्लिक करें → "Extract text"।
  5. "और दिखाएँ" बटन (पैजिनेशन) खोजें → दाएँ क्लिक करें → "Click to paginate" → प्रोग्राम स्वचालित रूप से पृष्ठों को स्क्रॉल करेगा।

सीमाएँ सेट करें: "Pagination" अनुभाग में अधिकतम 50 पृष्ठों (लगभग 500 समीक्षाएँ) का उल्लेख करें। यह एक सत्र के लिए सुरक्षित मात्रा है।

चरण 4: अनुरोधों के बीच विलंब सेट करें

यह महत्वपूर्ण है! यदि पार्सर पृष्ठों को बहुत तेजी से स्क्रॉल करता है, तो Wildberries बॉट पर संदेह करेगा, भले ही प्रॉक्सी का उपयोग किया गया हो। "Task Settings" → "Speed" खोलें और सेट करें:

  • पृष्ठ लोडिंग विलंब: 3-5 सेकंड (पृष्ठों के बीच विलंब)
  • क्रिया विलंब: 1-2 सेकंड (क्लिक्स के बीच विलंब)
  • यादृच्छिक विलंब सक्षम करें: सक्षम करें (यादृच्छिकता जोड़ता है, मानवता का अनुकरण करता है)

चरण 5: पार्सिंग शुरू करें और डेटा निर्यात करें

"Run" पर क्लिक करें → प्रोग्राम पार्सिंग शुरू करेगा। आप वास्तविक समय में देखेंगे कि डेटा कैसे इकट्ठा किया जा रहा है। समाप्त होने के बाद (आमतौर पर 500 समीक्षाओं के लिए 10-15 मिनट) "Export" पर क्लिक करें → Excel या CSV प्रारूप चुनें। तैयार है — आपके पास सभी समीक्षाओं, रेटिंग और तारीखों के साथ एक तालिका है।

आम गलती: 100 उत्पादों पर पार्सिंग तुरंत न करें। 5-10 उत्पादों से शुरू करें, सुनिश्चित करें कि सब कुछ बिना प्रतिबंध के काम कर रहा है। फिर 50-100 उत्पादों प्रति दिन तक स्केल करें।

सुरक्षित पार्सिंग के नियम: सीमाएँ, विलंब, रोटेशन

प्रॉक्सी के साथ भी प्रतिबंध प्राप्त किया जा सकता है, यदि "शिष्टाचार के नियमों" का उल्लंघन किया जाए। मार्केटप्लेस केवल IP का नहीं, बल्कि व्यवहार पैटर्न का भी विश्लेषण करते हैं। यहाँ सुरक्षित पार्सिंग की चेकलिस्ट है:

1. अनुरोधों की सीमाएँ बनाए रखें

रूसी मार्केटप्लेस के लिए सुरक्षित सीमाएँ:

  • Wildberries: एक पार्सिंग कार्य से प्रति घंटे 100 अनुरोधों से अधिक नहीं। यदि आप 10 उत्पादों की पार्सिंग कर रहे हैं — तो उत्पादों के बीच 30-40 सेकंड का विराम लें।
  • Ozon: प्रति घंटे 50 अनुरोधों से अधिक नहीं (उनकी सुरक्षा अधिक आक्रामक है)। उत्पादों के बीच विराम — 1 मिनट।
  • Yandex.Market: प्रति घंटे 30 अनुरोधों से अधिक नहीं। प्रत्येक 10 अनुरोधों के बाद 5 मिनट का विराम लें।

ये सीमाएँ रेजिडेंट प्रॉक्सी के साथ रोटेशन के माध्यम से पार्सिंग के लिए निर्धारित की गई हैं। यदि आप डेटा सेंटर का उपयोग कर रहे हैं — तो सीमाओं को 2 से विभाजित करें।

2. यादृच्छिक विलंब का उपयोग करें

विलंब को निश्चित न बनाएं (उदाहरण के लिए, अनुरोधों के बीच ठीक 5 सेकंड)। यह संदिग्ध लगता है। यादृच्छिक विलंब सेट करें: 3 से 7 सेकंड तक। अधिकांश पार्सर (Octoparse, Scrapy) इस कार्यक्षमता का समर्थन करते हैं।

3. User-Agent बदलें

User-Agent वह स्ट्रिंग है जो साइट को बताती है कि आप कौन सा ब्राउज़र उपयोग कर रहे हैं। पार्सर अक्सर पुराने User-Agent भेजते हैं (उदाहरण के लिए, Chrome 90, जबकि वर्तमान संस्करण 120 है)। User-Agent का रोटेशन सेट करें: प्रत्येक अनुरोध विभिन्न ब्राउज़रों (Chrome, Firefox, Safari) और विभिन्न संस्करणों के नाम से।

रोटेशन के लिए User-Agent की सूची का उदाहरण:

Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/120.0.0.0
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) Safari/605.1.15
Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:121.0) Firefox/121.0
Mozilla/5.0 (X11; Linux x86_64) Chrome/119.0.0.0

4. पीक लोड के समय पार्स न करें

मार्केटप्लेस अधिकतम ट्रैफ़िक के समय (आमतौर पर मॉस्को समय के अनुसार 18:00 से 23:00 तक — जब खरीदार काम से लौटते हैं) एंटी-बॉट सुरक्षा को बढ़ाते हैं। इस समय कैप्चा या प्रतिबंध प्राप्त करने का जोखिम अधिक होता है। पार्सिंग के लिए अनुकूल समय: सुबह 2:00 से 8:00 बजे या दिन में 10:00 से 16:00 बजे।

5. सत्रों के अनुसार प्रॉक्सी का रोटेशन करें

यदि आप एक उत्पाद की पार्सिंग कर रहे हैं (उदाहरण के लिए, समीक्षाओं के 50 पृष्ठों को स्क्रॉल कर रहे हैं), तो पूरे सत्र के लिए एक IP का उपयोग करें। यदि आप प्रत्येक पृष्ठ पर IP बदलते हैं — तो मार्केटप्लेस कुछ अजीब पर संदेह कर सकता है (एक "उपयोगकर्ता" एक सेकंड में मास्को से व्लादिवोस्तोक के IP पर कूदता है)। लेकिन जब आप अगले उत्पाद पर जाते हैं — तो IP बदलें।

6. मानव व्यवहार का अनुकरण करें

उन्नत पार्सर (जैसे, Selenium) मानव के कार्यों का अनुकरण कर सकते हैं: माउस की गति, स्क्रॉलिंग, यादृच्छिक तत्वों पर क्लिक करना। यह पार्सर की "मानवता" को बढ़ाता है। यदि आप सरल HTTP पार्सर (बिना ब्राउज़र के) का उपयोग कर रहे हैं — तो इसकी आवश्यकता नहीं है, लेकिन तब अनुरोधों की सीमाओं का सख्ती से पालन करें।

कैसे इकट्ठा की गई समीक्षाओं का विश्लेषण करें बिक्री वृद्धि के लिए

समीक्षाएँ इकट्ठा करना — यह आधा काम है। मुख्य बात यह है कि उन्हें सही तरीके से विश्लेषित करें और अंतर्दृष्टियों का उपयोग करें। यहाँ उपयोग के व्यावहारिक परिदृश्य हैं।

1. प्रतिस्पर्धियों के उत्पादों की कमियों की खोज

इकट्ठा की गई समीक्षाओं के साथ Excel खोलें, नकारात्मक (रेटिंग 1-2 सितारे) को फ़िल्टर करें। देखें कि खरीदार किस पर शिकायत कर रहे हैं: आकार मेल नहीं खाता, खराब पैकेजिंग, लंबी डिलीवरी, सामग्री की गुणवत्ता कम। ये शिकायतें आपकी प्रतिस्पर्धात्मक बढ़त हैं। यदि प्रतिस्पर्धियों को गलत आकार के कारण 30% नकारात्मक समीक्षाएँ मिलती हैं — तो अपने कार्ड में विस्तृत आकार चार्ट के साथ फोटो के साथ जोड़ें। यदि पैकेजिंग पर शिकायतें हैं — तो उत्पाद में एक सुंदर बॉक्स डालें और इसके बारे में विवरण में लिखें।

वास्तविक मामला: एक खेल लेगिंग विक्रेता ने शीर्ष 5 प्रतिस्पर्धियों पर 500 समीक्षाएँ इकट्ठा कीं। उसने पाया कि 40% नकारात्मक समीक्षाएँ इस बात से संबंधित हैं कि कपड़ा बैठने पर पारदर्शी हो जाता है। उसने आपूर्तिकर्ता से अधिक घने कपड़े का आदेश दिया, "लेगिंग्स पारदर्शी नहीं हैं" का वीडियो परीक्षण रिकॉर्ड किया और इसे कार्ड में जोड़ा। परिणाम: रूपांतरण 3% से 7% तक बढ़ गया, बिक्री एक महीने में 2 गुना बढ़ गई।

2. ग्राहकों के प्रश्नों के आधार पर उत्पाद कार्ड में सुधार

समीक्षाओं के अलावा, ग्राहकों के प्रश्नों को पार्स करें (ये Wildberries और Ozon पर होते हैं)। प्रश्न दिखाते हैं कि कार्ड में किस जानकारी की कमी है। यदि 20 लोग पूछते हैं "क्या यह 100% कपास है या सिंथेटिक्स?" — इसका मतलब है कि सामग्री स्पष्ट नहीं है। विवरण में एक बड़ा खंड जोड़ें "सामग्री: 95% कपास, 5% इलास्टेन" आइकन के साथ। यदि वे iPhone 15 के साथ संगतता के बारे में पूछते हैं — संगत मॉडलों की सूची जोड़ें।

3. अनकही आवश्यकताओं की खोज (नए निचे)

प्रतिस्पर्धियों की सकारात्मक समीक्षाओं का विश्लेषण करें। "शानदार, लेकिन मैं चाहता था...", "दुख है कि नहीं..." जैसी वाक्यांशों की खोज करें। ये अनकही आवश्यकताओं के संकेत हैं। उदाहरण के लिए, बच्चों के बैग की समीक्षाओं में अक्सर लिखा जाता है "अच्छा बैग, लेकिन रिफ्लेक्टर्स नहीं हैं"। आप रिफ्लेक्टर्स के साथ बैग लॉन्च कर सकते हैं और इस दर्शकों को पकड़ सकते हैं।

4. समीक्षाओं की गतिशीलता की निगरानी (समस्याओं का पूर्व-खोज)

अपने उत्पादों की स्वचालित पार्सिंग को दिन में एक बार सेट करें। यदि नकारात्मक समीक्षाओं की संख्या अचानक बढ़ जाती है (उदाहरण के लिए, एक सप्ताह में 10 समीक्षाएँ आईं जो दोष पर शिकायत करती हैं) — तो यह आपूर्तिकर्ता से बैच की जांच करने का संकेत है। संभवतः, उसने दोषपूर्ण उत्पाद भेजा है। जितनी जल्दी आप समस्या का पता लगाएंगे, उतनी ही कम रेटिंग में कमी आएगी।

5. मार्केटप्लेस के भीतर SEO के लिए सेमांटिक्स का संग्रह

ग्राहकों की समीक्षाएँ "जीवित" कीवर्ड का स्रोत हैं। लोग लिखते हैं कि वे उत्पाद को कैसे खोजते हैं: "मैंने इसे दच्चा के लिए खरीदा", "23 फरवरी के लिए पति के लिए उपहार की तलाश की", "मुझे कार के लिए थर्मल कप चाहिए था"। इन वाक्यांशों को आपके कार्ड के शीर्षक और विवरण में जोड़ा जा सकता है — इससे मार्केटप्लेस में खोज में दृश्यता बढ़ेगी।

निष्कर्ष

मार्केटप्लेस से समीक्षाएँ इकट्ठा करना केवल एक तकनीकी कार्य नहीं है, बल्कि बिक्री वृद्धि के लिए एक रणनीतिक उपकरण है। सही तरीके से इकट्ठा की गई और विश्लेषित की गई प्रतिस्पर्धियों की समीक्षाएँ आपको प्रतिस्पर्धात्मक बढ़त देती हैं: आप जानते हैं कि बाजार में क्या कमी है, कौन सी समस्याएँ हल करनी हैं, और अपने कार्ड को कैसे सुधारना है। मुख्य बात यह है कि इसे सुरक्षित रूप से करें, ताकि प्रतिबंध न लगे।

लेख से प्रमुख निष्कर्ष: Wildberries और Ozon के लिए पार्सिंग के लिए रेजिडेंट प्रॉक्सी का उपयोग करें (वे डेटा सेंटर के विपरीत ब्लॉक नहीं होते हैं), अनुरोधों की सीमाएँ बनाए रखें (Wildberries पर प्रति घंटे 100 अनुरोधों से अधिक नहीं), अनुरोधों के बीच यादृच्छिक विलंब सेट करें (3-7 सेकंड), उसी IP से पार्स न करें, जिससे आप विक्रेता के व्यक्तिगत खाते में प्रवेश करते हैं। नए लोगों के लिए हम Mpstats या Octoparse जैसे तैयार उपकरणों से शुरू करने की सिफारिश करते हैं — ये लाभदायक होते हैं, यदि आपका टर्नओवर 200,000 रूबल प्रति माह से अधिक है।

यदि आप नियमित रूप से मार्केटप्लेस से डेटा इकट्ठा करने की योजना बना रहे हैं, तो हम रेजिडेंट प्रॉक्सी आजमाने की सिफारिश करते हैं — ये उच्च स्तर की गुमनामी, वास्तविक रूसी प्रदाताओं के IP और ब्लॉक के न्यूनतम जोखिम प्रदान करते हैं। यह एक निवेश है जो आपके व्यवसाय के लिए महत्वपूर्ण डेटा तक पहुँच बनाए रखने में लाभदायक है।

```