نظارت خودکار بر موجودی کالا (stock availability) یک وظیفه حیاتی برای فروشندگان و خردهفروشان است. ردیابی موجودی رقبا در Wildberries، Ozon، Amazon امکان تنظیم سریع قیمتها و خریدها را فراهم میکند. اما مارکتپلیسها درخواستهای انبوه از یک IP را به شدت مسدود میکنند — بدون پروکسی، پارسر شما پس از 10-50 درخواست مسدود خواهد شد.
در این راهنما، نحوه راهاندازی نظارت پایدار stock availability از طریق پروکسی را بررسی میکنیم: چه نوع پروکسی را انتخاب کنیم، چگونه چرخش IP را تنظیم کنیم، چه پارامترهای درخواستی استفاده کنیم و چگونه از مسدودسازی در مارکتپلیسهای محبوب جلوگیری کنیم.
چرا مارکتپلیسها نظارت بر موجودی کالا را مسدود میکنند
مارکتپلیسها زیرساخت خود را در برابر پارسینگ با چندین سطح حفاظتی محافظت میکنند. وقتی نظارت خودکار بر موجودی کالا را راهاندازی میکنید، اسکریپت شما صدها یا هزاران درخواست به API یا صفحات وب مارکتپلیس ارسال میکند. برای پلتفرم، این شبیه یک حمله یا جمعآوری ناعادلانه داده به نظر میرسد.
روشهای اصلی شناسایی پارسرها:
- فرکانس درخواستها از یک IP — اگر از یک آدرس بیش از 100 درخواست در دقیقه بیاید، این نشانه واضحی از ربات است. یک کاربر عادی فیزیکی نمیتواند 2-3 کارت محصول را در ثانیه باز کند.
- عدم وجود کوکیها و تاریخچه نشست — پارسرها اغلب درخواستها را بدون ورود قبلی به صفحه اصلی انجام میدهند که خودکارسازی را فاش میکند.
- User-Agent یکسان — اگر همه درخواستها با یک هدر مرورگر یکسان باشند، مشکوک است.
- الگوهای رفتاری — شمارش متوالی محصولات بر اساس ID، عدم وجود مکثهای تصادفی، منظم بودن کامل درخواستها.
مسدودسازی در سطح آدرس IP اتفاق میافتد. ابتدا مارکتپلیس ممکن است کپچا نشان دهد، سپس دسترسی را به طور موقت محدود کند (rate limiting)، و در صورت نقض سیستماتیک — IP را برای چند ساعت یا روز به طور کامل مسدود کند.
مورد واقعی: یک فروشنده در Wildberries نظارت بر 500 محصول رقبا را با بررسی هر 10 دقیقه راهاندازی کرد. بدون پروکسی، IP او پس از 2 ساعت کار مسدود شد. پس از انتقال به پروکسیهای مسکونی با چرخش هر 5 دقیقه، پارسر به مدت 6 ماه بدون هیچ مسدودسازی به طور پایدار کار میکند.
چه نوع پروکسی برای پارس stock availability انتخاب کنیم
انتخاب نوع پروکسی مستقیماً بر پایداری نظارت و احتمال مسدودسازی تأثیر میگذارد. مارکتپلیسهای مختلف به انواع مختلف آدرسهای IP واکنشهای متفاوتی نشان میدهند. سه گزینه اصلی و کاربرد آنها برای پارس موجودی کالا را بررسی میکنیم.
| نوع پروکسی | سرعت | خطر مسدودسازی | چه زمانی استفاده کنیم |
|---|---|---|---|
| پروکسی دیتاسنتر | بالا (50-200 میلیثانیه) | متوسط | پارس انبوه مارکتپلیسهای ساده، بررسی سریع حجمهای بزرگ |
| پروکسی مسکونی | متوسط (200-800 میلیثانیه) | پایین | Wildberries، Ozon، Amazon — پلتفرمها با حفاظت سخت |
| پروکسی موبایل | متوسط (300-1000 میلیثانیه) | بسیار پایین | بررسیهای بسیار مهم، زمانی که به حداکثر قابلیت اطمینان نیاز است |
پروکسی مسکونی — انتخاب بهینه برای اکثر وظایف نظارت stock availability است. آنها از آدرسهای IP کاربران واقعی خانگی استفاده میکنند، بنابراین مارکتپلیسها درخواستها را مشروع تلقی میکنند. برای Wildberries و Ozon این تقریباً یک الزام است — این پلتفرمها دیتاسنترها را به طور تهاجمی مسدود میکنند.
پروکسی دیتاسنتر برای پلتفرمهای کمتر محافظتشده یا زمانی که به حداکثر سرعت پارس نیاز است مناسب هستند. به عنوان مثال، برای نظارت بر مارکتپلیسهای منطقهای یا فروشگاههای اینترنتی کوچک. مزیت اصلی — سرعت بالا و پایداری اتصال. اما در پلتفرمهای بزرگ بیشتر مسدود میشوند.
پروکسی موبایل — قابل اطمینانترین، اما گرانترین گزینه. از آنها برای محصولات بسیار مهم یا زمانی که پروکسیهای مسکونی شروع به مسدود شدن میکنند استفاده کنید. IPهای موبایل تقریباً غیرممکن است مسدود شوند، زیرا پشت یک آدرس میتواند هزاران کاربر واقعی اپراتور باشند.
توصیه برای انتخاب:
- Wildberries، Ozon — فقط پروکسی مسکونی یا موبایل
- Amazon، eBay — پروکسی مسکونی با چرخش
- Яндекс.Маркет — میتوان از دیتاسنتر با فرکانس متوسط درخواست استفاده کرد
- Авито — پروکسی مسکونی با اتصال به شهر مورد نیاز
- پلتفرمهای منطقهای — دیتاسنترها معمولاً به خوبی کار میکنند
تنظیم چرخش IP: چه زمانی آدرسها را تغییر دهیم
چرخش IP — پارامتر کلیدی برای جلوگیری از مسدودسازی است. تنظیم صحیح فرکانس تغییر آدرسها امکان توزیع بار را به گونهای فراهم میکند که از هر IP حداقل تعداد درخواست بیاید و رفتار کاربران عادی را شبیهسازی کند.
دو رویکرد اصلی برای چرخش:
1. چرخش بر اساس زمان (Time-based rotation)
آدرس IP پس از یک بازه زمانی مشخص تغییر میکند، مستقل از تعداد درخواستها. این یک روش ساده و قابل پیشبینی است که برای نظارت منظم با فرکانس ثابت بررسیها مناسب است.
- هر 5-10 دقیقه — برای نظارت مکرر بر محصولات بسیار مهم (موقعیتهای برتر، محصولات با رقابت بالا)
- هر 15-30 دقیقه — حالت استاندارد برای اکثر وظایف نظارت stock availability
- هر ساعت — برای نظارت پسزمینه بر مجموعه بزرگ، زمانی که به فرکانس بالای بهروزرسانی نیاز نیست
2. چرخش بر اساس درخواست (Request-based rotation)
IP پس از تعداد مشخصی درخواست انجام شده تغییر میکند. این روش کنترل دقیقتری بر بار هر آدرس میدهد.
- هر 10-20 درخواست — برای Wildberries و Ozon (حفاظت سخت)
- هر 50-100 درخواست — برای Amazon، eBay (حفاظت متوسط)
- هر 200-500 درخواست — برای پلتفرمهای کمتر محافظتشده
مهم: از چرخش بیش از حد مکرر (هر 1-2 دقیقه یا هر درخواست) استفاده نکنید — این میتواند مشکوک به نظر برسد. یک کاربر عادی هر دقیقه آدرس IP خود را تغییر نمیدهد. تعادل بهینه — 5-15 دقیقه یا 20-100 درخواست به ازای هر IP.
رویکرد ترکیبی (توصیه میشود):
چرخش بر اساس زمان را به عنوان روش اصلی تنظیم کنید، اما محدودیت درخواست را به عنوان حفاظت اضافی اضافه کنید. به عنوان مثال: IP هر 10 دقیقه یا پس از 50 درخواست تغییر میکند — هر کدام زودتر اتفاق بیفتد. این از افزایش تصادفی فعالیت محافظت میکند.
| مارکتپلیس | چرخش توصیهشده | حداکثر درخواست/IP |
|---|---|---|
| Wildberries | 5-10 دقیقه | 15-30 درخواست |
| Ozon | 7-12 دقیقه | 20-40 درخواست |
| Amazon | 10-15 دقیقه | 50-100 درخواست |
| Яндекс.Маркет | 15-20 دقیقه | 100-200 درخواست |
| Авито | 10-15 دقیقه | 30-60 درخواست |
ویژگیهای نظارت در مارکتپلیسهای مختلف
هر مارکتپلیس ویژگیهای خاص خود را در حفاظت از پارسینگ دارد و نیاز به رویکرد فردی برای تنظیم نظارت stock availability دارد. ویژگیهای کار با پلتفرمهای محبوب روسی و بینالمللی را بررسی میکنیم.
Wildberries
Wildberries یکی از تهاجمیترین سیستمهای حفاظت در برابر پارسینگ در میان مارکتپلیسهای روسی دارد. پلتفرم از بررسی چند سطحی درخواستها استفاده میکند، شامل تجزیه و تحلیل هدرها، کوکیها، فرکانس مراجعات و الگوهای رفتاری.
ویژگیهای کلیدی:
- استفاده از پروکسی مسکونی الزامی است — دیتاسنترها تقریباً فوراً مسدود میشوند
- لازم است مجموعه کاملی از هدرهای مرورگر، از جمله Referer و Accept-Language ارسال شود
- API Wildberries برای برخی درخواستها به توکنهای خاص نیاز دارد
- تغییر مکرر IP (هر 5-10 دقیقه) بسیار مهم است
- تاخیرهای تصادفی بین درخواستها اضافه کنید: 2-5 ثانیه
برای نظارت بر موجودی کالا در Wildberries از API عمومی یا پارس کارتهای محصول استفاده کنید. API پایدارتر است، اما محدودیتهای سختی دارد. هنگام پارس HTML حتماً رفتار مرورگر واقعی را شبیهسازی کنید: تصاویر را بارگذاری کنید، JavaScript را اجرا کنید، کوکیها را بین درخواستها ذخیره کنید.
Ozon
Ozon از حفاظت کمتر تهاجمی نسبت به Wildberries استفاده میکند، اما همچنان نیاز به رویکرد دقیق دارد. پلتفرم به طور فعال از Cloudflare برای محافظت در برابر رباتها استفاده میکند که سطح اضافی از پیچیدگی را اضافه میکند.
- پروکسی مسکونی توصیه میشود، اما دیتاسنترهای با کیفیت میتوانند با فرکانس پایین درخواست کار کنند
- چالش Cloudflare نیاز به اجرای JavaScript دارد — از مرورگرهای headless یا کتابخانههای خاص استفاده کنید
- چرخش IP هر 10-15 دقیقه معمولاً کافی است
- تاخیرها بین درخواستها: 3-7 ثانیه
- حتماً کوکیها را پس از عبور از Cloudflare ذخیره کنید
Amazon
Amazon سیستم پیچیدهای از حفاظت دارد که پارامترهای زیادی از درخواستها را تجزیه و تحلیل میکند. پلتفرم به ویژه به فرکانس مراجعات و موقعیت جغرافیایی آدرسهای IP حساس است.
- از پروکسی مسکونی از همان کشور مارکتپلیس هدف استفاده کنید (amazon.com — ایالات متحده، amazon.de — آلمان)
- Amazon اغلب در صورت فعالیت مشکوک کپچا نشان میدهد — سیستم حل آن را آماده کنید
- چرخش IP هر 15-20 دقیقه یا هر 50-100 درخواست
- تاخیرها بین درخواستها: 5-10 ثانیه (Amazon به سرعت بسیار حساس است)
- حتماً از User-Agent بهروز مرورگرهای محبوب استفاده کنید
Авито
Авито ویژگی خاصی دارد — اتصال جغرافیایی آگهیها. برای نظارت صحیح بر موجودی کالا در یک شهر خاص، پروکسی دقیقاً از همان منطقه لازم است.
- از پروکسی مسکونی با موقعیت جغرافیایی در شهر مورد نیاز استفاده کنید
- Авито نتایج متفاوتی برای مناطق مختلف نشان میدهد — یک IP فقط میتواند بخشی از آگهیها را ببیند
- چرخش هر 10-15 دقیقه کافی است
- تاخیرها بین درخواستها: 3-5 ثانیه
- پلتفرم از کوکیها برای ردیابی نشستها استفاده میکند — حتماً آنها را ذخیره کنید
توصیههای عمومی برای همه مارکتپلیسها:
- همیشه تاخیرهای تصادفی اضافه کنید — از فواصل ثابت استفاده نکنید
- رفتار کاربر واقعی را شبیهسازی کنید: انتقال از صفحه اصلی، مشاهده دستهبندیها
- User-Agent را همراه با آدرسهای IP چرخش دهید
- کوکیها و session storage را بین درخواستها ذخیره کنید
- کدهای پاسخ را نظارت کنید: 429 (Too Many Requests) — سیگنال کاهش فرکانس
محدودیتهای درخواست و تاخیرها بین بررسیها
تنظیم صحیح فرکانس درخواستها — تعادل بین بهروز بودن دادهها و خطر مسدودسازی است. بررسیهای بیش از حد مکرر منجر به مسدودسازی میشود، بررسیهای بیش از حد نادر — به از دست دادن مزیت رقابتی. بیایید ببینیم چگونه فرکانس بهینه را برای سناریوهای مختلف پیدا کنیم.
تاخیرهای توصیهشده بین درخواستها به یک محصول:
| سناریو | فرکانس بررسی | کاربرد |
|---|---|---|
| محصولات حیاتی | هر 5-10 دقیقه | موقعیتهای برتر، محصولات با رقابت بالا، پیشنهادهای تبلیغاتی |
| نظارت استاندارد | هر 30-60 دقیقه | مجموعه اصلی، نظارت منظم بر رقبا |
| نظارت پسزمینه | هر 2-6 ساعت | کاتالوگ بزرگ محصولات، تحلیل کلی بازار |
| نظارت آرشیوی | 1-2 بار در روز | دادههای تاریخی، تحلیل بلندمدت |
تاخیرها بین درخواستهای متوالی (هنگام پارس چندین محصول پشت سر هم):
- حداقل تاخیر: 2-3 ثانیه — حداقل مطلق برای شبیهسازی رفتار انسانی. یک کاربر واقعی نمیتواند کارتهای محصول را سریعتر باز کند.
- تاخیر بهینه: 4-7 ثانیه — برای اکثر وظایف توصیه میشود. تصادفی بودن اضافه کنید: random(4000, 7000) میلیثانیه.
- تاخیر ایمن: 8-15 ثانیه — برای پلتفرمهای به ویژه محافظتشده یا پس از دریافت هشدار در مورد تجاوز از محدودیتها استفاده کنید.
اصل مهم — تصادفی بودن: هرگز از فواصل ثابت استفاده نکنید. به جای تاخیر دقیقاً 5 ثانیه، تصادفی از 4 تا 6 ثانیه ایجاد کنید. این برای شبیهسازی رفتار انسانی بسیار مهم است. کاربران واقعی با منظم بودن کامل کلیک نمیکنند.
توصیه عملی: با تنظیمات محافظهکارانه شروع کنید (تاخیرهای بزرگ، چرخش نادر)، سپس به تدریج فرکانس درخواستها را افزایش دهید و کدهای پاسخ را رصد کنید. اگر شروع به دریافت 429 (Too Many Requests) یا 403 (Forbidden) کردید — فوراً بار را کاهش دهید و تاخیرها را افزایش دهید.
توزیع بار بر اساس زمان روز:
مارکتپلیسها ساعات اوج بار دارند (معمولاً عصر 18:00-22:00)، زمانی که سیستمهای حفاظتی به ویژه حساس هستند. توصیه میشود فرکانس درخواستها را در این دورهها کاهش دهید یا اصلاً در نظارت مکث کنید، اگر دادهها حیاتی نیستند.
ابزارهای آماده برای نظارت از طریق پروکسی
برای نظارت بر stock availability لازم نیست پارسر را از ابتدا بنویسید. راهحلهای آماده زیادی وجود دارد که از کار از طریق پروکسی پشتیبانی میکنند و مکانیسمهای داخلی حفاظت در برابر مسدودسازی دارند. ابزارهای محبوب برای سطوح مختلف آمادگی فنی را بررسی میکنیم.
سرویسهای SaaS آماده (بدون برنامهنویسی)
1. Keepa (برای Amazon)
سرویس تخصصی برای نظارت بر Amazon. قیمتها، موجودی کالا، رتبهبندیها را ردیابی میکند. سیستم پروکسی داخلی دارد، نیاز به دانش فنی ندارد. منفی — فقط با Amazon کار میکند.
2. Parsehub
پارسر بصری که امکان تنظیم جمعآوری داده از طریق رابط گرافیکی را میدهد. از تنظیم پروکسی، چرخش IP، تاخیرها بین درخواستها پشتیبانی میکند. برای کاربران بدون مهارت برنامهنویسی مناسب است.
3. Octoparse
مشابه Parsehub با قابلیتهای پیشرفتهتر خودکارسازی. قالبهای داخلی برای مارکتپلیسهای محبوب، از جمله Amazon، eBay دارد. از اجرای ابری وظایف و چرخش خودکار پروکسی پشتیبانی میکند.
راهحلهای نرمافزاری (نیاز به تنظیم دارند)
1. Scrapy (Python)
فریمورک قدرتمند برای پارسینگ در Python. پشتیبانی داخلی از پروکسی، middleware برای چرخش، مدیریت خطا دارد. نیاز به مهارت برنامهنویسی دارد، اما حداکثر انعطافپذیری تنظیم را میدهد.
مثال تنظیم پروکسی در Scrapy در فایل settings.py قرار دارد — middleware برای چرخش و لیست سرورهای پروکسی را اضافه میکنید. فریمورک به طور خودکار درخواستها را بین IPهای موجود توزیع میکند.
2. Puppeteer / Playwright (JavaScript)
مرورگرهای Headless برای خودکارسازی Chrome/Firefox. برای پارس سایتها با JavaScript و حفاظت پیچیده ایدهآل هستند. از تنظیم پروکسی در سطح مرورگر، شبیهسازی رفتار واقعی کاربر پشتیبانی میکنند.
3. Selenium
ابزار کلاسیک خودکارسازی مرورگرها. کندتر از Puppeteer کار میکند، اما راهحلها و مثالهای آماده بیشتری دارد. برای توسعهدهندگان مبتدی مناسب است.
راهحلهای تخصصی برای مارکتپلیسها
1. МойСклад (یکپارچگی با Wildberries، Ozon)
سیستم حسابداری با یکپارچگی داخلی با مارکتپلیسهای روسی. به طور خودکار موجودی را همگامسازی میکند، اما فقط از طریق API رسمی کار میکند — برای نظارت بر رقبا مناسب نیست.
2. Mpstats
سرویس تحلیلی برای Wildberries و Ozon. دادههای محصولات، قیمتها، موجودی را جمعآوری میکند. زیرساخت پروکسی خاص خود را دارد، نیاز به تنظیم اضافی ندارد. پولی، اما پایدار است.
3. SellerFox
راهحل جامع برای فروشندگان در مارکتپلیسهای روسی. شامل نظارت بر رقبا، تحلیل، خودکارسازی قیمتها. از طریق پروکسیهای خود کار میکند.
چگونه ابزار را انتخاب کنیم:
- بدون مهارت برنامهنویسی — از سرویسهای SaaS (Parsehub، Octoparse) یا راهحلهای تخصصی (Mpstats) استفاده کنید
- مهارتهای پایه کد وجود دارد — Scrapy یا Puppeteer کنترل بیشتر و هزینههای کمتر میدهند
- نیاز به حداکثر انعطافپذیری — راهحل خود را در Python یا Node.js بنویسید
- فقط یک مارکتپلیس — به دنبال ابزار تخصصی باشید (Keepa برای Amazon، Mpstats برای Wildberries)
راهاندازی گامبهگام پروکسی برای پارسر
تنظیم عملی پروکسی برای نظارت بر stock availability را به عنوان مثال یک سناریوی معمولی بررسی میکنیم: نظارت بر 100 محصول در Wildberries با بررسی هر 30 دقیقه. دستورالعمل برای اکثر پارسرهای آماده و راهحلهای سفارشی مناسب است.
مرحله 1: انتخاب و خرید پروکسی
برای Wildberries پروکسی مسکونی لازم است. تعداد لازم را محاسبه میکنیم:
- 100 محصول × 2 بررسی در ساعت = 200 درخواست/ساعت
- محدودیت ایمن برای Wildberries: 20 درخواست به ازای هر IP
- لازم است: 200 ÷ 20 = حداقل 10 آدرس IP
توصیه میشود با ذخیره بگیرید: 15-20 IP برای کار پایدار. هنگام خرید پروکسی مطمئن شوید که ارائهدهنده از چرخش بر اساس زمان یا درخواست پشتیبانی میکند.
مرحله 2: دریافت دادهها برای اتصال
پس از خرید دادهها را در قالب زیر دریافت خواهید کرد:
هاست: proxy.example.com
پورت: 8080
نام کاربری: user123
رمز عبور: pass456
نوع: HTTP/HTTPS یا SOCKS5
برخی ارائهدهندگان URL برای چرخش خودکار ارائه میدهند:
http://user123:[email protected]:8080
این URL را میتوان مستقیماً در اکثر پارسرها استفاده کرد — سرور پروکسی خود IP را طبق تنظیمات تغییر خواهد داد.
مرحله 3: تنظیم در ابزار آماده (Octoparse)
1. تنظیمات وظیفه پارسینگ را باز کنید
در Octoparse به بخش "Advanced Options" → "Proxy Settings" بروید
2. دادههای پروکسی را وارد کنید:
- Proxy Type: HTTP یا SOCKS5 را انتخاب کنید (بسته به پروکسی شما)
- Server: proxy.example.com
- Port: 8080
- Username: user123
- Password: pass456
3. چرخش را تنظیم کنید:
اگر ارائهدهنده شما از چرخش خودکار پشتیبانی میکند — فقط گزینه "Use rotating proxy" را فعال کنید. اگر نه — لیست IP را به صورت دستی اضافه کنید و "Rotate IP addresses" را با فاصله 10 دقیقه فعال کنید.
4. تاخیرها را تنظیم کنید:
در بخش "Speed Settings" تاخیر بین درخواستها را تنظیم کنید: 4-7 ثانیه (Random delay between 4000 and 7000 ms).
مرحله 4: تست تنظیمات
قبل از راهاندازی نظارت کامل حتماً تنظیمات را تست کنید:
- اتصال به پروکسی را بررسی کنید — اکثر ابزارها دکمه "Test connection" دارند
- پارس 5-10 محصول را راهاندازی کنید — مطمئن شوید که دادهها به درستی جمعآوری میشوند
- لاگها را برای خطاها بررسی کنید — کدهای 403، 429، 503 از مشکلات با پروکسی یا فرکانس بیش از حد بالا خبر میدهند
- مطمئن شوید که IP تغییر میکند — در لاگها باید آدرسهای مختلف طبق تنظیمات چرخش ظاهر شوند
مهم: چند ساعت اول کار، لاگهای پارسر را با دقت نظارت کنید. اگر خطاهای مکرر یا مسدودسازیها را میبینید — تاخیرها بین درخواستها و فرکانس چرخش IP را افزایش دهید. بهتر است دادهها را کندتر اما پایدار دریافت کنید تا اینکه سریع مسدود شوید.
مرحله 5: نظارت و بهینهسازی
پس از راهاندازی به طور منظم بررسی کنید:
- Success rate — درصد درخواستهای موفق باید بالاتر از 95% باشد
- کدهای پاسخ — اگر 429 یا 503 بیش از 5% ظاهر میشوند — بار را کاهش دهید
- سرعت کار پروکسی — اگر تاخیرها بیش از 2-3 ثانیه است، شاید ارزش تغییر ارائهدهنده را داشته باشد
- بهروز بودن دادهها — دادههای دریافتی را با دادههای واقعی در سایت مارکتپلیس مقایسه کنید
به تدریج تنظیمات را بهینه کنید: اگر همه چیز یک هفته به طور پایدار کار میکند، میتوانید کمی فرکانس بررسیها را افزایش دهید یا تاخیرها را کاهش دهید. اما این کار را به تدریج، گام به گام انجام دهید.
اشتباهات رایج و چگونگی جلوگیری از آنها
حتی با تنظیم صحیح پروکسی، مبتدیان اغلب اشتباهاتی مرتکب میشوند که منجر به مسدودسازی یا کار ناپایدار پارسر میشود. رایجترین مشکلات و راههای حل آنها را بررسی میکنیم.
اشتباه 1: استفاده از یک User-Agent برای همه درخواستها
مشکل: پارسر همه درخواستها را با یک هدر User-Agent یکسان ارسال میکند، حتی هنگام تغییر IP. این مشکوک به نظر میرسد — یک "مرورگر" یکسان از آدرسهای مختلف ظاهر میشود.
راهحل: User-Agent را همراه با آدرسهای IP چرخش دهید. لیستی از مرورگرهای محبوب (Chrome، Firefox، Safari نسخههای مختلف) ایجاد کنید و هنگام هر تغییر پروکسی به صورت تصادفی از آن انتخاب کنید. اکثر کتابخانهها برای پارسینگ پشتیبانی داخلی از چرخش User-Agent دارند.
اشتباه 2: چرخش بیش از حد مکرر IP
مشکل: برخی تغییر IP را پس از هر درخواست تنظیم میکنند و فکر میکنند این حداکثر ایمنی است. در واقع این غیرطبیعی به نظر میرسد — کاربران واقعی هر ثانیه IP را تغییر نمیدهند.
راهحل: از فواصل معقول چرخش استفاده کنید: 5-15 دقیقه یا 20-100 درخواست به ازای هر IP. این رفتار کاربر واقعی را شبیهسازی میکند که مدتی از یک دستگاه استفاده میکند، سپس تغییر میدهد.
اشتباه 3: نادیده گرفتن کوکیها
مشکل: پارسر درخواستها را بدون ذخیره کوکیها بین آنها انجام میدهد. مارکتپلیسها از کوکیها برای ردیابی نشستها استفاده میکنند — اگر آنها را ذخیره نکنید، هر درخواست به عنوان یک نشست جدید به نظر میرسد.
راهحل: همیشه کوکیها را پس از اولین درخواست ذخیره کنید و در درخواستهای بعدی ارسال کنید. هنگام تغییر IP یک نشست جدید با کوکیهای جدید ایجاد کنید — این یک کاربر جدید را شبیهسازی میکند.
اشتباه 4: تاخیرهای ثابت بین درخواستها
مشکل: تاخیر دقیقاً 5 ثانیه بین همه درخواستها تنظیم شده است. این یک الگوی کامل ایجاد میکند که به راحتی توسط سیستمهای ضد ربات شناسایی میشود.
راهحل: از تاخیرهای تصادفی در یک محدوده استفاده کنید. به جای 5 ثانیه، random(4, 7) ثانیه ایجاد کنید. گاهی اوقات مکثهای طولانیتر (10-20 ثانیه) اضافه کنید و حواسپرتی کاربر را شبیهسازی کنید.
اشتباه 5: استفاده از پروکسیهای عمومی ارزان
مشکل: تلاش برای صرفهجویی در پروکسی با استفاده از لیستهای عمومی رایگان یا بسیار ارزان. این IPها قبلاً در اکثر مارکتپلیسها مسدود شدهاند، زیرا توسط هزاران پارسر دیگر استفاده میشوند.
راهحل: در پروکسیهای مسکونی با کیفیت از ارائهدهندگان قابل اعتماد سرمایهگذاری کنید. این پایه کار پایدار است. صرفهجویی در پروکسی منجر به از دست دادن زمان در مبارزه با مسدودسازیها و از دست دادن احتمالی دادهها میشود.
اشتباه 6: عدم مدیریت خطاها
مشکل: پارسر خطاها را مدیریت نمیکند و حتی پس از دریافت 429 (Too Many Requests) یا 503 (Service Unavailable) به بمباران سرور با درخواستها ادامه میدهد.
راهحل: مدیریت هوشمند خطاها را پیادهسازی کنید:
- هنگام دریافت 429 — تاخیرها را 2 برابر افزایش دهید و IP را تغییر دهید
- هنگام دریافت 503 — مکث 5-10 دقیقهای ایجاد کنید
- هنگام دریافت 403 — فوراً IP را تغییر دهید و تنظیمات را بررسی کنید
- از exponential backoff استفاده کنید: در صورت خطاهای مکرر، مکث را به صورت نمایی افزایش دهید
چکلیست قبل از راهاندازی نظارت:
- ✅ از پروکسیهای مسکونی با کیفیت استفاده میشود
- ✅ چرخش IP هر 5-15 دقیقه تنظیم شده است
- ✅ چرخش User-Agent فعال است
- ✅ کوکیها بین درخواستها ذخیره میشوند
- ✅ تاخیرهای تصادفی بین درخواستها (4-7 ثانیه) تنظیم شده است
- ✅ مدیریت خطاها پیادهسازی شده است
- ✅ تست اولیه با 5-10 محصول انجام شده است
نتیجهگیری
نظارت موفق بر موجودی کالا از طریق پروکسی نیاز به رویکرد جامع دارد: انتخاب صحیح نوع پروکسی، تنظیم دقیق چرخش IP، رعایت تاخیرها بین درخواستها و شبیهسازی رفتار کاربر واقعی. پروکسیهای مسکونی بهترین انتخاب برای اکثر مارکتپلیسها هستند، به ویژه برای پلتفرمهای با حفاظت سخت مانند Wildberries و Ozon.
نکات کلیدی برای نظارت پایدار:
- با تنظیمات محافظهکارانه شروع کنید و به تدریج بهینهسازی کنید
- همیشه از تاخیرهای تصادفی استفاده کنید، نه فواصل ثابت
- User-Agent را همراه با IP چرخش دهید
- کوکیها و session storage را بین درخواستها ذخیره کنید
- کدهای پاسخ را نظارت کنید و به سرعت به خطاها واکنش نشان دهید
- در پروکسیهای با کیفیت سرمایهگذاری کنید — این پایه کار پایدار است
با رعایت این توصیهها، میتوانید سیستم نظارت قابل اعتمادی ایجاد کنید که ماهها بدون مسدودسازی کار خواهد کرد و به شما دادههای بهروز در مورد موجودی رقبا ارائه میدهد. این به شما امکان میدهد تصمیمات آگاهانه در مورد قیمتگذاری، خریدها و استراتژی فروش بگیرید.