بازگشت به وبلاگ

چگونه نظارت بر موجودی کالاها در بازارهای آنلاین را از طریق پروکسی تنظیم کنیم: راهنمایی برای فروشندگان

راهنمای کامل تنظیم پروکسی برای نظارت بر موجودی کالاها در Wildberries، Ozon، Amazon: چگونه از مسدود شدن جلوگیری کنیم، نوع مناسب پروکسی را انتخاب کنیم و چرخش IP را برای پارسینگ پایدار تنظیم کنیم.

📅۲۰ اسفند ۱۴۰۴

نظارت خودکار بر موجودی کالا (stock availability) یک وظیفه حیاتی برای فروشندگان و خرده‌فروشان است. ردیابی موجودی رقبا در Wildberries، Ozon، Amazon امکان تنظیم سریع قیمت‌ها و خریدها را فراهم می‌کند. اما مارکت‌پلیس‌ها درخواست‌های انبوه از یک IP را به شدت مسدود می‌کنند — بدون پروکسی، پارسر شما پس از 10-50 درخواست مسدود خواهد شد.

در این راهنما، نحوه راه‌اندازی نظارت پایدار stock availability از طریق پروکسی را بررسی می‌کنیم: چه نوع پروکسی را انتخاب کنیم، چگونه چرخش IP را تنظیم کنیم، چه پارامترهای درخواستی استفاده کنیم و چگونه از مسدودسازی در مارکت‌پلیس‌های محبوب جلوگیری کنیم.

چرا مارکت‌پلیس‌ها نظارت بر موجودی کالا را مسدود می‌کنند

مارکت‌پلیس‌ها زیرساخت خود را در برابر پارسینگ با چندین سطح حفاظتی محافظت می‌کنند. وقتی نظارت خودکار بر موجودی کالا را راه‌اندازی می‌کنید، اسکریپت شما صدها یا هزاران درخواست به API یا صفحات وب مارکت‌پلیس ارسال می‌کند. برای پلتفرم، این شبیه یک حمله یا جمع‌آوری ناعادلانه داده به نظر می‌رسد.

روش‌های اصلی شناسایی پارسرها:

  • فرکانس درخواست‌ها از یک IP — اگر از یک آدرس بیش از 100 درخواست در دقیقه بیاید، این نشانه واضحی از ربات است. یک کاربر عادی فیزیکی نمی‌تواند 2-3 کارت محصول را در ثانیه باز کند.
  • عدم وجود کوکی‌ها و تاریخچه نشست — پارسرها اغلب درخواست‌ها را بدون ورود قبلی به صفحه اصلی انجام می‌دهند که خودکارسازی را فاش می‌کند.
  • User-Agent یکسان — اگر همه درخواست‌ها با یک هدر مرورگر یکسان باشند، مشکوک است.
  • الگوهای رفتاری — شمارش متوالی محصولات بر اساس ID، عدم وجود مکث‌های تصادفی، منظم بودن کامل درخواست‌ها.

مسدودسازی در سطح آدرس IP اتفاق می‌افتد. ابتدا مارکت‌پلیس ممکن است کپچا نشان دهد، سپس دسترسی را به طور موقت محدود کند (rate limiting)، و در صورت نقض سیستماتیک — IP را برای چند ساعت یا روز به طور کامل مسدود کند.

مورد واقعی: یک فروشنده در Wildberries نظارت بر 500 محصول رقبا را با بررسی هر 10 دقیقه راه‌اندازی کرد. بدون پروکسی، IP او پس از 2 ساعت کار مسدود شد. پس از انتقال به پروکسی‌های مسکونی با چرخش هر 5 دقیقه، پارسر به مدت 6 ماه بدون هیچ مسدودسازی به طور پایدار کار می‌کند.

چه نوع پروکسی برای پارس stock availability انتخاب کنیم

انتخاب نوع پروکسی مستقیماً بر پایداری نظارت و احتمال مسدودسازی تأثیر می‌گذارد. مارکت‌پلیس‌های مختلف به انواع مختلف آدرس‌های IP واکنش‌های متفاوتی نشان می‌دهند. سه گزینه اصلی و کاربرد آن‌ها برای پارس موجودی کالا را بررسی می‌کنیم.

نوع پروکسی سرعت خطر مسدودسازی چه زمانی استفاده کنیم
پروکسی دیتاسنتر بالا (50-200 میلی‌ثانیه) متوسط پارس انبوه مارکت‌پلیس‌های ساده، بررسی سریع حجم‌های بزرگ
پروکسی مسکونی متوسط (200-800 میلی‌ثانیه) پایین Wildberries، Ozon، Amazon — پلتفرم‌ها با حفاظت سخت
پروکسی موبایل متوسط (300-1000 میلی‌ثانیه) بسیار پایین بررسی‌های بسیار مهم، زمانی که به حداکثر قابلیت اطمینان نیاز است

پروکسی مسکونی — انتخاب بهینه برای اکثر وظایف نظارت stock availability است. آن‌ها از آدرس‌های IP کاربران واقعی خانگی استفاده می‌کنند، بنابراین مارکت‌پلیس‌ها درخواست‌ها را مشروع تلقی می‌کنند. برای Wildberries و Ozon این تقریباً یک الزام است — این پلتفرم‌ها دیتاسنترها را به طور تهاجمی مسدود می‌کنند.

پروکسی دیتاسنتر برای پلتفرم‌های کمتر محافظت‌شده یا زمانی که به حداکثر سرعت پارس نیاز است مناسب هستند. به عنوان مثال، برای نظارت بر مارکت‌پلیس‌های منطقه‌ای یا فروشگاه‌های اینترنتی کوچک. مزیت اصلی — سرعت بالا و پایداری اتصال. اما در پلتفرم‌های بزرگ بیشتر مسدود می‌شوند.

پروکسی موبایل — قابل اطمینان‌ترین، اما گران‌ترین گزینه. از آن‌ها برای محصولات بسیار مهم یا زمانی که پروکسی‌های مسکونی شروع به مسدود شدن می‌کنند استفاده کنید. IP‌های موبایل تقریباً غیرممکن است مسدود شوند، زیرا پشت یک آدرس می‌تواند هزاران کاربر واقعی اپراتور باشند.

توصیه برای انتخاب:

  • Wildberries، Ozon — فقط پروکسی مسکونی یا موبایل
  • Amazon، eBay — پروکسی مسکونی با چرخش
  • Яндекс.Маркет — می‌توان از دیتاسنتر با فرکانس متوسط درخواست استفاده کرد
  • Авито — پروکسی مسکونی با اتصال به شهر مورد نیاز
  • پلتفرم‌های منطقه‌ای — دیتاسنترها معمولاً به خوبی کار می‌کنند

تنظیم چرخش IP: چه زمانی آدرس‌ها را تغییر دهیم

چرخش IP — پارامتر کلیدی برای جلوگیری از مسدودسازی است. تنظیم صحیح فرکانس تغییر آدرس‌ها امکان توزیع بار را به گونه‌ای فراهم می‌کند که از هر IP حداقل تعداد درخواست بیاید و رفتار کاربران عادی را شبیه‌سازی کند.

دو رویکرد اصلی برای چرخش:

1. چرخش بر اساس زمان (Time-based rotation)
آدرس IP پس از یک بازه زمانی مشخص تغییر می‌کند، مستقل از تعداد درخواست‌ها. این یک روش ساده و قابل پیش‌بینی است که برای نظارت منظم با فرکانس ثابت بررسی‌ها مناسب است.

  • هر 5-10 دقیقه — برای نظارت مکرر بر محصولات بسیار مهم (موقعیت‌های برتر، محصولات با رقابت بالا)
  • هر 15-30 دقیقه — حالت استاندارد برای اکثر وظایف نظارت stock availability
  • هر ساعت — برای نظارت پس‌زمینه بر مجموعه بزرگ، زمانی که به فرکانس بالای به‌روزرسانی نیاز نیست

2. چرخش بر اساس درخواست (Request-based rotation)
IP پس از تعداد مشخصی درخواست انجام شده تغییر می‌کند. این روش کنترل دقیق‌تری بر بار هر آدرس می‌دهد.

  • هر 10-20 درخواست — برای Wildberries و Ozon (حفاظت سخت)
  • هر 50-100 درخواست — برای Amazon، eBay (حفاظت متوسط)
  • هر 200-500 درخواست — برای پلتفرم‌های کمتر محافظت‌شده

مهم: از چرخش بیش از حد مکرر (هر 1-2 دقیقه یا هر درخواست) استفاده نکنید — این می‌تواند مشکوک به نظر برسد. یک کاربر عادی هر دقیقه آدرس IP خود را تغییر نمی‌دهد. تعادل بهینه — 5-15 دقیقه یا 20-100 درخواست به ازای هر IP.

رویکرد ترکیبی (توصیه می‌شود):
چرخش بر اساس زمان را به عنوان روش اصلی تنظیم کنید، اما محدودیت درخواست را به عنوان حفاظت اضافی اضافه کنید. به عنوان مثال: IP هر 10 دقیقه یا پس از 50 درخواست تغییر می‌کند — هر کدام زودتر اتفاق بیفتد. این از افزایش تصادفی فعالیت محافظت می‌کند.

مارکت‌پلیس چرخش توصیه‌شده حداکثر درخواست/IP
Wildberries 5-10 دقیقه 15-30 درخواست
Ozon 7-12 دقیقه 20-40 درخواست
Amazon 10-15 دقیقه 50-100 درخواست
Яндекс.Маркет 15-20 دقیقه 100-200 درخواست
Авито 10-15 دقیقه 30-60 درخواست

ویژگی‌های نظارت در مارکت‌پلیس‌های مختلف

هر مارکت‌پلیس ویژگی‌های خاص خود را در حفاظت از پارسینگ دارد و نیاز به رویکرد فردی برای تنظیم نظارت stock availability دارد. ویژگی‌های کار با پلتفرم‌های محبوب روسی و بین‌المللی را بررسی می‌کنیم.

Wildberries

Wildberries یکی از تهاجمی‌ترین سیستم‌های حفاظت در برابر پارسینگ در میان مارکت‌پلیس‌های روسی دارد. پلتفرم از بررسی چند سطحی درخواست‌ها استفاده می‌کند، شامل تجزیه و تحلیل هدرها، کوکی‌ها، فرکانس مراجعات و الگوهای رفتاری.

ویژگی‌های کلیدی:

  • استفاده از پروکسی مسکونی الزامی است — دیتاسنترها تقریباً فوراً مسدود می‌شوند
  • لازم است مجموعه کاملی از هدرهای مرورگر، از جمله Referer و Accept-Language ارسال شود
  • API Wildberries برای برخی درخواست‌ها به توکن‌های خاص نیاز دارد
  • تغییر مکرر IP (هر 5-10 دقیقه) بسیار مهم است
  • تاخیرهای تصادفی بین درخواست‌ها اضافه کنید: 2-5 ثانیه

برای نظارت بر موجودی کالا در Wildberries از API عمومی یا پارس کارت‌های محصول استفاده کنید. API پایدارتر است، اما محدودیت‌های سختی دارد. هنگام پارس HTML حتماً رفتار مرورگر واقعی را شبیه‌سازی کنید: تصاویر را بارگذاری کنید، JavaScript را اجرا کنید، کوکی‌ها را بین درخواست‌ها ذخیره کنید.

Ozon

Ozon از حفاظت کمتر تهاجمی نسبت به Wildberries استفاده می‌کند، اما همچنان نیاز به رویکرد دقیق دارد. پلتفرم به طور فعال از Cloudflare برای محافظت در برابر ربات‌ها استفاده می‌کند که سطح اضافی از پیچیدگی را اضافه می‌کند.

  • پروکسی مسکونی توصیه می‌شود، اما دیتاسنترهای با کیفیت می‌توانند با فرکانس پایین درخواست کار کنند
  • چالش Cloudflare نیاز به اجرای JavaScript دارد — از مرورگرهای headless یا کتابخانه‌های خاص استفاده کنید
  • چرخش IP هر 10-15 دقیقه معمولاً کافی است
  • تاخیرها بین درخواست‌ها: 3-7 ثانیه
  • حتماً کوکی‌ها را پس از عبور از Cloudflare ذخیره کنید

Amazon

Amazon سیستم پیچیده‌ای از حفاظت دارد که پارامترهای زیادی از درخواست‌ها را تجزیه و تحلیل می‌کند. پلتفرم به ویژه به فرکانس مراجعات و موقعیت جغرافیایی آدرس‌های IP حساس است.

  • از پروکسی مسکونی از همان کشور مارکت‌پلیس هدف استفاده کنید (amazon.com — ایالات متحده، amazon.de — آلمان)
  • Amazon اغلب در صورت فعالیت مشکوک کپچا نشان می‌دهد — سیستم حل آن را آماده کنید
  • چرخش IP هر 15-20 دقیقه یا هر 50-100 درخواست
  • تاخیرها بین درخواست‌ها: 5-10 ثانیه (Amazon به سرعت بسیار حساس است)
  • حتماً از User-Agent به‌روز مرورگرهای محبوب استفاده کنید

Авито

Авито ویژگی خاصی دارد — اتصال جغرافیایی آگهی‌ها. برای نظارت صحیح بر موجودی کالا در یک شهر خاص، پروکسی دقیقاً از همان منطقه لازم است.

  • از پروکسی مسکونی با موقعیت جغرافیایی در شهر مورد نیاز استفاده کنید
  • Авито نتایج متفاوتی برای مناطق مختلف نشان می‌دهد — یک IP فقط می‌تواند بخشی از آگهی‌ها را ببیند
  • چرخش هر 10-15 دقیقه کافی است
  • تاخیرها بین درخواست‌ها: 3-5 ثانیه
  • پلتفرم از کوکی‌ها برای ردیابی نشست‌ها استفاده می‌کند — حتماً آن‌ها را ذخیره کنید

توصیه‌های عمومی برای همه مارکت‌پلیس‌ها:

  • همیشه تاخیرهای تصادفی اضافه کنید — از فواصل ثابت استفاده نکنید
  • رفتار کاربر واقعی را شبیه‌سازی کنید: انتقال از صفحه اصلی، مشاهده دسته‌بندی‌ها
  • User-Agent را همراه با آدرس‌های IP چرخش دهید
  • کوکی‌ها و session storage را بین درخواست‌ها ذخیره کنید
  • کدهای پاسخ را نظارت کنید: 429 (Too Many Requests) — سیگنال کاهش فرکانس

محدودیت‌های درخواست و تاخیرها بین بررسی‌ها

تنظیم صحیح فرکانس درخواست‌ها — تعادل بین به‌روز بودن داده‌ها و خطر مسدودسازی است. بررسی‌های بیش از حد مکرر منجر به مسدودسازی می‌شود، بررسی‌های بیش از حد نادر — به از دست دادن مزیت رقابتی. بیایید ببینیم چگونه فرکانس بهینه را برای سناریوهای مختلف پیدا کنیم.

تاخیرهای توصیه‌شده بین درخواست‌ها به یک محصول:

سناریو فرکانس بررسی کاربرد
محصولات حیاتی هر 5-10 دقیقه موقعیت‌های برتر، محصولات با رقابت بالا، پیشنهادهای تبلیغاتی
نظارت استاندارد هر 30-60 دقیقه مجموعه اصلی، نظارت منظم بر رقبا
نظارت پس‌زمینه هر 2-6 ساعت کاتالوگ بزرگ محصولات، تحلیل کلی بازار
نظارت آرشیوی 1-2 بار در روز داده‌های تاریخی، تحلیل بلندمدت

تاخیرها بین درخواست‌های متوالی (هنگام پارس چندین محصول پشت سر هم):

  • حداقل تاخیر: 2-3 ثانیه — حداقل مطلق برای شبیه‌سازی رفتار انسانی. یک کاربر واقعی نمی‌تواند کارت‌های محصول را سریع‌تر باز کند.
  • تاخیر بهینه: 4-7 ثانیه — برای اکثر وظایف توصیه می‌شود. تصادفی بودن اضافه کنید: random(4000, 7000) میلی‌ثانیه.
  • تاخیر ایمن: 8-15 ثانیه — برای پلتفرم‌های به ویژه محافظت‌شده یا پس از دریافت هشدار در مورد تجاوز از محدودیت‌ها استفاده کنید.

اصل مهم — تصادفی بودن: هرگز از فواصل ثابت استفاده نکنید. به جای تاخیر دقیقاً 5 ثانیه، تصادفی از 4 تا 6 ثانیه ایجاد کنید. این برای شبیه‌سازی رفتار انسانی بسیار مهم است. کاربران واقعی با منظم بودن کامل کلیک نمی‌کنند.

توصیه عملی: با تنظیمات محافظه‌کارانه شروع کنید (تاخیرهای بزرگ، چرخش نادر)، سپس به تدریج فرکانس درخواست‌ها را افزایش دهید و کدهای پاسخ را رصد کنید. اگر شروع به دریافت 429 (Too Many Requests) یا 403 (Forbidden) کردید — فوراً بار را کاهش دهید و تاخیرها را افزایش دهید.

توزیع بار بر اساس زمان روز:
مارکت‌پلیس‌ها ساعات اوج بار دارند (معمولاً عصر 18:00-22:00)، زمانی که سیستم‌های حفاظتی به ویژه حساس هستند. توصیه می‌شود فرکانس درخواست‌ها را در این دوره‌ها کاهش دهید یا اصلاً در نظارت مکث کنید، اگر داده‌ها حیاتی نیستند.

ابزارهای آماده برای نظارت از طریق پروکسی

برای نظارت بر stock availability لازم نیست پارسر را از ابتدا بنویسید. راه‌حل‌های آماده زیادی وجود دارد که از کار از طریق پروکسی پشتیبانی می‌کنند و مکانیسم‌های داخلی حفاظت در برابر مسدودسازی دارند. ابزارهای محبوب برای سطوح مختلف آمادگی فنی را بررسی می‌کنیم.

سرویس‌های SaaS آماده (بدون برنامه‌نویسی)

1. Keepa (برای Amazon)
سرویس تخصصی برای نظارت بر Amazon. قیمت‌ها، موجودی کالا، رتبه‌بندی‌ها را ردیابی می‌کند. سیستم پروکسی داخلی دارد، نیاز به دانش فنی ندارد. منفی — فقط با Amazon کار می‌کند.

2. Parsehub
پارسر بصری که امکان تنظیم جمع‌آوری داده از طریق رابط گرافیکی را می‌دهد. از تنظیم پروکسی، چرخش IP، تاخیرها بین درخواست‌ها پشتیبانی می‌کند. برای کاربران بدون مهارت برنامه‌نویسی مناسب است.

3. Octoparse
مشابه Parsehub با قابلیت‌های پیشرفته‌تر خودکارسازی. قالب‌های داخلی برای مارکت‌پلیس‌های محبوب، از جمله Amazon، eBay دارد. از اجرای ابری وظایف و چرخش خودکار پروکسی پشتیبانی می‌کند.

راه‌حل‌های نرم‌افزاری (نیاز به تنظیم دارند)

1. Scrapy (Python)
فریم‌ورک قدرتمند برای پارسینگ در Python. پشتیبانی داخلی از پروکسی، middleware برای چرخش، مدیریت خطا دارد. نیاز به مهارت برنامه‌نویسی دارد، اما حداکثر انعطاف‌پذیری تنظیم را می‌دهد.

مثال تنظیم پروکسی در Scrapy در فایل settings.py قرار دارد — middleware برای چرخش و لیست سرورهای پروکسی را اضافه می‌کنید. فریم‌ورک به طور خودکار درخواست‌ها را بین IP‌های موجود توزیع می‌کند.

2. Puppeteer / Playwright (JavaScript)
مرورگرهای Headless برای خودکارسازی Chrome/Firefox. برای پارس سایت‌ها با JavaScript و حفاظت پیچیده ایده‌آل هستند. از تنظیم پروکسی در سطح مرورگر، شبیه‌سازی رفتار واقعی کاربر پشتیبانی می‌کنند.

3. Selenium
ابزار کلاسیک خودکارسازی مرورگرها. کندتر از Puppeteer کار می‌کند، اما راه‌حل‌ها و مثال‌های آماده بیشتری دارد. برای توسعه‌دهندگان مبتدی مناسب است.

راه‌حل‌های تخصصی برای مارکت‌پلیس‌ها

1. МойСклад (یکپارچگی با Wildberries، Ozon)
سیستم حسابداری با یکپارچگی داخلی با مارکت‌پلیس‌های روسی. به طور خودکار موجودی را همگام‌سازی می‌کند، اما فقط از طریق API رسمی کار می‌کند — برای نظارت بر رقبا مناسب نیست.

2. Mpstats
سرویس تحلیلی برای Wildberries و Ozon. داده‌های محصولات، قیمت‌ها، موجودی را جمع‌آوری می‌کند. زیرساخت پروکسی خاص خود را دارد، نیاز به تنظیم اضافی ندارد. پولی، اما پایدار است.

3. SellerFox
راه‌حل جامع برای فروشندگان در مارکت‌پلیس‌های روسی. شامل نظارت بر رقبا، تحلیل، خودکارسازی قیمت‌ها. از طریق پروکسی‌های خود کار می‌کند.

چگونه ابزار را انتخاب کنیم:

  • بدون مهارت برنامه‌نویسی — از سرویس‌های SaaS (Parsehub، Octoparse) یا راه‌حل‌های تخصصی (Mpstats) استفاده کنید
  • مهارت‌های پایه کد وجود دارد — Scrapy یا Puppeteer کنترل بیشتر و هزینه‌های کمتر می‌دهند
  • نیاز به حداکثر انعطاف‌پذیری — راه‌حل خود را در Python یا Node.js بنویسید
  • فقط یک مارکت‌پلیس — به دنبال ابزار تخصصی باشید (Keepa برای Amazon، Mpstats برای Wildberries)

راه‌اندازی گام‌به‌گام پروکسی برای پارسر

تنظیم عملی پروکسی برای نظارت بر stock availability را به عنوان مثال یک سناریوی معمولی بررسی می‌کنیم: نظارت بر 100 محصول در Wildberries با بررسی هر 30 دقیقه. دستورالعمل برای اکثر پارسرهای آماده و راه‌حل‌های سفارشی مناسب است.

مرحله 1: انتخاب و خرید پروکسی

برای Wildberries پروکسی مسکونی لازم است. تعداد لازم را محاسبه می‌کنیم:
- 100 محصول × 2 بررسی در ساعت = 200 درخواست/ساعت
- محدودیت ایمن برای Wildberries: 20 درخواست به ازای هر IP
- لازم است: 200 ÷ 20 = حداقل 10 آدرس IP

توصیه می‌شود با ذخیره بگیرید: 15-20 IP برای کار پایدار. هنگام خرید پروکسی مطمئن شوید که ارائه‌دهنده از چرخش بر اساس زمان یا درخواست پشتیبانی می‌کند.

مرحله 2: دریافت داده‌ها برای اتصال

پس از خرید داده‌ها را در قالب زیر دریافت خواهید کرد:

هاست: proxy.example.com
پورت: 8080
نام کاربری: user123
رمز عبور: pass456
نوع: HTTP/HTTPS یا SOCKS5

برخی ارائه‌دهندگان URL برای چرخش خودکار ارائه می‌دهند:

http://user123:[email protected]:8080

این URL را می‌توان مستقیماً در اکثر پارسرها استفاده کرد — سرور پروکسی خود IP را طبق تنظیمات تغییر خواهد داد.

مرحله 3: تنظیم در ابزار آماده (Octoparse)

1. تنظیمات وظیفه پارسینگ را باز کنید
در Octoparse به بخش "Advanced Options" → "Proxy Settings" بروید

2. داده‌های پروکسی را وارد کنید:

  • Proxy Type: HTTP یا SOCKS5 را انتخاب کنید (بسته به پروکسی شما)
  • Server: proxy.example.com
  • Port: 8080
  • Username: user123
  • Password: pass456

3. چرخش را تنظیم کنید:
اگر ارائه‌دهنده شما از چرخش خودکار پشتیبانی می‌کند — فقط گزینه "Use rotating proxy" را فعال کنید. اگر نه — لیست IP را به صورت دستی اضافه کنید و "Rotate IP addresses" را با فاصله 10 دقیقه فعال کنید.

4. تاخیرها را تنظیم کنید:
در بخش "Speed Settings" تاخیر بین درخواست‌ها را تنظیم کنید: 4-7 ثانیه (Random delay between 4000 and 7000 ms).

مرحله 4: تست تنظیمات

قبل از راه‌اندازی نظارت کامل حتماً تنظیمات را تست کنید:

  • اتصال به پروکسی را بررسی کنید — اکثر ابزارها دکمه "Test connection" دارند
  • پارس 5-10 محصول را راه‌اندازی کنید — مطمئن شوید که داده‌ها به درستی جمع‌آوری می‌شوند
  • لاگ‌ها را برای خطاها بررسی کنید — کدهای 403، 429، 503 از مشکلات با پروکسی یا فرکانس بیش از حد بالا خبر می‌دهند
  • مطمئن شوید که IP تغییر می‌کند — در لاگ‌ها باید آدرس‌های مختلف طبق تنظیمات چرخش ظاهر شوند

مهم: چند ساعت اول کار، لاگ‌های پارسر را با دقت نظارت کنید. اگر خطاهای مکرر یا مسدودسازی‌ها را می‌بینید — تاخیرها بین درخواست‌ها و فرکانس چرخش IP را افزایش دهید. بهتر است داده‌ها را کندتر اما پایدار دریافت کنید تا اینکه سریع مسدود شوید.

مرحله 5: نظارت و بهینه‌سازی

پس از راه‌اندازی به طور منظم بررسی کنید:

  • Success rate — درصد درخواست‌های موفق باید بالاتر از 95% باشد
  • کدهای پاسخ — اگر 429 یا 503 بیش از 5% ظاهر می‌شوند — بار را کاهش دهید
  • سرعت کار پروکسی — اگر تاخیرها بیش از 2-3 ثانیه است، شاید ارزش تغییر ارائه‌دهنده را داشته باشد
  • به‌روز بودن داده‌ها — داده‌های دریافتی را با داده‌های واقعی در سایت مارکت‌پلیس مقایسه کنید

به تدریج تنظیمات را بهینه کنید: اگر همه چیز یک هفته به طور پایدار کار می‌کند، می‌توانید کمی فرکانس بررسی‌ها را افزایش دهید یا تاخیرها را کاهش دهید. اما این کار را به تدریج، گام به گام انجام دهید.

اشتباهات رایج و چگونگی جلوگیری از آن‌ها

حتی با تنظیم صحیح پروکسی، مبتدیان اغلب اشتباهاتی مرتکب می‌شوند که منجر به مسدودسازی یا کار ناپایدار پارسر می‌شود. رایج‌ترین مشکلات و راه‌های حل آن‌ها را بررسی می‌کنیم.

اشتباه 1: استفاده از یک User-Agent برای همه درخواست‌ها

مشکل: پارسر همه درخواست‌ها را با یک هدر User-Agent یکسان ارسال می‌کند، حتی هنگام تغییر IP. این مشکوک به نظر می‌رسد — یک "مرورگر" یکسان از آدرس‌های مختلف ظاهر می‌شود.

راه‌حل: User-Agent را همراه با آدرس‌های IP چرخش دهید. لیستی از مرورگرهای محبوب (Chrome، Firefox، Safari نسخه‌های مختلف) ایجاد کنید و هنگام هر تغییر پروکسی به صورت تصادفی از آن انتخاب کنید. اکثر کتابخانه‌ها برای پارسینگ پشتیبانی داخلی از چرخش User-Agent دارند.

اشتباه 2: چرخش بیش از حد مکرر IP

مشکل: برخی تغییر IP را پس از هر درخواست تنظیم می‌کنند و فکر می‌کنند این حداکثر ایمنی است. در واقع این غیرطبیعی به نظر می‌رسد — کاربران واقعی هر ثانیه IP را تغییر نمی‌دهند.

راه‌حل: از فواصل معقول چرخش استفاده کنید: 5-15 دقیقه یا 20-100 درخواست به ازای هر IP. این رفتار کاربر واقعی را شبیه‌سازی می‌کند که مدتی از یک دستگاه استفاده می‌کند، سپس تغییر می‌دهد.

اشتباه 3: نادیده گرفتن کوکی‌ها

مشکل: پارسر درخواست‌ها را بدون ذخیره کوکی‌ها بین آن‌ها انجام می‌دهد. مارکت‌پلیس‌ها از کوکی‌ها برای ردیابی نشست‌ها استفاده می‌کنند — اگر آن‌ها را ذخیره نکنید، هر درخواست به عنوان یک نشست جدید به نظر می‌رسد.

راه‌حل: همیشه کوکی‌ها را پس از اولین درخواست ذخیره کنید و در درخواست‌های بعدی ارسال کنید. هنگام تغییر IP یک نشست جدید با کوکی‌های جدید ایجاد کنید — این یک کاربر جدید را شبیه‌سازی می‌کند.

اشتباه 4: تاخیرهای ثابت بین درخواست‌ها

مشکل: تاخیر دقیقاً 5 ثانیه بین همه درخواست‌ها تنظیم شده است. این یک الگوی کامل ایجاد می‌کند که به راحتی توسط سیستم‌های ضد ربات شناسایی می‌شود.

راه‌حل: از تاخیرهای تصادفی در یک محدوده استفاده کنید. به جای 5 ثانیه، random(4, 7) ثانیه ایجاد کنید. گاهی اوقات مکث‌های طولانی‌تر (10-20 ثانیه) اضافه کنید و حواس‌پرتی کاربر را شبیه‌سازی کنید.

اشتباه 5: استفاده از پروکسی‌های عمومی ارزان

مشکل: تلاش برای صرفه‌جویی در پروکسی با استفاده از لیست‌های عمومی رایگان یا بسیار ارزان. این IP‌ها قبلاً در اکثر مارکت‌پلیس‌ها مسدود شده‌اند، زیرا توسط هزاران پارسر دیگر استفاده می‌شوند.

راه‌حل: در پروکسی‌های مسکونی با کیفیت از ارائه‌دهندگان قابل اعتماد سرمایه‌گذاری کنید. این پایه کار پایدار است. صرفه‌جویی در پروکسی منجر به از دست دادن زمان در مبارزه با مسدودسازی‌ها و از دست دادن احتمالی داده‌ها می‌شود.

اشتباه 6: عدم مدیریت خطاها

مشکل: پارسر خطاها را مدیریت نمی‌کند و حتی پس از دریافت 429 (Too Many Requests) یا 503 (Service Unavailable) به بمباران سرور با درخواست‌ها ادامه می‌دهد.

راه‌حل: مدیریت هوشمند خطاها را پیاده‌سازی کنید:

  • هنگام دریافت 429 — تاخیرها را 2 برابر افزایش دهید و IP را تغییر دهید
  • هنگام دریافت 503 — مکث 5-10 دقیقه‌ای ایجاد کنید
  • هنگام دریافت 403 — فوراً IP را تغییر دهید و تنظیمات را بررسی کنید
  • از exponential backoff استفاده کنید: در صورت خطاهای مکرر، مکث را به صورت نمایی افزایش دهید

چک‌لیست قبل از راه‌اندازی نظارت:

  • ✅ از پروکسی‌های مسکونی با کیفیت استفاده می‌شود
  • ✅ چرخش IP هر 5-15 دقیقه تنظیم شده است
  • ✅ چرخش User-Agent فعال است
  • ✅ کوکی‌ها بین درخواست‌ها ذخیره می‌شوند
  • ✅ تاخیرهای تصادفی بین درخواست‌ها (4-7 ثانیه) تنظیم شده است
  • ✅ مدیریت خطاها پیاده‌سازی شده است
  • ✅ تست اولیه با 5-10 محصول انجام شده است

نتیجه‌گیری

نظارت موفق بر موجودی کالا از طریق پروکسی نیاز به رویکرد جامع دارد: انتخاب صحیح نوع پروکسی، تنظیم دقیق چرخش IP، رعایت تاخیرها بین درخواست‌ها و شبیه‌سازی رفتار کاربر واقعی. پروکسی‌های مسکونی بهترین انتخاب برای اکثر مارکت‌پلیس‌ها هستند، به ویژه برای پلتفرم‌های با حفاظت سخت مانند Wildberries و Ozon.

نکات کلیدی برای نظارت پایدار:

  • با تنظیمات محافظه‌کارانه شروع کنید و به تدریج بهینه‌سازی کنید
  • همیشه از تاخیرهای تصادفی استفاده کنید، نه فواصل ثابت
  • User-Agent را همراه با IP چرخش دهید
  • کوکی‌ها و session storage را بین درخواست‌ها ذخیره کنید
  • کدهای پاسخ را نظارت کنید و به سرعت به خطاها واکنش نشان دهید
  • در پروکسی‌های با کیفیت سرمایه‌گذاری کنید — این پایه کار پایدار است

با رعایت این توصیه‌ها، می‌توانید سیستم نظارت قابل اعتمادی ایجاد کنید که ماه‌ها بدون مسدودسازی کار خواهد کرد و به شما داده‌های به‌روز در مورد موجودی رقبا ارائه می‌دهد. این به شما امکان می‌دهد تصمیمات آگاهانه در مورد قیمت‌گذاری، خریدها و استراتژی فروش بگیرید.