마켓플레이스에서 판매하거나 인터넷 쇼핑몰을 운영하고 있다면, 경쟁사의 가격이 하루에 여러 번 변동한다는 것을 알고 계실 것입니다. 수동 모니터링은 잃어버린 시간과 놓친 수익을 의미합니다. 데이터 자동 수집은 이 문제를 해결하지만, 사이트와 마켓플레이스는 파서를 적극적으로 차단합니다. 이 글에서는 가격 모니터링을 설정하는 방법을 설명하여 귀하의 요청이 결코 발견되거나 차단되지 않도록 합니다.
사이트가 가격 모니터링을 차단하는 이유와 발견 방법
모니터링을 설정하기 전에 사이트의 보호 논리를 이해하는 것이 중요합니다. 마켓플레이스와 인터넷 쇼핑몰은 경쟁사들이 그들의 가격을 추적하고 싶어한다는 것을 잘 알고 있으며, 이를 적극적으로 저지합니다. 보호는 여러 수준에서 동시에 작동합니다.
요청 빈도 분석
일반 소비자는 몇 분 또는 몇 시간마다 상품 페이지에 접속합니다. 파서는 한 IP 주소에서 분당 수백 개의 요청을 합니다. 안티봇 시스템(Cloudflare, Imperva, DataDome)은 이러한 비정상적인 현상을 즉시 감지하고 IP를 차단합니다. 따라서 자동 데이터 수집 시 하나의 주소로 작업하는 것은 거의 불가능합니다.
IP 주소 소속 확인
각 IP 주소는 고유한 이력과 소속을 가지고 있습니다. 데이터 센터의 주소(AWS, Google Cloud, Hetzner)는 데이터베이스를 통해 쉽게 식별됩니다 — 사이트는 이러한 주소에서 봇과 파서가 작동한다는 것을 알고 있으며, 문턱에서 차단합니다. 실제 가정 사용자가 소유한 레지던스 IP는 훨씬 적은 의심을 받습니다.
행동 분석
현대의 보호 시스템은 IP뿐만 아니라 행동도 분석합니다: 스크롤 속도, 마우스 움직임, 행동 간의 간격, 페이지 리소스 로딩 순서. 요청이 엄격한 일정에 따라 이루어지고, 임의의 간격 없이 진행된다면 — 이는 차단 신호입니다.
지리적 제한
일부 플랫폼은 지역에 따라 다른 가격을 표시합니다. 예를 들어, Wildberries는 모스크바와 노보시비르스크에 대해 서로 다른 가격을 표시할 수 있습니다. 특정 지역의 가격을 모니터링하는 경우, 귀하의 프록시는 해당 지역의 IP를 가져야 합니다 — 그렇지 않으면 관련 없는 데이터를 얻게 됩니다.
알아두어야 할 사항:
Wildberries와 Ozon은 여러 수준의 보호를 동시에 사용합니다. 단순한 프록시만으로는 부족하며, 올바른 회전, 정확한 요청 헤더 및 파싱 도구의 적절한 설정이 필요합니다.
가격 모니터링에 적합한 프록시: 유형 비교
모든 프록시가 가격 모니터링에 똑같이 유용한 것은 아닙니다. 선택은 모니터링할 사이트, 데이터 업데이트 빈도 및 할당할 예산에 따라 달라집니다. 각 유형을 자세히 살펴보겠습니다.
| 프록시 유형 | 신뢰 수준 | 속도 | 최적의 용도 | 비용 |
|---|---|---|---|---|
| 레지던스 | 매우 높음 | 중간 | Wildberries, Ozon, 보호된 사이트 | 중간 — 높음 |
| 모바일 | 최대 | 중간 | 강력한 보호가 있는 플랫폼, 모바일 버전 사이트 | 높음 |
| 데이터 센터 | 낮음 | 높음 | 심각한 보호가 없는 사이트, 소규모 상점 | 낮음 |
레지던스 프록시 — 대부분의 작업에 최적의 선택
레지던스 프록시는 실제 가정 사용자의 IP 주소를 사용합니다. 사이트 관점에서 보면, 일반 소비자가 아파트나 사무실에서 접근하는 것처럼 보이므로 의심을 받지 않습니다. 이는 Wildberries, Ozon, Avito 및 대부분의 다른 플랫폼에서 모니터링에 이상적입니다. 주요 장점은 지리적 위치를 선택할 수 있는 가능성입니다: 특정 도시나 지역의 IP를 얻을 수 있어 지역 가격을 정확하게 모니터링하는 데 중요합니다.
회전 레지던스 프록시는 각 요청 시 또는 설정된 간격으로 IP 주소를 자동으로 변경합니다. 이는 하나의 주소가 일시적으로 제한을 받을 경우, 다음 요청이 다른 IP로 전송되어 모니터링이 중단되지 않음을 의미합니다.
모바일 프록시 — 가장 보호가 강한 플랫폼을 위한
모바일 IP는 이동통신사(MTS, Beeline, Megafon)의 주소입니다. 이들은 하나의 독특한 특성을 가지고 있습니다: 하나의 모바일 IP 뒤에는 수천 명의 실제 사용자가 있을 수 있습니다(NAT를 통해). 따라서 사이트는 모바일 주소를 차단하는 경우가 극히 드뭅니다 — 실제 소비자에게 피해를 줄 위험이 너무 높기 때문입니다. 공격적인 안티봇 보호가 있는 플랫폼을 모니터링하고 레지던스 프록시가 주기적으로 차단된다면 — 모바일로 전환하세요.
데이터 센터 프록시 — 간단한 작업에만 사용
데이터 센터 프록시는 빠르게 작동하고 저렴하지만 쉽게 인식됩니다. 대부분의 주요 마켓플레이스는 몇 분의 집중 작업 후에 이들을 차단합니다. 이들은 심각한 보호가 없는 소규모 인터넷 쇼핑몰 모니터링이나 파싱 схем을 사전 테스트하는 데 적합합니다.
Wildberries, Ozon, Avito 및 기타 플랫폼에서 데이터 수집의 특징
각 주요 플랫폼은 고유한 보호 특징을 가지고 있습니다. 이러한 특징을 이해하면 모니터링을 올바르게 설정하고 자원을 낭비하지 않을 수 있습니다.
Wildberries
Wildberries는 러시아에서 가장 파싱하기 어려운 마켓플레이스 중 하나입니다. 이 플랫폼은 JavaScript를 통해 콘텐츠를 동적으로 로드하는 것을 적극적으로 사용하므로, 단순한 HTTP 요청으로는 가격을 얻을 수 없습니다 — 페이지는 브라우저에 의해 완전히 렌더링되어야 합니다. 또한, WB는 페이지 구조와 API 엔드포인트를 자주 변경하여 파서를 망가뜨립니다.
Wildberries에는 러시아 IP를 가진 회전 레지던스 프록시가 최적입니다. 요청 빈도는 하나의 IP당 3-5초에 한 번 이하로 유지해야 합니다. 또한, 실제 사용자 행동을 모방하는 것이 중요합니다: 임의의 간격, 올바른 브라우저 헤더(User-Agent, Accept-Language).
Ozon
Ozon은 Cloudflare 기반의 보호 시스템과 자체 안티봇 솔루션을 사용합니다. 이 플랫폼은 TLS 핑거프린트(연결의 디지털 지문)를 분석합니다 — 이는 좋은 프록시를 사용하더라도 요청이 실제 브라우저에서 온 것처럼 보이지 않으면 차단될 수 있음을 의미합니다. Ozon에는 브라우저를 완전히 에뮬레이트하는 도구(헤드리스 Chrome, Playwright)를 사용하는 것이 좋으며, 단순한 HTTP 클라이언트는 피해야 합니다.
Avito
Avito는 중간 정도의 보호를 가지고 있지만 데이터 센터 IP를 적극적으로 차단합니다. 러시아 주소를 가진 레지던스 프록시는 안정적으로 작동합니다. Avito의 특징은 지역성입니다: 가격과 광고는 도시마다 크게 다릅니다. 특정 지역의 경쟁사를 모니터링하는 경우, 반드시 해당 지역의 IP를 가진 프록시를 사용해야 하며, 그렇지 않으면 데이터가 관련성이 없게 됩니다.
Yandex.Market 및 기타 집계 사이트
Yandex.Market는 고급 봇 탐지 시스템을 사용합니다 — 회사의 자원을 고려할 때 놀랍지 않습니다. 이 플랫폼은 행동, 요청 빈도 및 연결 특성을 분석합니다. 안정적인 모니터링을 위해서는 요청 간 5-10초의 간격을 두고 회전 레지던스 프록시가 필요합니다.
지리적 위치에 대한 조언:
러시아 마켓플레이스를 모니터링할 때는 항상 러시아 IP를 가진 프록시를 사용하세요. 외국 IP는 다른 가격, 다른 품목을 제공하거나 지리적 위치에서 차단될 수 있습니다.
코드 없이 가격 모니터링을 위한 준비된 도구
코드를 작성하지 않는 사람들에게 좋은 소식은 경쟁사 가격 모니터링을 몇 시간 만에 설정할 수 있는 준비된 서비스와 도구가 있다는 것입니다. 프록시를 연결하고 무엇을 추적할지 지정하기만 하면 됩니다.
전문 가격 모니터링 서비스
Priceva, Competera 및 유사한 러시아 서비스와 같은 플랫폼은 준비된 솔루션을 제공합니다: 경쟁사의 페이지 URL을 추가하고, 검사 일정을 설정하며, 편리한 형식으로 보고서를 받습니다. 이들 중 많은 서비스는 자체 프록시 연결을 지원합니다 — 이는 지리적 위치와 IP 주소의 품질을 제어하고 싶을 때 중요합니다.
No-code 파서: Octoparse, ParseHub, Apify
Octoparse와 ParseHub는 드래그 앤 드롭 인터페이스를 가진 시각적 파서입니다. 페이지의 요소(가격, 상품 이름, 재고)를 "클릭"하기만 하면 도구가 이를 추출하는 방법을 자동으로 파악합니다. 두 도구 모두 표준 형식 host:port:login:password를 통해 프록시 연결을 지원합니다. Apify는 인기 있는 사이트, 특히 마켓플레이스를 위한 준비된 "액터"(템플릿)를 가진 더 강력한 플랫폼입니다.
Google 스프레드시트 + IMPORTXML/IMPORTHTML
간단한 작업을 위해 — 심각한 보호가 없는 10-20 페이지 모니터링 — Google 스프레드시트의 내장 기능을 사용할 수 있습니다. IMPORTXML 및 IMPORTHTML은 웹 페이지의 데이터를 스프레드시트로 직접 가져올 수 있습니다. 단점: 프록시를 지원하지 않으며 단순한 정적 페이지에서만 작동합니다. 마켓플레이스에는 이 방법이 적합하지 않습니다.
수동 모니터링을 위한 안티디텍트 브라우저
다양한 지역에서 가격을 수동으로 주기적으로 확인해야 하는 경우 — 예를 들어, 예카테린부르크의 소비자에게 귀하의 상품이 어떻게 보이는지 확인하려면 — Dolphin Anty, AdsPower 또는 GoLogin과 같은 안티디텍트 브라우저가 유용한 도구가 됩니다. 필요한 지리적 위치로 브라우저의 개별 프로필을 생성하고, 필요한 도시의 IP를 가진 프록시를 연결한 후 경쟁사의 페이지를 열 수 있습니다. 각 프로필은 개별 고유 사용자처럼 보입니다.
모니터링을 위한 프록시 설정 방법: 단계별 안내
인기 있는 모니터링 도구에 프록시를 연결하는 예를 통해 실용적인 설정을 살펴보겠습니다. 원칙은 대부분의 no-code 솔루션에 대해 동일합니다.
1단계: 프록시 데이터 얻기
프록시를 구매한 후, 연결을 위한 데이터(호스트(IP 또는 도메인), 포트, 로그인 및 비밀번호)를 받습니다. 회전 레지던스 프록시의 경우 일반적으로 하나의 엔드포인트가 제공됩니다 — 각 요청 시 IP가 자동으로 변경되는 게이트웨이 주소입니다. 이 데이터를 기록해 두세요 — 다음 단계에서 필요합니다.
2단계: 프로토콜 선택 — HTTP 또는 SOCKS5
대부분의 파싱 도구는 두 프로토콜을 모두 지원합니다. HTTP 프록시는 범용 옵션으로, 모든 도구와 함께 작동합니다. SOCKS5는 더 유연한 프로토콜로, 모든 유형의 트래픽을 지원하며 프록시 사용 사실을 더 잘 숨깁니다. 가격 모니터링을 위해서는 도구가 지원하는 경우 SOCKS5를 추천합니다.
3단계: Octoparse에서 설정하기 (예시)
Octoparse에서 Settings → Proxy Settings 메뉴로 이동합니다. Custom Proxy 모드를 선택합니다. 프록시 데이터를 입력합니다: 호스트, 포트, 로그인, 비밀번호. Test Connection를 클릭하세요 — 도구가 프록시의 작동 여부를 확인하고 새로운 IP 주소를 보여줍니다. 테스트가 성공적으로 완료되면 — 프록시가 연결됩니다. 이제 모든 파서 요청이 이를 통해 전송됩니다.
4단계: 회전 및 지연 설정
이는 매우 중요한 단계로, 많은 사람들이 이 단계를 건너뜁니다. 좋은 프록시를 사용하더라도 공격적인 파싱은 감지될 것입니다. 다음 매개변수를 설정하세요:
- 요청 간 지연: Wildberries와 Ozon의 경우 최소 3-5초, 보호가 덜한 사이트의 경우 1-2초
- IP 회전: 10-20 요청마다 또는 5-10분마다 IP를 변경하세요
- 임의의 간격: 고정된 지연 대신 임의의 간격을 사용하세요 (예: 3초에서 8초 사이)
- User-Agent: 실제 브라우저(Chrome, Firefox)의 최신 User-Agent 문자열을 사용하세요
5단계: 시작 전 테스트
본격적인 모니터링을 시작하기 전에 테스트를 진행하세요: 10-20 페이지의 파싱을 실행하고 모든 데이터가 올바르게 수집되고 차단이 없는지 확인하세요. 일부 요청이 403 오류(접근 금지) 또는 CAPTCHA를 반환하는 경우 — 지연을 늘리고 회전 설정을 확인하세요.
가격 파싱 시 자주 발생하는 오류와 피하는 방법
가격 모니터링과 관련된 대부분의 문제는 동일한 오류로 인해 발생합니다. 가장 일반적인 오류를 살펴보겠습니다.
오류 1: 모든 요청에 하나의 IP 사용
좋은 레지던스 IP가 있더라도 — 연속으로 수백 개의 요청에 사용하지 마세요. 짧은 시간에 너무 많은 요청을 하는 IP는 차단됩니다. 회전 프록시 또는 여러 IP 주소의 풀을 사용하여 부하를 분산하세요.
오류 2: 지리적 위치 무시
경쟁사의 가격을 모니터링할 때 모스크바에서 노보시비르스크 또는 독일의 IP를 사용하는 경우 — 잘못된 데이터를 얻게 됩니다. Wildberries, Ozon 및 Avito의 가격과 배송 조건은 지역에 따라 다릅니다. 항상 작업에 맞는 지리적 위치의 프록시를 선택하세요.
오류 3: 너무 높은 요청 빈도
데이터를 최대한 빨리 얻고자 하는 욕구는 파서가 0.1-0.5초마다 요청을 하게 만듭니다. 이러한 활동은 즉시 감지됩니다. 가격은 매초 변동하지 않으며 — 일반적으로 한 시간에 한 번 또는 몇 시간에 한 번 확인하는 것으로 충분합니다. 빈도를 줄이면 모니터링의 안정성이 크게 향상됩니다.
오류 4: 복잡한 플랫폼에 저렴한 데이터 센터 프록시 사용
많은 사람들이 가장 저렴한 데이터 센터 프록시로 시작하고 Wildberries가 5분 만에 차단하는 이유에 놀라워합니다. 심각한 마켓플레이스에는 레지던스 또는 모바일 프록시가 필요합니다. 프록시에 대한 절약은 차단과의 싸움에서 시간을 잃게 됩니다.
오류 5: 프록시 작동 모니터링 부족
프록시는 일시적으로 작동하지 않거나 높은 지연을 가지거나 오류를 반환할 수 있습니다. 이를 모니터링하지 않으면, 모니터링이 조용히 "고장" 나게 되어 데이터 업데이트가 중단되고 며칠 후에야 이를 알게 됩니다. 도구에서 오류 알림을 설정하거나 주기적으로 수동으로 데이터의 유효성을 확인하세요.
다양한 작업을 위한 모니터링 작업 схемы
자전거를 다시 발명하지 않기 위해, 판매자와 마케터의 일반적인 작업을 위한 구체적인 схемы를 살펴보겠습니다.
Схема 1: Wildberries에서 경쟁사 가격 모니터링 — 판매자를 위한
작업: Wildberries에서 50-100개의 경쟁 상품 가격을 추적하고, 2-4시간마다 업데이트합니다.
도구: 전문 서비스(Priceva 또는 유사) 또는 WB를 위한 준비된 액터가 있는 Apify.
프록시: 러시아 IP를 가진 회전 레지던스 프록시. 부하 분산을 위해 50개의 주소 풀.
설정: 요청 간 5-8초 지연, 임의 간격, 15 요청마다 IP 회전.
결과: 2-4시간마다 경쟁사 가격에 대한 최신 데이터, 가격이 5% 이상 변동 시 자동 알림.
Схема 2: Avito에서 지역 가격 모니터링 — 지역 비즈니스를 위한
작업: 특정 도시(예: 크라스노다르)에서 Avito의 경쟁사 가격을 모니터링하고, 하루에 한 번 업데이트합니다.
도구: Avito를 위한 설정된 템플릿이 있는 Octoparse 또는 ParseHub.
프록시: 특정 도시 또는 지역의 IP를 가진 레지던스 프록시. 중요: IP는 지역 가격을 얻기 위해 필요한 도시와 일치해야 합니다.
설정: 하루에 한 번 실행, 3-5초 지연, 정적 IP(낮은 빈도에서 공격적인 회전 필요 없음).
결과: 귀하의 지역에서 경쟁사 가격에 대한 일일 보고서, Excel 또는 Google 스프레드시트로 내보내기.
Схема 3: 경쟁사의 광고 제안 모니터링 — 마케터를 위한
작업: 경쟁사의 웹사이트와 광고에서 프로모션, 할인 및 특별 제안을 추적합니다.
도구: 웹사이트를 위한 파서(Apify) + 광고 모니터링 도구의 조합.
프록시: 목표 시장의 지리적 위치를 가진 레지던스 프록시. 다양한 지역의 광고를 모니터링하는 경우 — 여러 지역의 프록시가 필요합니다.
설정: 하루에 2-3회 확인, 새로운 세션마다 IP 회전.
결과: 경쟁사의 마케팅 활동에 대한 신속한 정보, 그들의 프로모션에 빠르게 대응할 수 있는 기회.
Схема 4: 해외 마켓플레이스에서 가격 모니터링 — 수입업자를 위한
작업: AliExpress, Amazon, eBay에서 공급자 및 경쟁사의 가격을 추적합니다.
도구: Amazon 및 AliExpress를 위한 준비된 액터가 있는 Apify 또는 전문 모니터링 서비스.
프록시: 목표 마켓플레이스 국가의 IP를 가진 레지던스 프록시(미국의 경우 Amazon, 중국 또는 미국의 경우 AliExpress). 이는 방문자의 국가에 따라 가격이 다를 수 있기 때문에 중요합니다.
설정: 6-12시간마다 업데이트, 5-10초 지연, 20 요청마다 IP 회전.
가격 모니터링 시작 전 체크리스트:
- ✅ 작업에 맞는 프록시 유형 선택 (마켓플레이스를 위한 레지던스)
- ✅ 프록시의 지리적 위치가 목표 시장에 맞음
- ✅ IP 회전 설정 완료
- ✅ 요청 간 지연 설정 완료 (최소 3-5초)
- ✅ 전체 시작 전에 10-20 페이지에서 테스트 완료
- ✅ 오류 또는 가격 변동 시 알림 설정 완료
- ✅ 업데이트 일정 정의 (필요한 만큼만 자주)
결론
경쟁사의 가격을 자동으로 모니터링하는 것은 단순한 편리함이 아니라 경쟁 우위입니다. Wildberries, Ozon, Avito 및 기타 플랫폼에서 가격이 어떻게 변동하는지를 알면 즉각적으로 대응할 수 있습니다: 경쟁사가 가격을 낮출 때 가격을 낮추고, 수요가 높은 시기에 가격을 올리며, 적절한 시기에 프로모션을 시작할 수 있습니다. 이러한 모든 것은 판매 및 마진에 직접적인 영향을 미칩니다.
안정적인 모니터링의 핵심은 적절하게 선택된 프록시와 도구의 올바른 설정입니다. 대부분의 러시아 마켓플레이스에 최적의 선택은 러시아 IP를 가진 회전 레지던스 프록시입니다: 이들은 실제 사용자처럼 보이며, 지리적 위치 선택을 지원하고, 공격적인 안티봇 시스템에 의해 차단되지 않습니다.
파서를 특히 강력하게 차단하는 플랫폼에서 작업하거나 최대한의 안정성이 필요한 경우 — 모바일 프록시를 고려하세요: 이들은 차단되는 경우가 극히 드물며, 하나의 모바일 IP 뒤에는 수천 명의 실제 사용자가 있을 수 있습니다.
작은 것부터 시작하세요: 경쟁사의 20-30개의 주요 품목에 대한 모니터링을 설정하고, схем을 테스트하고, 데이터의 안정성을 확인한 후 확장하세요. 올바르게 설정된 가격 모니터링은 첫 달에 이미 투자 비용을 회수할 수 있습니다.