블로그로 돌아가기

프록시를 이용한 마켓플레이스 트렌드 상품 데이터 수집 방법 (차단 없이)

마켓플레이스에서 트렌드 상품 데이터를 수집하기 위한 프록시 설정에 대한 완벽한 가이드: 어떤 유형의 프록시를 선택할지, 차단을 피하는 방법, 경쟁자 모니터링을 자동화하는 방법.

📅2026년 1월 30일
```html

마켓플레이스에서의 성공은 트렌드에 대한 반응 속도에 직접적으로 의존합니다. 당신이 Wildberries와 Ozon의 카탈로그를 수동으로 스크롤하는 동안, 경쟁자들은 이미 프록시를 통해 데이터 수집을 자동화하여 실시간으로 판매 히트 상품에 대한 정보를 얻고 있습니다. 그러나 마켓플레이스는 적극적으로 파싱을 차단하고 있습니다 — 올바른 프록시 설정이 없으면 플랫폼에 대한 접근을 잃거나 불완전한 데이터를 받을 위험이 있습니다.

이 가이드에서는 트렌드 상품에 대한 자동 데이터 수집 시스템을 설정하는 방법, 다양한 마켓플레이스에 적합한 프록시 유형 선택 및 차단으로 이어지는 일반적인 실수를 피하는 방법을 설명합니다.

마켓플레이스가 파싱을 차단하는 이유와 프록시가 문제를 해결하는 방법

마켓플레이스는 자동 데이터 수집을 방지하기 위해 수백만을 투자합니다. 그 이유는 간단합니다: 파싱은 서버에 부하를 주고 경쟁자가 상업적 정보를 얻을 수 있게 합니다. Wildberries, Ozon 및 기타 플랫폼은 의심스러운 활동을 추적하는 다단계 보호 시스템을 사용합니다.

안티파싱 시스템은 여러 매개변수를 동시에 분석합니다. 한 IP 주소에서 분당 100개의 요청이 들어오면 — 이는 봇의 명백한 징후입니다. 일반 구매자는 이 시간 동안 5-10개의 상품 카드를 봅니다. 또한 브라우저의 User-Agent, 클릭 빈도, 마우스 움직임 및 페이지에 머무는 시간도 추적됩니다.

프록시는 핵심 문제를 해결합니다 — 다양한 IP 주소 간에 요청을 분산시킵니다. 실제 IP에서 1000개의 요청을 보내는 대신, 시스템은 50-100개의 서로 다른 주소에서 각각 10-20개의 요청을 보냅니다. 마켓플레이스에는 이것이 다양한 도시의 일반 사용자 활동처럼 보입니다.

중요: 프록시 사용은 차단으로부터 완전한 보호를 보장하지 않습니다. 올바른 IP 회전을 설정하고, 요청 간의 간격을 유지하며, 실제 사용자 행동을 모방해야 합니다. 이에 대한 자세한 내용은 설정 섹션에서 설명하겠습니다.

상품 데이터 수집을 위한 프록시 유형 선택

마켓플레이스 파싱에는 세 가지 유형의 프록시가 적합하며, 각각의 장점과 제한이 있습니다. 선택은 데이터 양, 예산 및 정보 수집 속도 요구 사항에 따라 달라집니다.

프록시 유형 속도 플랫폼 신뢰도 가격 추천
데이터 센터 프록시 높음 (100+ Mbps) 낮음 (탐지 용이) $1-3/IP부터 고속 회전으로 대량 파싱
주거용 프록시 중간 (20-50 Mbps) 높음 (실제 사용자 IP) $5-15/GB 트래픽부터 보호된 마켓플레이스 파싱 (Wildberries, Ozon)
모바일 프록시 중간 (10-30 Mbps) 최대 (모바일 통신사) $50-100/IP부터 최대 보호를 위한 파싱, 모바일 사이트 버전

데이터 센터 프록시: 속도가 익명성보다 중요할 때

덜 보호된 플랫폼(예: AliExpress 또는 Yandex.Market)에서 대량의 데이터를 빠르게 수집해야 하는 경우, 데이터 센터 프록시가 최적의 선택입니다. 이들은 호스팅 제공자의 서버에서 작동하므로 페이지 로딩 속도가 매우 높습니다.

주요 단점은 마켓플레이스가 데이터 센터 IP를 쉽게 식별할 수 있으며 의심스러운 활동이 감지되면 차단할 수 있다는 것입니다. 해결책은 50-100개의 IP 풀을 사용하고 빠른 회전을 설정하는 것입니다: 10-15개의 요청 후 IP를 변경합니다.

주거용 프록시: 대부분의 작업을 위한 황금 중간

주거용 프록시는 일반 사용자에게 할당된 실제 인터넷 제공업체의 IP 주소를 사용합니다. Wildberries 또는 Ozon의 경우, 이러한 트래픽은 완전히 합법적으로 보입니다 — 마치 모스크바, 상트페테르부르크 또는 카잔의 구매자가 상품을 보고 있는 것처럼 보입니다.

이 유형의 프록시는 트렌드를 정기적으로 모니터링할 때 적합하며, 매일 또는 하루에 여러 번 데이터를 수집할 때 유용합니다. 비용은 트래픽에 따라 계산되며, 10,000개의 상품 카드를 파싱하려면 이미지 및 설명의 양에 따라 약 5-10GB가 필요합니다.

모바일 프록시: 중요한 작업을 위한 최대 보호

모바일 프록시는 이동통신사(MTS, Beeline, MegaFon)의 IP 주소를 사용합니다. 마켓플레이스는 이러한 주소를 차단하는 경우가 매우 드물며, 하나의 IP 뒤에는 수천 명의 실제 사용자가 있을 수 있습니다 — 통신사들은 CGNAT 기술(여러 가입자에 대한 공용 IP)을 사용합니다.

모바일 프록시는 특히 보호가 강한 마켓플레이스의 특정 섹션을 파싱할 때나 다른 유형의 프록시를 사용할 때 차단된 경우에 유용합니다. 또한 Wildberries 및 Ozon의 모바일 애플리케이션에서 데이터를 수집할 때 필수적입니다.

다양한 마켓플레이스의 파싱 특징: Wildberries, Ozon, AliExpress

각 마켓플레이스는 고유한 파싱 방지 시스템을 사용합니다. 이러한 특징을 이해하면 프록시를 최대한 효율적으로 설정하고 차단을 피할 수 있습니다.

Wildberries: 강력한 보호 및 지리적 연관성

Wildberries는 러시아 마켓플레이스 중 가장 진보된 보호 시스템 중 하나를 사용합니다. 이 플랫폼은 요청 빈도뿐만 아니라 행동 요소도 분석합니다: 페이지에서의 시간, 스크롤, 요소 클릭. 성공적인 파싱을 위해서는 실제 사용자의 행동을 모방해야 합니다.

중요한 특징은 가격과 상품 재고의 지리적 연관성입니다. Wildberries는 모스크바, 지역 및 외딴 지역에 대해 다양한 상품을 보여줍니다. 러시아 전역에서 판매를 위한 트렌드 데이터를 수집하는 경우, 다양한 지역의 프록시를 사용해야 합니다: 모스크바, 상트페테르부르크, 예카테린부르크, 노보시비르스크, 크라스노다르.

실용적인 조언: Wildberries를 파싱할 때는 50-100 요청마다 회전하는 주거용 프록시를 사용하세요. 요청 간에 2-5초의 임의 지연을 추가하고 브라우저의 User-Agent를 변경하는 것을 잊지 마세요. 이는 차단 가능성을 최소화합니다.

Ozon: 파트너를 위한 API 및 공개 카탈로그 보호

Ozon은 판매자를 위한 공식 API를 제공하지만, 경쟁자의 데이터에 접근할 수는 없습니다. 트렌드를 분석하기 위해서는 여전히 공개 카탈로그를 파싱해야 합니다. Ozon의 보호는 Wildberries보다 덜 공격적이지만, 플랫폼은 의심스러운 활동에 대해 CAPTCHA를 적극적으로 사용합니다.

Ozon의 특징은 JavaScript를 통한 동적 콘텐츠 로딩입니다. 간단한 HTTP 요청은 작동하지 않으며, JavaScript 지원이 있는 파서(Selenium, Puppeteer) 또는 헤드리스 브라우저가 필요합니다. 이는 프록시에 대한 부하를 증가시키므로, 10,000개의 카드에 대해 최대 15-20GB의 트래픽을 예상해야 합니다.

AliExpress: 지역 제한이 있는 대량 파싱

AliExpress는 사용자 국가에 따라 다양한 가격 및 배송 조건을 보여줍니다. 러시아 판매자에게는 러시아 IP가 있는 프록시를 사용하는 것이 매우 중요합니다 — 그렇지 않으면 다른 지역의 데이터를 받게 되어 트렌드 분석이 왜곡됩니다.

AliExpress의 보호는 파싱에 대해 상대적으로 관대합니다 — 플랫폼은 트래픽에 관심이 있습니다. 중간 회전(100-200 요청마다)으로 데이터 센터 프록시를 사용할 수 있습니다. 중요한 것은 한 IP에서 초당 5-10 요청을 초과하지 않는 것입니다.

트렌드 데이터 수집 자동화를 위한 도구

마켓플레이스 파싱에는 두 가지 접근 방식이 있습니다: 준비된 서비스와 자체 파서 설정. 준비된 솔루션은 더 비싸지만 시간을 절약합니다. 자체 파서는 기술적 지식이 필요하지만 프로세스에 대한 완전한 제어를 제공합니다.

마켓플레이스 파싱을 위한 준비된 서비스

기술적 세부 사항을 이해하고 싶지 않은 사람들을 위해 준비된 플랫폼이 있습니다. 이들은 이미 특정 마켓플레이스에 맞게 설정되어 있으며, 내장된 프록시 시스템과 자동 IP 회전을 갖추고 있습니다.

  • Mpstats — Wildberries 및 Ozon에 특화되어 있으며, 판매, 재고 및 검색 결과 위치에 대한 데이터를 수집합니다. 월 3000 루블부터 시작합니다.
  • SellerFox — Wildberries를 위한 분석 도구로, 트렌드 및 틈새 시장을 추적합니다. 수요가 증가하는 상품을 찾는 데 적합합니다.
  • Moneyplace — Ozon 및 Wildberries에서 경쟁자 모니터링, 가격 및 순위 변동 추적.
  • ParseHub — 모든 사이트에 대한 범용 파서로, 마켓플레이스를 포함합니다. 설정이 필요하지만 모든 플랫폼에서 작동합니다.

준비된 서비스의 주요 단점은 데이터뿐만 아니라 프록시 인프라에 대해서도 비용을 지불해야 한다는 것입니다. 대량 파싱의 경우, 이는 매달 수십만 루블이 될 수 있습니다.

자체 파서 설정: 도구 및 라이브러리

기본적인 기술적 능력이 있거나 팀에 개발자가 있다면, 자체 파싱 시스템을 설정할 수 있습니다. 이는 확장 시 더 저렴하고 프로세스에 대한 완전한 제어를 제공합니다.

인기 있는 파싱 도구:

  • Selenium (Python) — 브라우저 자동화, JavaScript 지원, 프록시 통합 용이. Wildberries 및 Ozon에 적합합니다.
  • Puppeteer (Node.js) — Chrome 기반의 헤드리스 브라우저, Selenium보다 빠르고 메모리 소비가 적습니다.
  • Scrapy (Python) — 파싱을 위한 프레임워크, JavaScript가 없는 간단한 사이트에 적합합니다. 빠르지만 동적 콘텐츠에는 작동하지 않습니다.
  • Playwright (Python/Node.js) — Selenium의 현대적 대안, 모든 브라우저 지원, 프록시와의 내장 작업.

마켓플레이스 파싱에는 Selenium 또는 Playwright를 추천합니다 — 이들은 JavaScript를 올바르게 처리하고 실제 사용자 행동(스크롤, 클릭, 지연)을 모방할 수 있습니다.

상품 파서를 위한 프록시 단계별 설정

올바른 프록시 설정은 성공의 핵심 요소입니다. 최고의 주거용 프록시도 회전을 잘못 설정하거나 요청 한도를 초과하면 차단을 피할 수 없습니다. 인기 있는 도구를 예로 들어 설정 프로세스를 살펴보겠습니다.

단계 1: 프록시 데이터 수집 및 작동 확인

프록시를 구매한 후, 다음 형식의 목록을 받게 됩니다: IP:PORT:LOGIN:PASSWORD. 파서 설정 전에 각 프록시의 작동 여부를 반드시 확인하세요.

가장 간단한 확인 방법은 브라우저를 열고 네트워크 설정에서 프록시를 설정한 후 IP 확인 사이트(예: 2ip.ru 또는 whoer.net)에 접속하는 것입니다. 프록시의 IP가 표시되고 실제 주소가 아닌지 확인하세요. 또한 페이지 로딩 속도를 확인하세요 — 페이지가 5초 이상 걸린다면 프록시가 품질이 좋지 않습니다.

단계 2: 파서에서 프록시 설정 (Selenium 예시)

Selenium을 사용하여 파싱하는 경우, 프록시 설정은 다음과 같이 진행됩니다. 별도의 파일에 프록시 목록을 생성한 후, 파서는 각 세션에 대해 목록에서 임의로 프록시를 선택합니다.

기본 작동 논리는 다음과 같습니다: 파서는 설정된 프록시로 브라우저를 실행하고 50-100개의 요청(상품 카드 보기)을 수행한 후 세션을 종료하고 다른 프록시로 새 세션을 시작합니다. 이는 다양한 사용자 행동을 모방하고 차단 위험을 줄입니다.

단계 3: IP 주소 회전 설정

프록시 회전은 특정 간격으로 IP 주소를 자동으로 변경하는 것입니다. 두 가지 접근 방식이 있습니다: 시간에 따른 회전(5-10분마다)과 요청 수에 따른 회전(50-100 요청마다).

마켓플레이스 파싱에는 요청 수에 따른 회전을 추천합니다 — 이는 더 예측 가능합니다. Wildberries를 파싱하는 경우, 50 요청마다 IP를 변경하세요. 덜 보호된 플랫폼(AliExpress)의 경우, 하나의 IP에 대해 200-300 요청으로 늘릴 수 있습니다.

중요: 일부 프록시 제공업체는 자동 회전을 제공합니다 — 하나의 엔드포인트(주소:포트)를 받고, IP는 각 요청 시 또는 타이머에 따라 자동으로 변경됩니다. 이는 설정을 간소화하지만 프로세스에 대한 제어를 줄입니다.

단계 4: 요청 간 지연 설정

프록시 회전이 있더라도 요청을 연속적으로 보내서는 안 됩니다. 실제 사용자는 상품 카드를 보고, 리뷰를 읽고, 가격을 비교하는 데 시간을 소비합니다. 파서는 이러한 행동을 모방해야 합니다.

다양한 마켓플레이스에 대한 최적의 지연 시간:

  • Wildberries: 요청 간 2-5초, ±1초의 임의 변동
  • Ozon: 3-7초 (빠른 요청 시 CAPTCHA로 인한 지연)
  • AliExpress: 1-3초 (보다 관대한 보호)

고정된 지연이 아닌 임의의 지연을 사용하세요. 각 요청이 정확히 3초 간격으로 이루어진다면 — 이는 봇의 징후입니다. 임의성을 추가하세요: 2초에서 5초 사이의 균등 분포로.

IP 회전 및 요청 한도: 차단을 피하는 방법

올바른 프록시 설정이 있더라도 안티파싱 시스템의 작동 방식을 고려하지 않으면 차단될 수 있습니다. 마켓플레이스는 요청 빈도뿐만 아니라 행동 패턴도 분석합니다.

다양한 유형의 프록시에 대한 요청 한도

각 유형의 프록시는 사용에 대한 안전 한도를 가지고 있습니다. 이러한 한도를 초과하면 차단될 확률이 급격히 증가합니다.

프록시 유형 IP당 시간당 요청 수 IP당 일일 요청 수 추천 회전
데이터 센터 50-100 300-500 10-20 요청마다
주거용 100-200 1000-2000 50-100 요청마다
모바일 200-300 2000-3000 100-200 요청마다

이러한 숫자는 대략적인 것입니다. 실제 한도는 특정 마켓플레이스 및 시간대에 따라 다릅니다. 피크 시간(저녁, 주말)에는 활동을 증가시킬 수 있습니다. 왜냐하면 플랫폼에는 더 많은 실제 사용자가 있기 때문입니다.

다양한 파싱 규모에 대한 회전 전략

회전 전략은 얼마나 많은 데이터를 수집해야 하는지에 따라 다릅니다. 카테고리 내 상위 100개 상품을 모니터링하는 데는 간단한 схем이 충분합니다. 전체 카탈로그(수만 개 항목)를 파싱하려면 더 복잡한 시스템이 필요합니다.

소량 (하루 1000개 이하 상품): 5-10개의 주거용 프록시를 사용하고 100 요청마다 회전하세요. 이는 2-3개 카테고리의 트렌드를 모니터링하는 데 충분합니다.

중간량 (하루 1000-10000개 상품): 20-50개의 주거용 프록시 풀을 사용하고 50 요청마다 회전하세요. 파싱 세션 간에 1-2시간의 임의 지연을 추가하세요.

대량 (하루 10000개 이상 상품): 중요한 요청을 위한 주거용 프록시와 대량 수집을 위한 데이터 센터 프록시의 조합을 사용하세요. 100개 이상의 프록시를 사용하고 공격적인 회전 및 시간에 따른 부하 분산을 적용하세요.

트렌드 분석을 위한 데이터 수집

파싱을 위한 파싱은 의미가 없습니다. 올바른 메트릭을 수집하는 것이 중요하며, 이는 경쟁자가 시장을 포화시키기 전에 트렌드 상품을 식별하는 데 도움이 됩니다.

트렌드 식별을 위한 주요 메트릭

각 상품 카드에 대해 다음 데이터를 수집하세요:

  • 상품 이름 및 아티클 — 식별 및 동향 추적을 위해
  • 가격 (현재 및 할인 가격) — 트렌드는 종종 가격 급락으로 시작됩니다
  • 리뷰 수 — 일주일 간 리뷰 증가가 판매 증가를 나타냅니다
  • 평균 평점 — 평점이 4.5 이상인 상품이 더 빨리 트렌드가 됩니다
  • 주문 수 (가능한 경우) — 수요의 직접적인 지표
  • 재고 수 — 재고 급감 = 수요 증가
  • 주요 검색어에 대한 검색 결과 위치 — 상위 10위 상품이 80%의 클릭을 받습니다
  • 상품 출시일 — 판매가 빠르게 증가하는 신규 상품 = 잠재적 트렌드

이러한 데이터를 매일 수집하고 데이터베이스(PostgreSQL, MySQL) 또는 간단한 프로젝트의 경우 Google Sheets에 저장하세요. 7-14일 동안의 동향 분석이 수요가 증가하는 상품을 보여줄 것입니다.

초기 단계에서 트렌드를 식별하는 방법

성공적인 판매자는 경쟁자보다 먼저 틈새 시장에 진입하기 때문에 트렌드에서 수익을 올립니다. 트렌드에 대한 이야기가 이미 Telegram 채널에 올라오면, 그로 인해 수익을 올리기에는 늦습니다 — 경쟁으로 인해 마진이 감소합니다.

초기 트렌드의 징후:

  • 주간 리뷰 수가 50-100% 증가하는 경우 (기본 10-50 리뷰)
  • 최근 2주 동안 틈새 시장에 5-10명의 새로운 판매자가 등장하는 경우
  • 카테고리 리더의 재고가 급감하는 경우 (1000개 이상에서 100-200개로)
  • 검색 결과 위치의 상승: 상품이 50위에서 10위로 상승하는 경우
  • 소셜 미디어(TikTok, Instagram)에서 상품 언급 — 간접적인 징후

이러한 신호를 감지할 때 자동 알림(텔레그램 봇, 이메일)을 설정하세요. 이는 경쟁자들보다 1-2주 앞서 나갈 수 있는 기회를 제공합니다.

파싱 시 일반적인 실수와 피하는 방법

대부분의 파싱 차단은 동일한 실수로 인해 발생합니다. 가장 흔한 문제와 해결 방법을 살펴보겠습니다.

오류 1: 모든 요청에 대해 하나의 IP 사용

초보자들은 종종 1-2개의 프록시를 구매하고 이를 통해 전체 카탈로그를 파싱하려고 합니다. 결과는 예측 가능합니다 — 한 시간 내에 차단됩니다. 마켓플레이스는 하나의 IP에서 비정상적인 활동을 통해 봇을 쉽게 식별합니다.

해결책: 작은 프로젝트라도 최소 10-20개의 프록시를 사용하세요. 부하를 고르게 분산시키세요 — 한 IP에서 시간당 100-200 요청을 초과하지 않도록 합니다.

오류 2: 야간 파싱

많은 사람들이 밤에 파서를 실행하여 아침에 신선한 데이터를 얻으려고 합니다. 문제는 밤(모스크바 시간으로 2시에서 6시)에는 마켓플레이스의 트래픽이 최소화된다는 것입니다. 이로 인해 낮은 전체 부하에서 귀하의 활동이 더 눈에 띄게 됩니다.

해결책: 피크 시간(18:00-23:00)에 파싱을 시작하세요. 이 시간에는 플랫폼에 최대한 많은 실제 사용자가 있습니다. 귀하의 요청은 전체 트래픽 흐름 속에 녹아들 것입니다.

오류 3: User-Agent 및 기타 헤더 무시

파서는 기본적으로 "Python-requests/2.28" 또는 "Selenium WebDriver"와 같은 User-Agent로 요청을 보냅니다. 이는 봇을 직접적으로 나타내는 것입니다. 마켓플레이스는 이러한 요청을 자동으로 차단합니다.

해결책: 최신 브라우저의 현실적인 User-Agent를 사용하세요. 프록시 회전 시마다 User-Agent를 변경하세요. 또한 실제 브라우저의 특성에 맞는 Accept-Language, Referer 및 기타 헤더를 추가하세요.

오류 4: 검색 결과의 첫 페이지만 파싱

많은 사람들이 카테고리의 상위 50개 상품에 대한 데이터 수집으로 제한합니다. 이는 오류입니다 — 트렌드는 종종 경쟁이 낮고 상품이 인기를 얻기 시작하는 검색 결과의 3-5페이지에서 발생합니다.

해결책: 검색 결과의 최소 5-10페이지(200-500개 상품)를 파싱하세요. 5페이지에서 1-2페이지로 빠르게 상승하는 상품을 추적하세요 — 이것이 바로 초기 트렌드입니다.

오류 5: CAPTCHA 및 차단 처리 부족

올바른 프록시 설정이 있더라도 때때로 CAPTCHA 또는 일시적인 차단이 발생합니다. 파서가 이러한 상황을 처리할 수 없다면, 오류가 발생하여 데이터 손실이 발생할 수 있습니다.

해결책: 파서에 오류 처리 기능을 추가하세요. CAPTCHA를 받으면 다른 프록시로 전환하고 5-10분 후에 요청을 반복하세요. 중간 결과를 저장하여 오류 발생 시 데이터 손실을 방지하세요.

결론

프록시를 통해 트렌드 상품에 대한 데이터를 수집하는 것은 단순한 기술적 과정이 아니라 마켓플레이스 판매자에게 경쟁 우위를 제공합니다. 다른 사람들이 수동으로 경쟁자를 모니터링하는 동안, 당신은 매일 수십만 개의 상품에 대한 구조화된 데이터를 수집하고 초기 단계에서 트렌드를 식별합니다.

기억해야 할 핵심 사항: 마켓플레이스의 보호 수준에 따라 프록시 유형을 선택하세요 (Wildberries 및 Ozon의 경우 주거용, 덜 보호된 플랫폼의 경우 데이터 센터 프록시), 요청 한도를 고려하여 올바른 IP 회전을 설정하세요, 요청 간에 임의 지연을 추가하고 실제 사용자 행동을 모방하세요, 전체 트래픽 속에서 귀하의 활동이 덜 눈에 띄도록 피크 시간에 데이터를 수집하세요.

작은 것부터 시작하세요 — 10-20개의 프록시를 사용하여 1-2개 카테고리의 파싱을 설정하세요. 프로세스를 연습하고 차단이 없는지 확인한 후 시스템을 점진적으로 확장하세요. 데이터 수집 자동화는 트렌드 틈새 시장에 더 빠르게 진입함으로써 첫 달에 이미 수익을 가져올 수 있습니다.

Wildberries, Ozon 또는 기타 보호된 마켓플레이스에서 데이터를 정기적으로 수집할 계획이라면, 주거용 프록시를 사용하는 것이 좋습니다 — 이는 플랫폼의 높은 신뢰도를 보장하고 차단 위험을 최소화합니다. 덜 보호된 사이트의 대량 파싱에는 올바른 회전 설정이 있는 데이터 센터 프록시가 적합합니다.

```