競合のレビューを分析することは、マーケットプレイスのセラーにとって非常に重要なタスクです。レビューは商品の実際の問題を示し、商品ページを改善し、未開拓のニッチを見つける手助けをします。しかし、マーケットプレイスは大量のパースを厳しくブロックしています:Wildberriesは50〜100件のリクエスト後にIPをバンし、Ozonはキャプチャを表示し、Yandex.Marketは個人に対してAPIへのアクセスを完全に閉鎖しています。この記事では、安全にレビューを収集する方法、使用するツール、データへのアクセスを失わないためのプロキシの設定方法について説明します。
なぜマーケットプレイスはレビューのパースをブロックするのか
マーケットプレイスは、いくつかの理由からデータを保護しています。第一に、大量のパースはサーバーに高い負荷をかけます。パーサーからの数千のリクエストが1分間にあると、通常の購入者にとってサイトの動作が遅くなる可能性があります。第二に、レビューはプラットフォームが有料分析を通じて収益化する貴重なデータです(たとえば、Ozon AnalyticsやWB Analyticsは月5000ルーブルからです)。第三に、競合他社がレビューを不正に利用する可能性があります:成功した戦略のコピー、レビューの偽造、または競合他社の不満を持つ顧客を見つけるためです。
技術的には、マーケットプレイスは以下のいくつかのパラメータに基づいて疑わしい活動を追跡します:
- 1つのIPからのリクエストの頻度: あなたのIPから1分間に100件以上のリクエストがある場合、それは明らかに人間ではありません。Wildberriesは50〜70件のリクエスト後にそのようなIPを24時間バンします。
- 行動パターン: パーサーはページを非常に速く開きます(1ページあたり1秒未満)、マウスを動かさず、スクロールもしません。現代のアンチボットシステム(たとえば、KasadaやDataDome)はこれを簡単に認識します。
- User-Agentとブラウザのフィンガープリント: あなたのスクリプトが古いバージョンのChromeまたはJavaScriptなしでリクエストを送信している場合、これは赤信号です。
- クッキーとセッションの不在: 通常のユーザーは訪問履歴や認証クッキーを持っています。パーサーはしばしば「クリーン」な状態で訪れます。
Ozonは特に攻撃的な保護を使用しています:20〜30件のリクエストの後にキャプチャを表示し、再試行の際にはCDN(Cloudflare)レベルでIPをブロックします。Yandex.Marketは2023年に個人向けの公開APIを閉鎖しました — 現在は法人契約を持つ企業のみがアクセスできます。AvitoはIPだけでなく電話番号でもバンし、自動的な活動を検出した場合にブロックします。
保護なしでパースするとどうなるか:バンの影響
ブロックの影響は、どのようにパースしているかによって異なります。自宅のIPをプロキシなしで使用している場合、24時間の一時的なバンを受けます。これはデータの一時的な収集には致命的ではありませんが、定期的な監視には問題です。セラーアカウントを介してパースしている場合(たとえば、拡張統計にアクセスするためにWBの個人アカウントを使用している場合)、アカウントがバンされるリスクがあります。アカウントを復元するのは難しいです:サポートに連絡し、「コンピュータにウイルスがある」と証明する必要があります。このプロセスは1週間から1ヶ月かかります。
実際のケース:Wildberriesで子供のおもちゃを販売しているセラーが、Pythonのスクリプトを介して競合のレビューを自動的にパースするように設定しました。スクリプトは彼の作業用IPで動作し、毎時500件のレビューを収集していました。3日後、WildberriesはIPだけでなく販売者のアカウントもブロックしました — アルゴリズムはパーサーのIPを個人アカウントにアクセスしていたIPと関連付けました。結果:店舗へのアクセスを2週間失い、約400,000ルーブルの売上を逃しました(商品は在庫がありましたが、供給を管理することはできませんでした)。
重要: セラーの個人アカウントにアクセスするのと同じIPからパースしないでください。マーケットプレイスはIPアドレスをアカウントに関連付け、疑わしい活動のために店舗をブロックする可能性があります。
もう一つの問題は法的なものです。形式的には、パースはほとんどのマーケットプレイスのユーザー契約に違反します(「禁止行為」セクション)。実際には、プラットフォームはパーサーと法廷に至ることはほとんどありませんが、前例はあります。2022年、Ozonは価格と在庫に関するデータを収集していた分析サービスに対して訴訟を起こしました。裁判所はOzonの側に立ち、サービスは閉鎖されました。個人にとっては法的請求のリスクは最小限ですが、パースをサービスとして販売する企業にとっては実際の脅威です。
レビューを収集する3つの方法:手動、API、自動パース
方法1:手動収集(少量の場合)
競合の5〜10商品について週に1回レビューを収集する必要がある場合は、手動で行うことができます。WildberriesまたはOzonで商品ページを開き、レビューをスクロールして、テキストをExcelにコピーします。利点:技術的なスキルは不要で、バンのリスクはゼロです。欠点:非常に遅い(100件のレビューに30〜40分かかります)、動向を追跡できず、自動化がありません。
この方法はマイクロビジネスに適しています:2〜3商品を販売し、競合についての情報を理解して自分のページを改善したい場合。定期的に数十の商品を監視するには、手動収集はスケールしません。
方法2:公式API(制限付きアクセス)
一部のマーケットプレイスは、パートナー向けにAPIを提供しています。Wildberriesのセラー向けAPIは、自分の商品のレビューのみを取得することができます(競合のレビューは不可)。OzonのAPIも同様に、自分のデータへのアクセスのみです。Yandex.Marketのコンテンツパートナー向けAPIは法的契約が必要で、年間売上が1000万ルーブル以上の企業のみが利用可能です。
APIの利点:安定したアクセス、プラットフォームのルールを破らない、JSON形式の構造化データ。欠点:競合のレビューを取得できない(ほとんどのセラーの主な目的)、公式APIの高い参入障壁。
方法3:プロキシを介した自動パース(ユニバーサル)
これはプロのセラーやエージェンシーのための主要な方法です。特別なツール(パーサー)を使用するか、商品ページを自動的に開き、レビューを収集してデータベースに保存するスクリプトを書くことができます。バンを避けるために、すべてのリクエストはプロキシを介して行われます — 各リクエストは新しいIPアドレスから行われ、マーケットプレイスは異なる都市からの通常のユーザーを認識します。
利点:任意の商品(自社商品や競合の商品)のレビューを収集できる、完全な自動化、スケーラビリティ(1日あたり10,000商品でも可)。欠点:技術的なスキルや有料ツールが必要、プロキシのコスト(毎月3000ルーブルから)。
マーケットプレイスのパースに適したプロキシはどれか
プロキシの種類の選択は、予算、パースのボリューム、データの質に対する要求によって異なります。3つの主要なタイプとマーケットプレイスへの適用性を説明します。
| プロキシの種類 | 適しているもの | 価格 | 利点/欠点 |
|---|---|---|---|
| データセンターのプロキシ | Avito、AliExpress、小規模なプラットフォームのパース | 月50₽/IPから | + 安価で高速 − WBとOzonに簡単に認識される |
| レジデンシャルプロキシ | Wildberries、Ozon、Yandex.Market — 主な選択肢 | 月300₽/GBから | + 実際の家庭用ユーザーのIP、バンされない − データセンターより高価 |
| モバイルプロキシ | バンのリスクが高いパース、モバイルアプリを介した収集 | 月500₽/IPから | + 最大の保護、モバイルオペレーターのIP − 最も高価で、レジデンシャルより遅い |
WildberriesとOzonのパースにはレジデンシャルプロキシをお勧めします。これらのマーケットプレイスは、高度なアンチボットシステムを使用しており、データセンターのIPを簡単に特定します(それらはホスティングプロバイダーの知られたAS番号の範囲内にあります)。レジデンシャルプロキシは、通常の家庭用インターネットプロバイダー(Ростелеком、МТС、Билайн)のIPであり、実際の購入者と区別することはできません。
重要な点:マーケットプレイスにはIPローテーションのプロキシが必要です。これは、各リクエストが新しいIPアドレスから行われることを意味します。たとえば、1000件のレビューをパースする場合、これは1000の異なるIPがロシアの異なる都市からのものです。マーケットプレイスは、商品にアクセスしているのが全国からの実際のユーザーであることを認識し、疑わしい活動はありません。
アドバイス: ロシアのマーケットプレイスをパースする際は、ロシアのIPを持つプロキシを選択してください。WildberriesとOzonは、海外のユーザーにキャプチャを表示することがよくあります(海外のパーサーからの保護)。ロシアのジオロケーションを持つレジデンシャルプロキシは、この問題を解決します。
レビュー収集のためのツール:サービスの概要
プログラマーでない場合は、ゼロからパーススクリプトを書く必要はありません — 既存のソリューションがあります。マーケットプレイスのセラー向けの人気ツールを見てみましょう。
1. Mpstats (mpstats.io) — WildberriesとOzonの分析
ロシアのセラーの間で最も人気のあるサービスです。レビューだけでなく、価格、在庫、検索順位、販売履歴も収集します。レビューは1日ごとに更新され、Excelにエクスポートできます。価格:月3000ルーブルから(「スタート」プラン)。利点:プロキシを自分で設定する必要がなく(すべてがすぐに動作します)、使いやすいインターフェース、既存のレポートがあります。欠点:スケールすると高価(100件以上の商品を追跡すると、プランが15,000ルーブルに上昇)、データは遅延して更新されます。
2. Moneyplace (moneyplace.io) — Ozon用のパーサー
Ozon専用のツールです。レビュー、顧客の質問、販売者の評価を収集します。レビューのトーン分析機能があります(自動的にネガティブとポジティブを識別します)。価格:月2500ルーブルから。利点:Ozon専用の深い分析、あなたのシステムとの統合用API。欠点:Ozon専用で、Wildberriesや他のプラットフォームには対応していません。
3. Parser.ru — コードなしのユニバーサルパーサー
どんなウェブサイトでもパースできるクラウドサービスです。 「何をパースするかを指定して結果を得る」という原則で動作します。プログラミングは不要で、すべてが視覚的インターフェースで設定されます。価格:月1500ルーブルから + プロキシは別途支払い(自分のプロキシを使用する場合は無料)。利点:柔軟性(レビューだけでなく、任意のデータのパースを設定できる)、どんなマーケットプレイスでも動作します。欠点:設定に時間がかかる(インターフェースの学習に1〜2時間)。
4. Octoparse — Windows/Mac用デスクトップパーサー
ビジュアルエディタを持つパース用プログラムです。コンピュータにインストールし、マーケットプレイスのサイトを開き、収集する要素(レビューのテキスト、評価、日付)をクリックします。プログラムは構造を記憶し、自動的にパースします。価格:無料版(1ヶ月あたり10,000件まで)、有料版は月75ドルから。利点:HTML/CSSを知らなくてもよい、人気のあるサイト用の既存のテンプレートがあります。欠点:コンピュータ上でのみ動作します(電源を切るとパースが停止します)、英語のインターフェースです。
5. Pythonでの独自スクリプト(技術的なスキルがある方向け)
基本的なプログラミングスキルがある場合、Selenium(ブラウザのエミュレーション)やScrapy(高速パース)を使用してPythonでスクリプトを書くことができます。利点:完全なコントロール、月額料金ゼロ(プロキシ代のみ)、任意のデータを任意の形式でパースできます。欠点:開発に時間がかかる(簡単なパーサーで5時間以上)、コードのメンテナンスが必要(マーケットプレイスがサイトの構造を変更するとスクリプトが壊れます)。
ほとんどのセラーには、MpstatsやMoneyplaceのような既存のサービスから始めることをお勧めします。これらは、月に200,000ルーブル以上をマーケットプレイスで稼いでいる場合に元を取ります。予算が限られている場合や、非標準のパースロジックが必要な場合は、Octoparseや独自のスクリプトを検討してください。
プロキシを介したパースのステップバイステップ設定
Octoparse(コードなしのパーサー)とレジデンシャルプロキシの組み合わせの設定を例に説明します。この方法は初心者に適しており、プログラミングは必要ありません。
ステップ1:レジデンシャルプロキシへのアクセスを取得する
レジデンシャルプロキシのプロバイダーに登録します(たとえば、ProxyCove)。登録後、接続情報を受け取ります:
プロキシサーバー: gate.proxycove.com
ポート: 8080
ユーザー名: user_あなたの_id
パスワード: あなたの_パスワード
タイプ: HTTP/HTTPS(IPローテーション付き)
重要:リクエストごとのローテーションプランを選択してください(各HTTPリクエスト = 新しいIP)。マーケットプレイスのパースにはこれが重要です。
ステップ2:Octoparseをインストールして設定する
公式サイト(octoparse.com)からOctoparseをダウンロードし、コンピュータにインストールします。初回起動時にアカウントを作成するように求められます — テスト用に無料版を使用してください(制限は月10,000件、50〜100商品には十分です)。
設定を開き(Settings → Proxy Settings)、プロキシを追加します:
- プロキシタイプ:HTTP
- サーバー:gate.proxycove.com
- ポート:8080
- ユーザー名:あなたのログイン
- パスワード:あなたのパスワード
- 「すべてのタスクにプロキシを使用する」にチェックを入れる
「プロキシをテスト」をクリックします — プログラムが接続を確認します。すべてが正しく設定されている場合、「プロキシが機能しています」というメッセージが表示されます。
ステップ3:Wildberriesのレビュー収集タスクを作成する
「新しいタスク」をクリックし → 「高度なモード」を選択します。Wildberriesの商品ページのURLを貼り付けます(例:https://www.wildberries.ru/catalog/12345678/detail.aspx)。Octoparseは内蔵ブラウザを開き、プロキシを介してページを読み込みます。
これで、プログラムに何をパースするかを教えます:
- ページを下にスクロールしてレビューのブロックまで移動します。
- 最初のレビューのテキストをクリック → 「テキストを抽出」を選択 → プログラムがページ上のすべてのレビューをハイライトします。
- 評価(星)をクリック → 「テキストを抽出」 → プログラムが評価を記憶します。
- レビューの日付をクリック → 「テキストを抽出」。
- 「さらに表示」ボタン(ページネーション)を見つけ → 右クリック → 「ページをクリックしてページネーション」 → プログラムが自動的にページをめくります。
制限を設定します:「ページネーション」セクションで最大50ページ(約500レビュー)を指定します。これは1回のセッションで安全なボリュームです。
ステップ4:リクエスト間の遅延を設定する
これは非常に重要です!パーサーがページをあまりにも速くめくると、Wildberriesはプロキシを介してもボットを疑います。「タスク設定」→「速度」を開き、以下を設定します:
- ページ読み込み遅延:3〜5秒(ページ間の遅延)
- アクション遅延:1〜2秒(クリック間の遅延)
- ランダム遅延を有効にする:有効にする(ランダム性を追加し、人間を模倣します)
ステップ5:パースを開始し、データをエクスポートする
「実行」をクリック → プログラムがパースを開始します。リアルタイムでデータが収集される様子が表示されます。完了後(通常、500レビューで10〜15分かかります)、「エクスポート」をクリック → ExcelまたはCSV形式を選択します。これで完了です — すべてのレビュー、評価、日付が含まれた表があります。
よくある間違い: 100商品に対してすぐにパースを開始しないでください。5〜10商品から始め、すべてがブロックなしで動作することを確認してください。その後、1日あたり50〜100商品にスケールします。
安全なパースのルール:制限、遅延、ローテーション
プロキシを使用しても、「礼儀のルール」を破るとバンされる可能性があります。マーケットプレイスはIPだけでなく、行動パターンも分析します。安全なパースのチェックリストは以下の通りです:
1. リクエストの制限を守る
ロシアのマーケットプレイスにおける安全な制限は:
- Wildberries: 1つのパースタスクから1時間に100件を超えないこと。10商品をパースする場合は、商品間に30〜40秒の間隔を設けてください。
- Ozon: 1時間に50件を超えないこと(彼らの保護はより攻撃的です)。商品間の間隔は1分です。
- Yandex.Market: 1時間に30件を超えないこと。10件ごとに5分の間隔を設けてください。
これらの制限は、レジデンシャルプロキシを使用したパースに基づいています。データセンターを使用している場合は、制限を2で割ってください。
2. ランダムな遅延を使用する
遅延を固定しないでください(たとえば、リクエスト間にちょうど5秒)。これは疑わしく見えます。ランダムな遅延を設定してください:3〜7秒の範囲で。ほとんどのパーサー(Octoparse、Scrapy)は、この機能をすぐにサポートしています。
3. User-Agentを変更する
User-Agentは、サイトに使用しているブラウザを知らせる文字列です。パーサーはしばしば古いUser-Agent(たとえば、Chrome 90、現在のバージョンは120)を送信します。User-Agentのローテーションを設定してください:各リクエストは異なるブラウザ(Chrome、Firefox、Safari)と異なるバージョンから行います。
ローテーション用のUser-Agentのリストの例:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/120.0.0.0
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) Safari/605.1.15
Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:121.0) Firefox/121.0
Mozilla/5.0 (X11; Linux x86_64) Chrome/119.0.0.0
4. ピーク時にパースしない
マーケットプレイスは、最大トラフィックの時間帯(通常、モスクワ時間の18:00から23:00まで — 購入者が仕事から帰る時間)にアンチボット保護を強化します。この時間帯はキャプチャやバンを受けるリスクが高くなります。パースに最適な時間は、午前2時から午前8時、または午前10時から午後4時までです。
5. セッションごとにプロキシをローテーションする
1つの商品をパースする場合(たとえば、50ページのレビューをめくる場合)、セッション全体で1つのIPを使用します。各ページでIPを変更すると、マーケットプレイスは何か奇妙なことを疑うかもしれません(1人の「ユーザー」が1秒でモスクワからウラジオストクに飛ぶ)。しかし、次の商品に移るときはIPを変更します。
6. 人間の行動を模倣する
高度なパーサー(たとえば、Selenium)は、人間の行動をエミュレートできます:マウスの動き、スクロール、ランダムな要素へのクリック。これにより、パーサーの「人間らしさ」が向上します。シンプルなHTTPパーサー(ブラウザなし)を使用している場合は、これは必要ありませんが、その場合はリクエストの制限を厳守してください。
収集したレビューを分析して売上を伸ばす方法
レビューを収集することは半分の仕事です。重要なのは、それらを正しく分析し、インサイトを適用することです。以下は実用的な使用シナリオです。
1. 競合商品の欠点を探す
収集したレビューをExcelで開き、ネガティブなもの(評価1〜2星)をフィルタリングします。購入者が何に不満を持っているかを見てみましょう:サイズが合わない、パッケージが悪い、配達が遅い、素材の質が低い。これらの不満はあなたの競争優位性です。競合が不適切なサイズのために30%のネガティブレビューを受けている場合 — あなたの商品ページに詳細なサイズガイドを写真付きで記載してください。包装に不満がある場合 — 商品に美しい箱を入れ、説明にそのことを書く。
実際のケース:スポーツレギンスを販売しているセラーが、トップ5の競合の500件のレビューを収集しました。彼は、40%のネガティブレビューが生地がしゃがむと透けることに関連していることを発見しました。彼はサプライヤーにより厚手の生地を注文し、「レギンスは透けません」というテスト動画を撮影して商品ページに追加しました。結果:コンバージョン率が3%から7%に上昇し、売上は1ヶ月で2倍になりました。
2. 購入者の質問に基づいて商品ページを改善する
レビューに加えて、購入者の質問もパースします(WildberriesとOzonにあります)。質問は、商品ページに不足している情報を示します。20人が「これは100%コットンですか、それとも合成ですか?」と尋ねている場合 — 成分が不明確に記載されていることを意味します。「成分:95%コットン、5%エラスタン」という大きなブロックを説明に追加してください。iPhone 15との互換性について尋ねられている場合 — 互換性のあるモデルのリストを追加してください。
3. 未解決のニーズを探す(新しいニッチ)
競合のポジティブなレビューを分析します。「素晴らしいが、〜があればよかった」、「残念ながら〜がない」というフレーズを探します。これは未解決のニーズの信号です。たとえば、子供用リュックのレビューでは、「良いリュックだが、反射材がない」とよく書かれています。反射材付きのリュックを発売し、このオーディエンスを獲得することができます。
4. レビューの動向を監視する(問題を早期に発見)
自社商品の自動パースを1日1回設定します。ネガティブレビューの数が急増した場合(たとえば、1週間で10件の不良品に関する苦情が来た場合) — これはサプライヤーにロットを確認する信号です。おそらく、不良品を送ってきた可能性があります。問題を早期に発見するほど、評価の損失を少なくできます。
5. マーケットプレイス内のSEOのためのセマンティクスを収集する
購入者のレビューは「生きた」キーワードの源です。人々は商品を探すときに書きます:「ダーチャ用に購入」、「2月23日の夫へのプレゼントを探していた」、「車用のタンブラーが必要だった」。これらのフレーズを商品ページのタイトルや説明に追加することで、マーケットプレイスの検索での可視性が向上します。
結論
マーケットプレイスからのレビュー収集は、単なる技術的なタスクではなく、売上を伸ばすための戦略的なツールです。正しく収集され、分析された競合のレビューは、あなたに競争上の優位性を提供します:市場に何が不足しているか、どの問題を解決すべきか、どのように自分のページを改善すべきかを知ることができます。重要なのは、バンを受けないように安全に行うことです。
記事からの重要な結論:WildberriesとOzonのパースにはレジデンシャルプロキシを使用してください(データセンターとは異なり、バンされません)、リクエストの制限を守ってください(Wildberriesでは1時間に100件を超えない)、リクエスト間にランダムな遅延を設定してください(3〜7秒)、セラーの個人アカウントにアクセスするのと同じIPからパースしないでください。初心者には、MpstatsやOctoparseのような既存のツールから始めることをお勧めします — これらは、月に200,000ルーブル以上の売上がある場合に元を取ります。
定期的にマーケットプレイスからデータを収集する予定がある場合は、レジデンシャルプロキシを試してみることをお勧めします — これにより、高い匿名性、ロシアのプロバイダーの実際のIP、ブロックのリスクを最小限に抑えることができます。これは、ビジネスにとって重要なデータへのアクセスを維持するための投資です。