Ozonで販売している場合、価格が1日に10〜20回変わることを知っているでしょう。競合他社はダンピングを行い、マーケットプレイスのアルゴリズムはランキングを再計算し、あなたは価格を適時に調整できなかったために売上を失います。手動での監視は何時間もかかり、自動パーサーは50〜100のリクエスト後にIPがブロックされます。この記事では、プロキシを介してOzonでの安定した価格監視を設定する方法、使用するツール、およびブロックにつながる一般的な間違いを避ける方法を説明します。
Ozonが価格監視をブロックする理由
Ozonは、他の大手マーケットプレイス(Wildberries、Yandex.Market)と同様に、自動データ収集から積極的に保護されています。理由は簡単です:パーシングはサーバーに追加の負荷をかけ、価格の大量収集は販売者だけでなく、マーケットプレイスの競合他社によっても商品分析に使用されます。
保護なしで価格を監視しようとすると、次のようなことが起こります:
- IPアドレスによるブロック — 1つのIPから50〜150のリクエストの後、Ozonはキャプチャを要求するか、1〜24時間のアクセスを完全にブロックします。これは、通常のユーザーが1分間に100の商品カードを閲覧することは物理的に不可能だからです。
- User-Agentによる検出 — パーサーの標準User-Agent(例えば、Python-requests/2.28)を使用すると、システムは自動リクエストを即座に認識し、ブロックします。
- 行動分析 — Ozonはリクエストの速度、アクションの欠如(スクロール、クリック)、リクエスト間の同じインターバルを追跡します。スクリプトが正確に5秒ごとにリクエストを行う場合、これは明らかなボットの兆候です。
- ブラウザのフィンガープリンティング — ヘッドレスブラウザ(Selenium、Puppeteer)を使用すると、OzonはWebGL、canvas、または他の実際のブラウザの兆候がないことを検出できます。
セラーとの経験から、プロキシを使用しない限り、20以上の商品を追跡することは安定した監視を不可能にします。競合の価格を1日に100〜500回確認する必要がある場合、プロキシは必須のツールになります。
重要: Ozonは価格監視自体を禁止しているわけではありません — マーケットプレイスはサーバーへの負荷と戦っています。リクエストの合理的な制限(1つのIPから1〜2リクエスト/秒を超えない)を守り、プロキシのローテーションを使用すれば、ブロックを完全に回避できます。
Ozonのパーシングに適したプロキシ
プロキシの種類の選択は、監視の安定性とソリューションのコストに直接影響します。Ozonでの作業に適した3つの主要なオプションを見てみましょう。
レジデンシャルプロキシ — Ozonに最適な選択
レジデンシャルプロキシは、プロキシプロバイダーのネットワークにデバイスを提供した実際の家庭ユーザーのIPアドレスを使用します。Ozonへのリクエストは、サイトの通常の訪問者のように見えるため、ブロックの可能性がほぼ排除されます。
Ozonの監視における利点:
- 高いトラストスコア — IPは実際のプロバイダー(Ростелеком、МТС、Билайн)に属し、データセンターではありません
- バンのリスクが最小 — 集中的なパーシング(ローテーションを伴う1時間あたり最大1000リクエスト)でも
- 地理的分布 — ロシアの異なる地域(モスクワ、サンクトペテルブルク、エカテリンブルク)から価格を監視できます。Ozonは配達地域に応じて異なる価格を表示します
- セッションの長寿命 — ローテーションなしで1つのIPを最大30分間使用できます
欠点:データセンターのプロキシに比べてコストが高い(通常は1GBあたり3〜5ドル)。しかし、価格監視に必要なトラフィックは最小限で、1000商品の確認には通常50〜100MBかかります。
モバイルプロキシ — 最大の信頼性
モバイルプロキシは、モバイルオペレーター(МТС、Билайн、Мегафон、Tele2)のIPを使用します。これは、Ozonの購入者の大部分がモバイルデバイスからアクセスするため、すべてのマーケットプレイスにとって最も信頼されるタイプのIPです。
モバイルプロキシを選択すべき時:
- レジデンシャルプロキシを使用しているときにブロックされたことがある
- 特に保護されたデータ(例えば、非公開カテゴリーの価格)をパーシングする必要がある
- 価格だけでなく、レビュー、評価、商品の残数も監視する
- 大量(1日あたり5000以上の商品)を扱っている
モバイルプロキシの特徴は、オペレーターのネットワークに再接続する際にIPが自動的に変更されることです(通常5〜15分ごと)。これにより、追加の設定なしで自然なローテーションが実現します。
データセンタープロキシ — 制限のある予算オプション
データセンタープロキシは、データセンター内のサーバーのIPアドレスです。これらは大幅に安価(1GBあたり0.5ドルから)ですが、OzonはこれらのIPを簡単に認識し、より頻繁にブロックします。
Ozonにデータセンタープロキシを使用できる場合:
- 少数の商品(最大50品目)を監視している
- 価格をまれに(1日2回)確認している
- ローテーション付きの大きなIPプール(最低50〜100アドレス)を使用している
- レジデンシャルプロキシを購入する前にパーサーをテストしている
私たちの経験では、データセンタープロキシは単純なタスクにのみ適しています。Ozonでの価格監視を真剣に行う場合は、最初からレジデンシャルプロキシを使用する方が、ブロックとの戦いにかかる時間を節約できます。
| プロキシの種類 | Ozonのためのトラストスコア | コスト | 推奨 |
|---|---|---|---|
| レジデンシャル | 高い(9/10) | 1GBあたり3〜5ドル | 継続的な監視に最適 |
| モバイル | 最大(10/10) | IPあたり8〜15ドル/月 | 大規模なボリュームと保護されたデータ用 |
| データセンター | 低い(4/10) | 1GBあたり0.5〜1ドル | テスト用または小規模用 |
価格監視ツールの比較
Ozonでの価格を追跡するための3つの主要なアプローチがあります:既製のSaaSサービス、デスクトッププログラム、独自のスクリプト。便利さ、コスト、プロキシの必要性の観点から各オプションを見てみましょう。
既製のSaaS監視サービス
これは、すでに組み込まれたパーサーとプロキシを含むクラウドプラットフォームです。追跡する必要のある商品のSKUを指定するだけで、価格の動向を示すレポートを受け取ります。
Ozonのための人気サービス:
- Moneyplace — マーケットプレイスのセラー向けの専門サービス。Ozon、Wildberries、Yandex.Marketをサポート。100商品の監視で月1500ルーブルから。
- Mpstats — 競合の分析と監視。価格だけでなく、販売、残数、検索順位も表示。月2000ルーブルから。
- SellerFox — Ozonでの販売管理のための包括的なツール。価格監視、自動価格設定、分析を含む。月3000ルーブルから。
- Marketguru — 基本機能を備えた予算オプション。50商品の監視で月900ルーブルから。
利点:プロキシやパーシングの設定を理解する必要がなく、すべてが「箱から出して」機能し、価格変更の通知やレポートが用意されています。
欠点:月額料金、商品の数に制限があり、設定の柔軟性がない(例えば、特性やレビューなどの追加データをパーシングできない)。
デスクトップパーサー(Datacol、Octoparse、ParseHub)
これは、コンピュータにインストールされ、プログラミングなしでウェブサイトから任意のデータをパーシングするためのプログラムです。収集する必要のある要素(価格、名前、評価)を視覚的に指定し、プログラムが自動的にそれらを抽出します。
Ozonのための「パーサー + プロキシ」の組み合わせは次のように機能します:
- プログラムでパーシングタスクを作成します(例えば、商品のURLリストから価格を収集)
- 設定でプロキシサーバー(IP:PORT:LOGIN:PASSWORD)を指定します
- プログラムは指定された遅延でプロキシを介して自動的にリクエストを実行します
- 結果はExcel、CSV、またはGoogle Sheetsにエクスポートされます
Ozonでの作業に人気のあるパーサー:
- Datacol — シンプルなインターフェースを持つロシアのパーサー。プロキシ、User-Agentのローテーション、キャプチャの処理をサポート。ライセンスは4000ルーブルから。
- Octoparse — クラウドパーシングを提供する国際的なサービス。無料プラン(最大10タスク)あり。有料プランは月75ドルから。
- ParseHub — 学習が簡単なパーサー。無料で1回の起動で最大200ページをパーシングできます。有料プランは月149ドルから。
利点:設定の柔軟性があり、任意のデータをパーシングでき、一部のプログラムでは一度の支払いで済み、ローカルでコンピュータ上で動作します。
欠点:プロキシを自分で購入して設定する必要があり、プログラムを習得するのに時間がかかり、パーシング中はコンピュータをオンにしておく必要があります(クラウド版を使用しない場合)。
独自のPythonまたはNode.jsスクリプト
基本的なプログラミングスキルがある場合やチームに開発者がいる場合は、独自のパーサーを作成できます。これにより、最大の柔軟性と大規模なボリュームに対する最小のコストが得られます。
Ozonのパーシングに適した一般的なスタック:
- Python + requests + BeautifulSoup — HTMLのシンプルなパーシング用(Ozonがページのソースコードでデータを返す場合)
- Python + Selenium/Playwright — ブラウザを介したパーシング用(データがJavaScriptを介して読み込まれる場合)
- Node.js + Puppeteer — JavaScriptの代替で、動的なサイトでよく機能します
- Scrapy — 大規模なパーシングのためのプロフェッショナルなフレームワーク(10000以上の商品を監視する必要がある場合)
利点:プロセスを完全に制御でき、任意の形式で任意のデータをパーシングでき、サービスの月額料金がなく、簡単にスケールアップできます。
欠点:プログラミングスキルが必要で、エラーやブロックを自分で処理する必要があり、開発とサポートに時間がかかります。
| ツール | 設定の難易度 | プロキシは必要ですか? | コスト | 誰のために |
|---|---|---|---|---|
| SaaSサービス | 低い(5分) | いいえ(組み込み) | 月900ルーブルから | 初心者、小規模ビジネス |
| デスクトップパーサー | 中程度(1〜2時間) | はい(別途購入) | 4000ルーブルから一回限り + プロキシ | 中規模ビジネス、柔軟性が必要 |
| 独自のスクリプト | 高い(8時間以上) | はい(別途購入) | 開発時間 + プロキシ | 大規模ビジネス、大量 |
プロキシを介した監視のステップバイステップガイド
人気のパーサーDatacolとレジデンシャルプロキシの例を用いて、価格監視の実践的な設定を考えてみましょう。この方法は、プログラミングなしで50〜500商品を追跡したいほとんどのセラーに適しています。
ステップ1: 監視する商品のリストを準備する
まず、どの商品を追跡する必要があるかを決定します。通常は次のようになります:
- 自社の商品(他の販売者が同じ商品をダンピングしていないかを確認するため)
- 直接の競合(あなたのカテゴリーのトップ10商品)
- 類似商品(特性や価格が似ている)
次の列を含むExcelファイルを作成します:
- 商品URL — Ozonの商品カードへの完全なリンク(例:https://www.ozon.ru/product/naushniki-apple-airpods-pro-123456789/)
- SKU — あなたの記録用
- 名前 — 商品の簡単な説明
- カテゴリー — レポートでのグループ化用
このリストはパーサーの基盤となります。パーサーに簡単にアップロードできるように、CSV形式でファイルを保存してください。
ステップ2: プロキシの購入と設定
100〜200商品を1時間に1回監視するには、1000 IPのプールを持つレジデンシャルプロキシが必要です。購入時に考慮すべき点は次のとおりです:
- ジオロケーション — ロシアのプロキシを選択してください(ロシアのOzonを監視する場合)。地域価格が重要な場合は、特定の地域を選択できます。
- ローテーションのタイプ — Ozonにはリクエストごとのローテーション(各リクエスト = 新しいIP)または5〜10分ごとのローテーションが最適です。
- プロトコル — HTTP/HTTPSプロキシはほとんどのパーサーに適しています。SOCKS5は特定のタスクにのみ必要です。
- アクセス形式 — IP:PORT:LOGIN:PASSWORD形式または自動ローテーション付きのAPIを介して作業するのが最も便利です。
購入後、接続情報が提供されます。一般的な形式は次のとおりです:
プロキシサーバー: gate.proxycove.com:8080
ログイン: user12345
パスワード: pass67890
または直接形式: gate.proxycove.com:8080:user12345:pass67890
ステップ3: Datacolパーサーの設定
Datacolはプログラミングを必要としないビジュアルパーサーです。Ozonの監視のために設定する方法は次のとおりです:
- Datacolをインストール — 公式サイトからプログラムをダウンロードし、ライセンスをアクティブにします。
- 新しいプロジェクトを作成 — 「プロジェクトを作成」をクリックし、「URLリスト」モードを選択します(すでに商品リンクのリストがあるため)。
- 商品リストをアップロード — 商品のURLを含むCSVファイルをインポートします。
- プロキシを設定 — 「設定」→「プロキシ」を開き、「HTTPプロキシ」を選択し、プロキシサーバーのデータ(IP:PORT:LOGIN:PASSWORD)を入力します。「プロキシのローテーション」オプションをオンにし、5〜10分のインターバルを設定します。
- パーシングする要素を指定 — Datacolの内蔵ブラウザで任意の商品カードを開きます。価格を右クリックして「スキーマに追加」を選択します。名前、評価、レビュー数についても同様に繰り返します。
- 遅延を設定 — プロジェクトの設定でリクエスト間の遅延を3〜7秒(ランダム)に設定します。これにより、実際のユーザーの行動を模倣します。
- User-Agentを設定 — 人気のあるブラウザ(Chrome、Firefox、Safari)のリストからUser-Agentのローテーションを有効にします。
設定が完了したら、「パーシングを開始」をクリックします。Datacolは商品リストを巡回し、自動的にIPとUser-Agentを変更します。結果はリアルタイムで表に保存されます。
ステップ4: スケジュールとデータエクスポートの設定
監視を自動化するために、パーシングの開始スケジュールを設定します:
- Datacolで「タスクスケジューラ」を開きます
- 必要な頻度で「パーシング開始」タスクを作成します(例えば、6時間ごと)
- 結果をGoogle SheetsまたはExcelにエクスポートする設定をします(タイムスタンプ付きの新しい行を自動的に追加)
- 価格が10%以上変動した場合にメールで通知を受け取るようにします
これで、あなたの参加なしで24時間稼働する完全自動化された価格監視システムが整いました。
アドバイス: Google Sheetsでダッシュボードを作成し、競合が価格を下げた商品を自動的にハイライトする数式を使用してください。これにより、市場の変化に迅速に対応できます。
IPのローテーションとリクエスト間の遅延の設定
プロキシのローテーションと遅延の正しい設定は、ブロックなしで安定したパーシングを行うための鍵です。質の高いレジデンシャルプロキシを使用していても、リクエストの頻度を誤って設定するとブロックされる可能性があります。
Ozonのための最適なIPローテーション頻度
Ozonは、1つのIPからのリクエストの数だけでなく、行動パターンも分析します。推奨される設定は次のとおりです:
| パーシングのボリューム | IPのローテーション | リクエスト間の遅延 | 1つのIPからの最大リクエスト数 |
|---|---|---|---|
| 50商品まで | 10〜15分ごと | 5〜10秒(ランダム) | 最大50 |
| 50〜200商品 | 5〜10分ごと | 3〜7秒(ランダム) | 最大30 |
| 200〜1000商品 | 各リクエストごと(または2〜3リクエストごと) | 2〜5秒(ランダム) | 最大10〜15 |
| 1000商品以上 | 各リクエストごと | 1〜3秒(ランダム) | 最大5〜10 |
重要なポイント:遅延はランダムである必要があります!パーサーが正確に5秒ごとにリクエストを行う場合、これは明らかなボットの兆候です。ランダム化を使用してください:例えば、3〜7秒の範囲で。
人気のツールでのローテーション設定
Datacolで:
- 「設定」→「プロキシ」を開きます
- 「プロキシの自動ローテーション」を有効にします
- モードを選択します:「時間ごと」(X分ごと)または「リクエストごと」(Xリクエストごと)
- 「設定」→「遅延」で遅延を設定します。「ランダム遅延」を選択し、範囲を指定します(例:3000〜7000ミリ秒)
Octoparseで:
- タスクの設定で「高度な設定」→「プロキシ設定」を選択します
- 「プロキシIPをローテーション」を有効にし、インターバルを設定します
- 「AJAX/ページ設定」でランダム化された「待機時間」を設定します
Pythonの独自スクリプトで:
import time
import random
import requests
proxies_list = [
"http://user1:pass1@gate.proxycove.com:8080",
"http://user2:pass2@gate.proxycove.com:8080",
# ... 他のプロキシ
]
for url in urls_to_parse:
proxy = random.choice(proxies_list) # ランダムにプロキシを選択
proxies = {"http": proxy, "https": proxy}
response = requests.get(url, proxies=proxies)
# ... データの処理
delay = random.uniform(3, 7) # 3〜7秒のランダム遅延
time.sleep(delay)
検出からの追加保護措置
IPのローテーションと遅延に加えて、最大の目立たなさを確保するためにこれらのテクニックを使用してください:
- User-Agentのローテーション — 実際のブラウザからの10〜20の人気User-Agentのリストを使用してください。IPと一緒に変更します。
- リファラー — Ozonの内部ページ(例えば、カテゴリーや検索ページ)からのRefererをリクエストヘッダーに追加し、サイト内の移動を模倣します。
- クッキー — 各IPのクッキーを保存し、同じIPからの次のリクエストで再利用します。
- Accept-Language — ロシアのユーザーを模倣するために、Accept-Languageヘッダーをru-RU,ru;q=0.9に設定します。
重要: 追加のマスキングなしでヘッドレスブラウザ(Selenium、Puppeteer)を使用しないでください。OzonはWebGL、プラグイン、および他の兆候の欠如によりヘッドレスモードを簡単に特定します。ブラウザを使用する場合は、Puppeteer-extra-plugin-stealthなどのプラグインを接続してください。
ブロックにつながる一般的な間違い
セラーとの長年の仕事を通じて、質の高いプロキシを使用していてもブロックにつながるいくつかの致命的な間違いを特定しました。それぞれを見て、どのように回避するかを示します。
間違い1: パーシング速度が高すぎる
多くの人が、リクエスト間の遅延を0.5〜1秒に設定して、最短時間で最大のデータをパーシングしようとします。これは、ブロックへの最も早い道です。
なぜこれは問題なのか: 実際のユーザーは1分間に60商品を閲覧することはできません。Ozonは異常な活動を見てIPをブロックします。
解決策: 最小遅延は、レジデンシャルプロキシの場合は2〜3秒、データセンタープロキシの場合は5〜7秒です。はい、パーシングにはもっと時間がかかりますが、安定性が得られます。
間違い2: すべてのリクエストに1つのIPを使用
一部の人は1つのプロキシを購入し、それを数百の商品をパーシングするために使用します。これは非常に少ないボリューム(1日あたり20〜30商品)にしか機能しません。
なぜこれは問題なのか: Ozonは、1つのIPから1時間に200リクエストが異なる商品に来たことを見ます。これは明らかなパーサーの兆候です。
解決策: 自動ローテーション付きのプロキシプールを使用します。100商品には、5〜10リクエストごとにローテーションする10〜20の異なるIPが必要です。
間違い3: キャプチャとエラーを無視する
パーサーがキャプチャやエラー429(リクエストが多すぎます)を受け取ると、一部の人はそれを無視してリクエストを続けます。
なぜこれは問題なのか: これは状況を悪化させます — Ozonはボットが保護を無視しているのを見て、IPを長期間(時には永遠に)ブロックします。
解決策: パーサーでエラー処理を設定します:
- キャプチャを受け取った場合 — 5〜10分間パーシングを停止し、IPを変更します
- エラー429の場合 — 遅延を2倍に増やし、IPを変更します
- エラー403(禁止)の場合 — 直ちにIPとUser-Agentを変更します
- 重要なタスクには、自動キャプチャ解決サービス(2Captcha、Anti-Captcha)を使用します
間違い4: 営業時間中のみパーシング
多くの人が毎日同じ時間(例えば、10:00)に手動でパーサーを起動します。これは予測可能なパターンを作成します。
解決策: パーシングを1日の間に均等に分散させます。1日に4回価格を確認する必要がある場合は、6±1時間のランダムな時間に起動します。
間違い5: 安価な公開プロキシの使用
無料または非常に安価な公開リストのプロキシは、すでにOzonを含むすべての大手サイトのブラックリストに載っています。
解決策: 信頼できるプロバイダーから質の高い有料プロキシを使用します。月500〜1000ルーブルの節約は、ブロックとの戦いに失われた時間には値しません。
1000以上の商品を監視する方法
ビジネスが成長すると、50〜100ではなく、1000〜5000の商品を追跡する必要が出てきます。この段階では、デスクトップパーサーは効果的ではなくなり、より真剣なソリューションに移行する必要があります。
ローカルではなくクラウドパーシング
大量のデータには、24/7稼働するクラウドサーバー(VPS/VDS)を使用します。利点:
- コンピュータを常に稼働させる必要がなく、
- 大規模なボリュームを処理でき、
- リソースを簡単にスケールアップできます。
これにより、競合他社の価格をリアルタイムで監視し、迅速な意思決定を行うことができます。