Nếu bạn bán hàng trên các sàn thương mại điện tử hoặc quản lý cửa hàng trực tuyến, bạn biết rằng: giá cả của đối thủ thay đổi nhiều lần trong ngày. Việc theo dõi thủ công là những giờ mất mát và lợi nhuận bị bỏ lỡ. Việc thu thập dữ liệu tự động giải quyết vấn đề này, nhưng các trang web và sàn thương mại điện tử tích cực chặn các trình thu thập dữ liệu. Trong bài viết này, chúng ta sẽ phân tích cách thiết lập việc theo dõi giá cả sao cho các yêu cầu của bạn không bao giờ bị phát hiện và chặn lại.
Tại sao các trang web chặn việc theo dõi giá cả và làm thế nào họ phát hiện bạn
Trước khi thiết lập việc theo dõi, điều quan trọng là hiểu logic bảo vệ từ các trang web. Các sàn thương mại điện tử và cửa hàng trực tuyến biết rõ rằng các đối thủ muốn theo dõi giá của họ — và họ tích cực chống lại điều này. Bảo vệ hoạt động trên nhiều cấp độ đồng thời.
Phân tích tần suất yêu cầu
Khách hàng thông thường truy cập vào trang sản phẩm mỗi vài phút hoặc giờ. Trình thu thập dữ liệu thực hiện hàng trăm yêu cầu mỗi phút từ một địa chỉ IP. Hệ thống chống bot (Cloudflare, Imperva, DataDome) ngay lập tức nhận thấy sự bất thường này và chặn IP. Đó là lý do tại sao việc làm việc với một địa chỉ duy nhất khi thu thập dữ liệu tự động gần như không thể.
Kiểm tra quyền sở hữu địa chỉ IP
Mỗi địa chỉ IP có lịch sử và quyền sở hữu riêng. Địa chỉ của các trung tâm dữ liệu (AWS, Google Cloud, Hetzner) dễ dàng được xác định qua cơ sở dữ liệu — các trang web biết rằng từ những địa chỉ này hoạt động các bot và trình thu thập dữ liệu, và chặn chúng ngay từ đầu. Các IP cư trú — những IP thuộc về người dùng thực tế — ít bị nghi ngờ hơn nhiều.
Phân tích hành vi
Các hệ thống bảo vệ hiện đại không chỉ phân tích IP mà còn cả hành vi: tốc độ cuộn, chuyển động chuột, khoảng dừng giữa các hành động, thứ tự tải tài nguyên trang. Nếu các yêu cầu diễn ra theo đúng lịch trình, không có khoảng dừng ngẫu nhiên — đó là tín hiệu để chặn.
Giới hạn địa lý
Một số nền tảng hiển thị giá khác nhau tùy thuộc vào khu vực. Wildberries, chẳng hạn, có thể hiển thị giá khác nhau cho Moscow và Novosibirsk. Nếu bạn theo dõi giá cho một khu vực cụ thể, proxy của bạn phải có IP của khu vực đó — nếu không, bạn sẽ nhận được dữ liệu không liên quan.
Điều quan trọng cần biết:
Wildberries và Ozon sử dụng nhiều cấp độ bảo vệ đồng thời. Chỉ một proxy là không đủ — cần có sự luân phiên đúng cách, tiêu đề yêu cầu chính xác và thiết lập công cụ thu thập dữ liệu hợp lý.
Những proxy nào phù hợp cho việc theo dõi giá: so sánh các loại
Không phải tất cả các proxy đều hữu ích như nhau cho việc theo dõi giá cả. Sự lựa chọn phụ thuộc vào việc bạn theo dõi những trang web nào, tần suất cần cập nhật dữ liệu và ngân sách bạn sẵn sàng dành ra. Chúng ta sẽ phân tích từng loại một cách chi tiết.
| Loại proxy | Mức độ tin cậy | Tốc độ | Tốt nhất cho | Chi phí |
|---|---|---|---|---|
| Proxy cư trú | Rất cao | Trung bình | Wildberries, Ozon, các trang web bảo mật | Trung bình — cao |
| Proxy di động | Tối đa | Trung bình | Các nền tảng có bảo vệ nghiêm ngặt, phiên bản di động của các trang web | Cao |
| Proxy trung tâm dữ liệu | Thấp | Cao | Các trang web không có bảo vệ nghiêm trọng, các cửa hàng nhỏ | Thấp |
Proxy cư trú — lựa chọn tối ưu cho hầu hết các nhiệm vụ
Proxy cư trú sử dụng địa chỉ IP của người dùng thực tế trên internet. Từ góc độ của trang web, nó giống như một khách hàng thông thường từ căn hộ hoặc văn phòng — không có nghi ngờ gì. Điều này làm cho chúng trở thành lựa chọn lý tưởng cho việc theo dõi trên Wildberries, Ozon, Avito và hầu hết các nền tảng khác. Lợi thế chính — khả năng chọn địa lý: bạn có thể nhận được IP của một thành phố hoặc khu vực cụ thể của Nga, điều này rất quan trọng cho việc theo dõi chính xác giá cả khu vực.
Proxy cư trú luân phiên tự động thay đổi địa chỉ IP mỗi khi có yêu cầu hoặc qua một khoảng thời gian nhất định. Điều này có nghĩa là ngay cả khi một địa chỉ bị chặn tạm thời, yêu cầu tiếp theo sẽ được gửi từ một IP khác — việc theo dõi không bị gián đoạn.
Proxy di động — cho các nền tảng được bảo vệ nhất
IP di động — là địa chỉ của các nhà mạng di động (MTS, Beeline, Megafon). Chúng có một đặc điểm độc đáo: một IP di động có thể đứng sau hàng ngàn người dùng thực tế (thông qua NAT của nhà mạng). Do đó, các trang web rất hiếm khi chặn các địa chỉ di động — rủi ro làm tổn thương người tiêu dùng thực tế là quá cao. Nếu bạn theo dõi một nền tảng có bảo vệ chống bot mạnh mẽ và proxy cư trú bị chặn thường xuyên — hãy chuyển sang proxy di động.
Proxy trung tâm dữ liệu — chỉ cho các nhiệm vụ đơn giản
Proxy trung tâm dữ liệu hoạt động nhanh và có giá rẻ, nhưng dễ bị nhận diện. Hầu hết các sàn thương mại điện tử nghiêm trọng sẽ chặn chúng trong vòng vài phút làm việc cường độ cao. Chúng phù hợp cho việc theo dõi các cửa hàng trực tuyến nhỏ không có bảo vệ nghiêm trọng hoặc để thử nghiệm trước các sơ đồ thu thập dữ liệu.
Đặc điểm thu thập dữ liệu trên Wildberries, Ozon, Avito và các nền tảng khác
Mỗi nền tảng lớn có những đặc điểm bảo vệ riêng. Hiểu những đặc điểm này cho phép bạn thiết lập việc theo dõi đúng cách và không lãng phí tài nguyên.
Wildberries
Wildberries là một trong những sàn thương mại điện tử khó thu thập dữ liệu nhất ở Nga. Nền tảng này tích cực sử dụng tải nội dung động qua JavaScript, điều này có nghĩa là: một yêu cầu HTTP đơn giản sẽ không cung cấp cho bạn giá — trang phải được trình duyệt hoàn toàn vẽ lại. Hơn nữa, WB thường xuyên thay đổi cấu trúc trang và các điểm cuối API, điều này làm hỏng các trình thu thập dữ liệu.
Đối với Wildberries, proxy cư trú luân phiên với IP của Nga là tối ưu. Tần suất yêu cầu — không quá một yêu cầu mỗi 3–5 giây cho mỗi IP. Cũng quan trọng là phải mô phỏng hành vi của người dùng thực: khoảng dừng ngẫu nhiên, tiêu đề trình duyệt chính xác (User-Agent, Accept-Language).
Ozon
Ozon sử dụng hệ thống bảo vệ dựa trên Cloudflare và các giải pháp chống bot riêng. Nền tảng này phân tích dấu vân tay TLS (dấu vân tay số của kết nối) — điều này có nghĩa là ngay cả với một proxy tốt, yêu cầu có thể bị chặn nếu nó không giống như một yêu cầu từ trình duyệt thực. Đối với Ozon, nên sử dụng các công cụ hoàn toàn mô phỏng trình duyệt (headless Chrome, Playwright), thay vì các khách hàng HTTP đơn giản.
Avito
Avito có bảo vệ vừa phải, nhưng tích cực chặn các IP trung tâm dữ liệu. Proxy cư trú với địa chỉ IP của Nga hoạt động ổn định. Đặc điểm của Avito là tính khu vực: giá cả và thông báo rất khác nhau giữa các thành phố. Nếu bạn theo dõi các đối thủ trong một khu vực cụ thể, hãy chắc chắn sử dụng proxy với IP của khu vực đó, nếu không dữ liệu sẽ không liên quan.
Yandex.Market và các aggregator khác
Yandex.Market sử dụng hệ thống phát hiện bot tiên tiến — không có gì ngạc nhiên khi xem xét tài nguyên của công ty. Nền tảng này phân tích hành vi, tần suất yêu cầu và các đặc điểm của kết nối. Để theo dõi ổn định, cần có proxy cư trú luân phiên với khoảng dừng giữa các yêu cầu không dưới 5–10 giây.
Lời khuyên về địa lý:
Để theo dõi các sàn thương mại điện tử của Nga, hãy luôn sử dụng proxy với IP của Nga. IP nước ngoài có thể cung cấp giá khác, danh sách sản phẩm khác hoặc thậm chí bị chặn ở mức địa lý.
Các công cụ sẵn có để theo dõi giá mà không cần mã
Tin tốt cho những ai không viết mã: có các dịch vụ và công cụ sẵn có cho phép bạn thiết lập việc theo dõi giá cả của đối thủ chỉ trong vài giờ. Bạn chỉ cần kết nối proxy và chỉ định những gì cần theo dõi.
Các dịch vụ chuyên biệt theo dõi giá
Các nền tảng như Priceva, Competera và các dịch vụ tương tự của Nga cung cấp giải pháp sẵn có: bạn thêm URL của các trang đối thủ, đặt lịch kiểm tra, nhận báo cáo ở định dạng thuận tiện. Nhiều trong số đó hỗ trợ kết nối proxy riêng — điều này quan trọng nếu bạn muốn kiểm soát địa lý và chất lượng của các địa chỉ IP.
Trình thu thập không cần mã: Octoparse, ParseHub, Apify
Octoparse và ParseHub là các trình thu thập dữ liệu trực quan với giao diện kéo và thả. Bạn thực sự "nhấp" vào các phần tử của trang (giá, tên sản phẩm, tình trạng tồn kho), và công cụ tự động xử lý cách lấy chúng. Cả hai đều hỗ trợ kết nối proxy qua định dạng tiêu chuẩn host:port:login:password. Apify là một nền tảng mạnh mẽ hơn với các "diễn viên" (mẫu) sẵn có để thu thập dữ liệu từ các trang web phổ biến, bao gồm cả các sàn thương mại điện tử.
Google Sheets + IMPORTXML/IMPORTHTML
Đối với các nhiệm vụ đơn giản — theo dõi 10–20 trang mà không có bảo vệ nghiêm trọng — bạn có thể sử dụng các chức năng tích hợp của Google Sheets. IMPORTXML và IMPORTHTML cho phép bạn kéo dữ liệu từ các trang web trực tiếp vào bảng tính. Nhược điểm: không hỗ trợ proxy và chỉ hoạt động với các trang tĩnh đơn giản. Phương pháp này không phù hợp cho các sàn thương mại điện tử.
Trình duyệt chống phát hiện cho việc theo dõi thủ công
Nếu bạn cần kiểm tra giá một cách thủ công từ các khu vực khác nhau — chẳng hạn như xem sản phẩm của bạn trông như thế nào đối với khách hàng từ Yekaterinburg — các trình duyệt chống phát hiện như Dolphin Anty, AdsPower hoặc GoLogin sẽ trở thành công cụ tiện lợi. Bạn tạo một hồ sơ trình duyệt riêng với địa lý cần thiết, kết nối proxy với IP của thành phố cần thiết và mở trang của đối thủ. Mỗi hồ sơ trông giống như một người dùng duy nhất.
Cách thiết lập proxy cho việc theo dõi: hướng dẫn từng bước
Chúng ta sẽ phân tích việc thiết lập thực tế bằng cách kết nối proxy với một công cụ theo dõi phổ biến. Nguyên tắc này giống nhau cho hầu hết các giải pháp không cần mã.
Bước 1: Nhận dữ liệu proxy
Sau khi mua proxy, bạn sẽ nhận được dữ liệu kết nối ở định dạng: host (IP hoặc tên miền), cổng, tên đăng nhập và mật khẩu. Đối với proxy cư trú luân phiên, thường sẽ có một điểm cuối — địa chỉ cổng, qua đó IP sẽ tự động thay đổi mỗi khi có yêu cầu. Ghi lại những dữ liệu này — chúng sẽ cần thiết ở bước tiếp theo.
Bước 2: Chọn giao thức — HTTP hoặc SOCKS5
Hầu hết các công cụ thu thập dữ liệu đều hỗ trợ cả hai giao thức. Proxy HTTP — là lựa chọn phổ biến, hoạt động với bất kỳ công cụ nào. SOCKS5 — là giao thức linh hoạt hơn, hỗ trợ mọi loại lưu lượng và tốt hơn trong việc ẩn giấu việc sử dụng proxy. Đối với việc theo dõi giá, chúng tôi khuyên bạn nên sử dụng SOCKS5 nếu công cụ của bạn hỗ trợ.
Bước 3: Thiết lập trong Octoparse (ví dụ)
Trong Octoparse, hãy chuyển đến menu Cài đặt → Cài đặt Proxy. Chọn chế độ Proxy tùy chỉnh. Nhập dữ liệu proxy của bạn: host, cổng, tên đăng nhập, mật khẩu. Nhấn Kiểm tra kết nối — công cụ sẽ kiểm tra tính khả thi của proxy và hiển thị địa chỉ IP mới của bạn. Nếu kiểm tra thành công — proxy đã được kết nối. Bây giờ tất cả các yêu cầu của trình thu thập dữ liệu sẽ đi qua nó.
Bước 4: Thiết lập luân phiên và độ trễ
Đây là bước cực kỳ quan trọng mà nhiều người bỏ qua. Ngay cả với một proxy tốt, việc thu thập dữ liệu mạnh mẽ sẽ bị phát hiện. Thiết lập các thông số sau:
- Độ trễ giữa các yêu cầu: tối thiểu 3–5 giây cho Wildberries và Ozon, 1–2 giây cho các trang web ít bảo vệ hơn
- Luân phiên IP: thay đổi IP mỗi 10–20 yêu cầu hoặc mỗi 5–10 phút
- Khoảng dừng ngẫu nhiên: thay vì độ trễ cố định, hãy sử dụng khoảng thời gian ngẫu nhiên (ví dụ: từ 3 đến 8 giây)
- User-Agent: sử dụng các chuỗi User-Agent hiện tại của các trình duyệt thực (Chrome, Firefox)
Bước 5: Kiểm tra trước khi khởi động
Trước khi khởi động việc theo dõi đầy đủ, hãy thực hiện một bài kiểm tra: khởi động việc thu thập dữ liệu trên 10–20 trang và kiểm tra xem tất cả dữ liệu có được thu thập chính xác và không có bị chặn hay không. Nếu một phần yêu cầu trả về lỗi 403 (truy cập bị từ chối) hoặc CAPTCHA — hãy tăng độ trễ và kiểm tra cài đặt luân phiên.
Những lỗi thường gặp khi thu thập giá và cách tránh chúng
Hầu hết các vấn đề với việc theo dõi giá cả phát sinh từ những lỗi giống nhau. Chúng ta sẽ phân tích những lỗi phổ biến nhất trong số đó.
Lỗi 1: Sử dụng một IP cho tất cả các yêu cầu
Ngay cả khi bạn có một IP cư trú tốt — đừng sử dụng nó cho hàng trăm yêu cầu liên tiếp. Bất kỳ IP nào thực hiện quá nhiều yêu cầu trong thời gian ngắn sẽ bị chặn. Hãy sử dụng proxy luân phiên hoặc một nhóm các địa chỉ IP, phân phối tải giữa chúng.
Lỗi 2: Bỏ qua địa lý
Nếu bạn theo dõi giá của đối thủ ở Moscow, sử dụng proxy với IP từ Novosibirsk hoặc thậm chí từ Đức — bạn sẽ nhận được dữ liệu không chính xác. Trên Wildberries, Ozon và Avito, giá cả và điều kiện giao hàng phụ thuộc vào khu vực. Luôn chọn proxy với địa lý phù hợp với nhiệm vụ của bạn.
Lỗi 3: Tần suất yêu cầu quá cao
Mong muốn nhận dữ liệu càng nhanh càng tốt dẫn đến việc trình thu thập dữ liệu thực hiện yêu cầu mỗi 0,1–0,5 giây. Hoạt động như vậy sẽ ngay lập tức bị phát hiện. Giá cả không thay đổi mỗi giây — thường thì việc kiểm tra chúng mỗi giờ hoặc thậm chí mỗi vài giờ là đủ. Giảm tần suất — và độ ổn định của việc theo dõi sẽ tăng lên đáng kể.
Lỗi 4: Proxy trung tâm dữ liệu rẻ cho các nền tảng phức tạp
Nhiều người bắt đầu với các proxy trung tâm dữ liệu rẻ nhất và ngạc nhiên tại sao Wildberries chặn chúng trong 5 phút. Đối với các sàn thương mại điện tử nghiêm trọng, cần có proxy cư trú hoặc di động. Việc tiết kiệm trên proxy sẽ dẫn đến việc mất thời gian vào việc chống lại các chặn.
Lỗi 5: Thiếu theo dõi tính khả thi của proxy
Proxy có thể tạm thời không hoạt động, có độ trễ cao hoặc trả về lỗi. Nếu bạn không kiểm soát điều này, việc theo dõi có thể "gãy" một cách lặng lẽ — dữ liệu sẽ ngừng cập nhật và bạn chỉ biết điều này sau vài ngày. Thiết lập cảnh báo về lỗi trong công cụ của bạn hoặc kiểm tra định kỳ tính chính xác của dữ liệu bằng tay.
Các sơ đồ làm việc cho việc theo dõi cho các nhiệm vụ khác nhau
Để không phải phát minh lại bánh xe, chúng ta sẽ phân tích các sơ đồ cụ thể cho các nhiệm vụ điển hình của các nhà bán hàng và marketer.
Sơ đồ 1: Theo dõi giá cả của đối thủ trên Wildberries — cho các nhà bán hàng
Nhiệm vụ: Theo dõi giá của 50–100 sản phẩm cạnh tranh trên Wildberries, cập nhật mỗi 2–4 giờ.
Công cụ: Dịch vụ chuyên biệt (Priceva hoặc tương tự) hoặc Apify với diễn viên sẵn có cho WB.
Proxy: Proxy cư trú luân phiên với IP của Nga. Nhóm từ 50 địa chỉ để phân phối tải.
Cài đặt: Độ trễ 5–8 giây giữa các yêu cầu, khoảng thời gian ngẫu nhiên, luân phiên IP mỗi 15 yêu cầu.
Kết quả: Dữ liệu cập nhật về giá cả của đối thủ mỗi 2–4 giờ, cảnh báo tự động khi giá thay đổi hơn 5%.
Sơ đồ 2: Theo dõi giá cả khu vực trên Avito — cho doanh nghiệp địa phương
Nhiệm vụ: Theo dõi giá của đối thủ trên Avito tại một thành phố cụ thể (ví dụ: Krasnodar), cập nhật mỗi ngày.
Công cụ: Octoparse hoặc ParseHub với mẫu đã được thiết lập cho Avito.
Proxy: Proxy cư trú với IP của thành phố hoặc khu vực cụ thể. Quan trọng: IP phải phù hợp với thành phố cần thiết để nhận được giá địa phương.
Cài đặt: Khởi động mỗi ngày, độ trễ 3–5 giây, IP tĩnh (không cần luân phiên mạnh mẽ khi tần suất thấp).
Kết quả: Báo cáo hàng ngày về giá cả của đối thủ trong khu vực của bạn, xuất sang Excel hoặc Google Sheets.
Sơ đồ 3: Theo dõi các đề nghị quảng cáo của đối thủ — cho các marketer
Nhiệm vụ: Theo dõi các chương trình khuyến mãi, giảm giá và đề nghị đặc biệt của đối thủ trên trang web và trong quảng cáo của họ.
Công cụ: Sự kết hợp của trình thu thập dữ liệu (Apify) cho các trang web + các công cụ theo dõi quảng cáo để theo dõi thông báo.
Proxy: Proxy cư trú với địa lý của thị trường mục tiêu. Nếu theo dõi quảng cáo cho các khu vực khác nhau — cần proxy của nhiều khu vực cùng một lúc.
Cài đặt: Kiểm tra 2–3 lần một ngày, luân phiên IP mỗi phiên mới.
Kết quả: Thông tin kịp thời về các hoạt động marketing của đối thủ, khả năng phản ứng nhanh với các chương trình khuyến mãi của họ.
Sơ đồ 4: Theo dõi giá trên các sàn thương mại điện tử nước ngoài — cho các nhà nhập khẩu
Nhiệm vụ: Theo dõi giá của nhà cung cấp và đối thủ trên AliExpress, Amazon, eBay.
Công cụ: Apify với các diễn viên sẵn có cho Amazon và AliExpress, hoặc các dịch vụ theo dõi chuyên biệt.
Proxy: Proxy cư trú với IP của quốc gia của sàn thương mại điện tử mục tiêu (Mỹ cho Amazon, Trung Quốc hoặc Mỹ cho AliExpress). Điều này quan trọng, vì giá có thể khác nhau tùy thuộc vào quốc gia của người truy cập.
Cài đặt: Cập nhật mỗi 6–12 giờ, độ trễ 5–10 giây, luân phiên IP mỗi 20 yêu cầu.
Danh sách kiểm tra trước khi khởi động việc theo dõi giá:
- ✅ Đã chọn loại proxy phù hợp với nhiệm vụ (proxy cư trú cho các sàn thương mại điện tử)
- ✅ Địa lý của proxy phù hợp với thị trường mục tiêu
- ✅ Đã thiết lập luân phiên IP
- ✅ Đã thiết lập độ trễ giữa các yêu cầu (tối thiểu 3–5 giây)
- ✅ Đã thử nghiệm trên 10–20 trang trước khi khởi động hoàn toàn
- ✅ Đã thiết lập cảnh báo khi có lỗi hoặc thay đổi giá
- ✅ Đã xác định lịch cập nhật (không thường xuyên hơn mức cần thiết)
Kết luận
Việc theo dõi giá cả tự động của đối thủ không chỉ là sự tiện lợi mà còn là lợi thế cạnh tranh. Biết được cách giá cả thay đổi trên Wildberries, Ozon, Avito và các nền tảng khác, bạn có thể phản ứng kịp thời: giảm giá khi đối thủ hạ giá, tăng giá trong các thời điểm nhu cầu cao, khởi động các chương trình khuyến mãi vào thời điểm thích hợp. Tất cả những điều này đều ảnh hưởng trực tiếp đến doanh số và lợi nhuận.
Chìa khóa cho việc theo dõi ổn định là chọn proxy đúng cách và thiết lập công cụ hợp lý. Đối với hầu hết các sàn thương mại điện tử của Nga, lựa chọn tối ưu là proxy cư trú luân phiên với IP của Nga: chúng trông giống như người dùng thực, hỗ trợ lựa chọn địa lý và không bị chặn bởi các hệ thống chống bot mạnh mẽ.
Nếu bạn làm việc với các nền tảng chặn các trình thu thập dữ liệu một cách nghiêm ngặt, hoặc bạn cần sự ổn định tối đa — hãy xem xét proxy di động: chúng rất hiếm khi bị chặn, vì một IP di động có thể đứng sau hàng ngàn người dùng thực.
Bắt đầu từ những điều nhỏ: thiết lập theo dõi cho 20–30 vị trí chính của đối thủ, thử nghiệm sơ đồ, đảm bảo tính ổn định của dữ liệu — và sau đó mở rộng quy mô. Việc theo dõi giá được thiết lập đúng cách sẽ thu hồi vốn chỉ trong tháng đầu tiên hoạt động.