Quay lại blog

Tự động mở rộng bể proxy: cách tăng cường IP dưới tải và tiết kiệm ngân sách

Hướng dẫn chi tiết về cách cấu hình tự động mở rộng nhóm proxy: cách tăng số lượng địa chỉ IP theo tải và tiết kiệm ngân sách cho proxy.

📅12 tháng 2, 2026
```html

Khi làm việc với khối lượng công việc lớn — thu thập dữ liệu từ các thị trường, nuôi tài khoản, đăng bài hàng loạt trên mạng xã hội — bể proxy tĩnh nhanh chóng trở thành vấn đề. Bạn hoặc là phải trả quá nhiều cho các IP không sử dụng trong thời gian tải thấp, hoặc phải đối mặt với việc bị chặn do thiếu địa chỉ trong những thời điểm cao điểm. Tự động mở rộng bể proxy giải quyết cả hai vấn đề: hệ thống tự động tăng số lượng địa chỉ IP theo tải hiện tại và giảm bớt khi số lượng nhiệm vụ giảm.

Trong bài viết này, chúng ta sẽ xem xét cách thiết lập tự động mở rộng cho các kịch bản khác nhau: thu thập dữ liệu, phân tích lưu lượng, đa tài khoản trên mạng xã hội và làm việc với các thị trường. Chúng tôi sẽ giới thiệu các công cụ cụ thể, thuật toán phân phối tải và các chỉ số để theo dõi.

Mở rộng bể proxy là gì và tại sao nó cần thiết

Mở rộng bể proxy — là việc tự động thay đổi số lượng địa chỉ IP hoạt động tùy thuộc vào tải hiện tại. Nói một cách đơn giản: khi có nhiều nhiệm vụ, hệ thống sẽ thêm proxy, khi ít — sẽ tắt bớt để không phải trả tiền cho thời gian không sử dụng.

Ví dụ điển hình: bạn đang thu thập giá trên Wildberries. Vào những ngày bình thường, bạn chỉ cần 50 địa chỉ IP cho 10.000 yêu cầu mỗi giờ. Nhưng vào tối thứ Sáu và cuối tuần, các thị trường thắt chặt giới hạn, bắt đầu chặn các yêu cầu lặp lại từ một IP. Nếu không có mở rộng, bạn hoặc là mua trước 150 proxy "để phòng trường hợp" (trả quá 200% vào ngày thường), hoặc bị chặn trong giờ cao điểm.

Với mở rộng tự động, hệ thống theo dõi tỷ lệ lỗi 429 (Quá nhiều yêu cầu) và captcha. Ngay khi tỷ lệ vượt quá 5% — nó sẽ thêm 20-30 IP. Khi tải giảm — nó sẽ tắt bớt. Kết quả: bạn chỉ trả tiền cho các proxy thực sự được sử dụng và không mất dữ liệu do bị chặn.

Quan trọng: Mở rộng đặc biệt quan trọng đối với proxy dân cư, nơi mà chi phí cho một IP cao hơn nhiều so với proxy trung tâm dữ liệu. Việc trả quá cho các địa chỉ không sử dụng có thể chiếm 50-70% ngân sách cho proxy.

Các lợi ích chính của mở rộng tự động

  • Tiết kiệm 40-60% ngân sách — chỉ trả tiền cho các IP đang sử dụng, không phải cho bể tĩnh "tối đa"
  • Bảo vệ khỏi việc bị chặn — hệ thống phản ứng ngay lập tức với sự gia tăng lỗi và thêm proxy trước khi có các lệnh cấm hàng loạt
  • Tốc độ làm việc ổn định — tải được phân phối đều, không có sự suy giảm trong giờ cao điểm
  • Độ linh hoạt cho các nhiệm vụ — có thể thiết lập các quy tắc mở rộng khác nhau cho thu thập dữ liệu, nuôi tài khoản, quảng cáo

Khi nào cần mở rộng tự động: 5 kịch bản

Mở rộng bể proxy không phải lúc nào cũng cần thiết. Nếu bạn quản lý 5 tài khoản Instagram hoặc thu thập 100 sản phẩm mỗi ngày — một bể tĩnh từ 10-20 proxy sẽ đủ. Nhưng có những nhiệm vụ mà không thể thiếu quản lý tự động bể.

1. Thu thập dữ liệu từ các thị trường với tải biến đổi

Tình huống điển hình cho việc theo dõi giá trên Wildberries, Ozon, Yandex.Market. Trong giờ bình thường (từ 3:00 đến 10:00 sáng), các thị trường dễ dàng cung cấp dữ liệu, giới hạn mềm. Trong giờ cao điểm (từ 18:00 đến 23:00), bắt đầu có những hạn chế nghiêm ngặt: captcha sau 3-5 yêu cầu từ một IP, chặn các subnet, độ trễ trong phản hồi.

Ví dụ: bạn thu thập 50.000 sản phẩm mỗi ngày. Vào ban đêm, 30 IP đủ cho 2000 yêu cầu mỗi giờ từ mỗi IP. Vào buổi tối, cùng một khối lượng yêu cầu 100-120 IP, vì giới hạn giảm xuống còn 500-700 yêu cầu từ một IP. Bể tĩnh từ 120 proxy hoạt động 24/7 — trả quá 75% vào ban đêm. Mở rộng tự động nâng bể lên 120 IP từ 18:00 đến 23:00, trong thời gian còn lại giữ ở mức 30-40.

2. Nuôi tài khoản quảng cáo Facebook Ads và TikTok Ads

Những người phân tích tạo và làm nóng hàng loạt tài khoản trong các bảng điều khiển quảng cáo. Nhiệm vụ: trong một tuần, nâng 50 tài khoản Facebook từ con số 0 đến khi chạy chiến dịch đầu tiên. Mỗi tài khoản yêu cầu một IP riêng biệt (nếu không, chain-ban sẽ liên kết tất cả các hồ sơ).

Nhưng các tài khoản được nuôi không đồng đều: trong 2 ngày đầu, 50 hồ sơ hoạt động tích cực (cần 50 proxy), vào ngày 3-4, một số tài khoản nghỉ ngơi (cần 20-30 IP cho các tài khoản hoạt động), vào ngày 5-7 lại có đỉnh hoạt động trước khi khởi động các chiến dịch (lại cần 50 IP). Với mở rộng, hệ thống chỉ kết nối proxy cho các tài khoản hoạt động, tiết kiệm đến 50% trong một tuần.

3. Đăng bài hàng loạt trên Instagram và TikTok qua các bảng điều khiển SMM

Các đại lý SMM quản lý 50-200 tài khoản của khách hàng. Việc đăng bài diễn ra theo lịch: vào buổi sáng (9:00-11:00) đăng stories, vào buổi chiều (14:00-16:00) — bài viết trong dòng thời gian, vào buổi tối (19:00-21:00) — reels và bình luận. Trong thời gian còn lại, các tài khoản không hoạt động.

Mỗi tài khoản cần một proxy di động riêng (Instagram rất nghiêm ngặt trong việc chặn khi thay đổi IP). Bể tĩnh từ 200 proxy di động có giá từ 4000-6000$ mỗi tháng. Với mở rộng, bạn có thể giữ bể cơ bản từ 50 IP cho các tài khoản hoạt động liên tục, và trong giờ đăng bài hàng loạt mua thêm 100-150 trong 2-3 giờ. Tiết kiệm: lên đến 2000$ mỗi tháng.

4. Tự động hóa các hành động trên mạng xã hội (thích, theo dõi, bình luận)

Quảng bá qua việc theo dõi hàng loạt, thích hàng loạt trên Instagram, VK, TikTok. Nhiệm vụ: 100 tài khoản thực hiện từ 200-300 hành động mỗi ngày (theo dõi, thích). Các mạng xã hội theo dõi hoạt động theo thời gian: nếu tất cả 100 tài khoản cùng lúc bắt đầu thích — đó là cờ đỏ cho chống gian lận.

Chiến lược đúng: phân phối hoạt động trong 12-16 giờ, trong mỗi thời điểm có 20-30 tài khoản hoạt động. Mở rộng chỉ kết nối proxy cho các hồ sơ hoạt động. Thay vì 100 IP cố định, chỉ cần một bể từ 30-40, được luân chuyển giữa các tài khoản.

5. Kiểm tra các sáng tạo quảng cáo từ các khu vực khác nhau

Những người phân tích và nhà tiếp thị kiểm tra quảng cáo trong Facebook Ads, Google Ads, Yandex.Direct từ các quốc gia và thành phố khác nhau. Nhiệm vụ: kiểm tra 50 tổ hợp (10 sáng tạo × 5 khu vực) trong 2 giờ trước khi khởi động chiến dịch.

Cần các proxy từ các vị trí cụ thể: Mỹ (5 tiểu bang), Đức (3 thành phố), Ba Lan, Kazakhstan, Ukraine. Giữ 50 IP từ các khu vực khác nhau liên tục là không hiệu quả — chúng chỉ cần 2-3 lần một tuần trong vài giờ. Với mở rộng, bạn có thể thuê proxy theo giờ, kiểm tra các sáng tạo, sau đó tắt. Tiết kiệm: thay vì 1500$ mỗi tháng cho một bể cố định — 200-300$ cho các phiên tạm thời.

Các loại mở rộng: dọc so với ngang

Có hai cách tiếp cận để mở rộng bể proxy. Lựa chọn phụ thuộc vào loại nhiệm vụ, ngân sách và yêu cầu về tốc độ.

Mở rộng dọc (tăng giới hạn trên IP)

Bạn không thêm địa chỉ IP mới, mà tăng số lượng yêu cầu qua các proxy hiện có. Ví dụ, thay vì 1000 yêu cầu mỗi giờ từ một IP, bạn thực hiện 2000, sử dụng luân chuyển phiên mạnh mẽ hơn hoặc chuyển đổi user-agent.

Khi nào phù hợp: thu thập dữ liệu từ các trang web có giới hạn mềm (các cổng thông tin tin tức, diễn đàn, API mở), nơi mà việc bị chặn là hiếm. Bạn tiết kiệm được số lượng proxy, nhưng có nguy cơ bị cấm do vượt quá tải hợp lý.

Ưu điểm: không cần mua thêm IP, dễ dàng quản lý bể, ít chi phí cho proxy.

Nhược điểm: rủi ro cao về việc bị chặn trên các nền tảng có chống gian lận (mạng xã hội, thị trường, bảng điều khiển quảng cáo). Không phù hợp cho các nhiệm vụ mà mỗi tài khoản cần một IP độc nhất.

Mở rộng ngang (thêm các IP mới)

Bạn tăng số lượng proxy trong bể: từ 50 IP — thành 100. Tải được phân phối đều, mỗi địa chỉ hoạt động trong giới hạn an toàn.

Khi nào phù hợp: đa tài khoản trên mạng xã hội (mỗi tài khoản — một IP riêng), nuôi tài khoản quảng cáo, thu thập dữ liệu từ các thị trường có giới hạn nghiêm ngặt, làm việc với các trình duyệt chống phát hiện (Dolphin Anty, AdsPower, Multilogin).

Ưu điểm: rủi ro tối thiểu về việc bị chặn, hoạt động ổn định, phù hợp cho các nhiệm vụ dài hạn (quản lý tài khoản trong nhiều tháng).

Nhược điểm: chi phí cho proxy cao hơn, khó khăn hơn trong việc thiết lập quản lý tự động bể.

Tiêu chí Mở rộng dọc Mở rộng ngang
Số lượng IP Không thay đổi Tăng lên theo tải
Tải trên IP Tăng lên (nguy cơ bị cấm) Giữ trong giới hạn an toàn
Chi phí Thấp (bể cố định) Biến động (trả tiền cho các IP đang hoạt động)
Phù hợp cho Thu thập dữ liệu từ các trang web không có chống gian lận nghiêm ngặt Mạng xã hội, thị trường, đa tài khoản
Rủi ro bị chặn Cao khi vượt quá giới hạn Thấp (tải được phân phối)

Đối với hầu hết các nhiệm vụ liên quan đến mạng xã hội, bảng điều khiển quảng cáo và các thị trường, mở rộng ngang là tối ưu. Mở rộng dọc chỉ có ý nghĩa cho việc thu thập dữ liệu từ các nguồn mở với các hạn chế tối thiểu.

Chỉ số cho việc mở rộng: điều gì cần theo dõi

Để hệ thống tự động đưa ra quyết định về việc thêm hoặc tắt proxy, cần thiết lập theo dõi các chỉ số chính. Chúng ta sẽ xem xét các chỉ số quan trọng cho các nhiệm vụ khác nhau.

1. Tỷ lệ lỗi (Error Rate)

Đây là chỉ số quan trọng nhất. Theo dõi tỷ lệ giữa các yêu cầu thành công và tổng số yêu cầu. Các mã lỗi quan trọng: 429 (Quá nhiều yêu cầu), 403 (Bị cấm), 503 (Dịch vụ không khả dụng), cũng như thời gian chờ và captcha.

Giá trị bình thường: cho thu thập dữ liệu — dưới 2-3% lỗi, cho việc làm việc với tài khoản trên mạng xã hội — dưới 1%. Nếu tỷ lệ vượt quá ngưỡng, hệ thống nên thêm 20-30% proxy vào bể hiện tại.

Ví dụ: bạn thu thập dữ liệu từ Wildberries, trong bể có 50 IP. Bạn thực hiện 5000 yêu cầu mỗi giờ, trong đó 200 yêu cầu trả về lỗi 429 (4% Error Rate). Kích hoạt mở rộng: thêm 15 proxy để giảm tải trên mỗi IP từ 100 xuống 77 yêu cầu mỗi giờ.

2. Thời gian phản hồi (Response Time)

Khi máy chủ bị quá tải với các yêu cầu từ IP của bạn, nó bắt đầu phản hồi chậm hơn hoặc đưa các yêu cầu vào hàng đợi. Nếu thời gian phản hồi trung bình tăng 30-50% so với cơ sở — đó là tín hiệu để mở rộng.

Ví dụ: thường thì Ozon phản hồi trong 300-500 ms. Trong giờ cao điểm, thời gian phản hồi tăng lên 1200-1500 ms. Điều này có nghĩa là thị trường đang hạn chế các yêu cầu của bạn. Giải pháp: thêm proxy để giảm tần suất yêu cầu từ mỗi IP.

3. Số lượng captcha (CAPTCHA Rate)

Quan trọng cho việc thu thập dữ liệu từ các thị trường, công cụ tìm kiếm, mạng xã hội. Nếu hơn 5% yêu cầu trả về captcha — bể đang bị quá tải.

Ví dụ: bạn thu thập dữ liệu từ Google Shopping, trong 1000 yêu cầu có 80 yêu cầu trả về reCAPTCHA (8%). Hệ thống tự động thêm 20 IP để giảm CAPTCHA Rate xuống 2-3%.

4. Sử dụng proxy (Proxy Utilization)

Cho thấy tỷ lệ proxy đang được sử dụng tích cực. Nếu tỷ lệ sử dụng dưới 40% — bạn đang trả quá cho các IP thừa. Nếu trên 85% — bể đang hoạt động ở mức tối đa, nguy cơ bị chặn cao.

Tỷ lệ sử dụng tối ưu: 60-75%. Đây là sự cân bằng giữa tiết kiệm và ổn định.

Ví dụ: trong bể có 100 proxy, 35 proxy đang hoạt động (tỷ lệ sử dụng 35%). Hệ thống tắt 30 IP không sử dụng, giữ lại 70. Tiết kiệm: 30% ngân sách cho proxy.

5. Số lượng nhiệm vụ đang hoạt động (Task Queue Length)

Nếu số lượng nhiệm vụ trong hàng đợi nhiều hơn hệ thống có thể xử lý với bể hiện tại — cần mở rộng. Theo dõi chiều dài hàng đợi và thời gian chờ trung bình.

Ví dụ: bạn thu thập 10.000 sản phẩm. Trong hàng đợi có 3000 nhiệm vụ, bể hiện tại từ 40 IP xử lý 500 nhiệm vụ mỗi giờ. Thời gian hoàn thành tất cả nhiệm vụ: 6 giờ. Nếu thêm 20 IP, thời gian sẽ giảm xuống còn 4 giờ.

Ngưỡng khuyến nghị cho việc mở rộng tự động:

  • Error Rate > 3% → thêm 20-30% proxy
  • Response Time tăng 40% → thêm 15-20% proxy
  • CAPTCHA Rate > 5% → thêm 25-30% proxy
  • Proxy Utilization > 85% → thêm 20% proxy
  • Proxy Utilization < 40% → tắt 20-30% proxy
  • Task Queue Length > 2x hiệu suất hiện tại → thêm 30-40% proxy

Thuật toán mở rộng tự động

Có một số cách tiếp cận để tự động quản lý kích thước bể proxy. Lựa chọn thuật toán phụ thuộc vào khả năng dự đoán tải và yêu cầu về tốc độ phản ứng.

1. Mở rộng phản ứng (Reactive Scaling)

Hệ thống phản ứng với các chỉ số hiện tại: nếu tỷ lệ lỗi vượt quá ngưỡng — thêm proxy, nếu tỷ lệ sử dụng giảm — tắt bớt. Đây là cách tiếp cận đơn giản và phổ biến nhất.

Thuật toán: cứ mỗi 5-10 phút, hệ thống kiểm tra các chỉ số. Nếu ít nhất một chỉ số vượt quá giới hạn — quyết định mở rộng được đưa ra.

Ưu điểm: dễ thiết lập, không cần dữ liệu lịch sử, hoạt động ngay lập tức.

Nhược điểm: phản ứng với độ trễ (5-10 phút), không dự đoán được tải cao điểm trước. Nếu tải tăng đột ngột — bạn sẽ bị chặn trong khi hệ thống thêm proxy.

Khi nào sử dụng: thu thập dữ liệu với tải tương đối ổn định, khi các đỉnh có thể dự đoán theo thời gian (ví dụ, thu thập dữ liệu hàng ngày vào cùng một giờ).

2. Mở rộng chủ động (Proactive Scaling)

Hệ thống phân tích dữ liệu lịch sử và dự đoán khi nào tải sẽ tăng. Proxy được thêm vào trước khi xảy ra vấn đề.

Thuật toán: dựa trên dữ liệu trong 7-30 ngày trước, hệ thống xây dựng biểu đồ tải theo giờ và ngày trong tuần. Ví dụ, mỗi thứ Sáu từ 18:00 đến 23:00, tỷ lệ lỗi tăng từ 2% lên 8%. Hệ thống tự động thêm proxy vào thứ Sáu lúc 17:45 để ngăn chặn sự gia tăng lỗi.

Ưu điểm: không có độ trễ phản ứng, các lệnh cấm được ngăn chặn trước khi xảy ra, tỷ lệ sử dụng proxy tối ưu.

Nhược điểm: yêu cầu tích lũy thống kê (tối thiểu 2-4 tuần), không xử lý được các đợt tải không thể dự đoán.

Khi nào sử dụng: các nhiệm vụ có mẫu tải lặp lại (thu thập dữ liệu từ các thị trường, theo dõi giá, đăng bài định kỳ trên mạng xã hội).

3. Mở rộng hỗn hợp (Hybrid Scaling)

Sự kết hợp giữa các cách tiếp cận phản ứng và chủ động. Hệ thống sử dụng dữ liệu lịch sử để lập kế hoạch, nhưng cũng phản ứng ngay lập tức với các bất thường.

Thuật toán: mở rộng chính được thực hiện dựa trên dự đoán (dựa trên thống kê). Nhưng nếu các chỉ số vượt quá giới hạn nghiêm trọng — hệ thống sẽ thêm proxy khẩn cấp, không chờ đến thời gian đã lên kế hoạch.

Ví dụ: thường thì vào thứ Hai từ 10:00 đến 12:00, tải ổn định, hệ thống giữ 50 IP. Nhưng vào thứ Hai này, Wildberries đã cập nhật chống gian lận, tỷ lệ lỗi tăng lên 12%. Thuật toán hỗn hợp ngay lập tức thêm 30 proxy, mặc dù theo kế hoạch không cần mở rộng.

Ưu điểm: độ ổn định tối đa, bảo vệ khỏi các tình huống không thể dự đoán, tiết kiệm tối ưu.

Nhược điểm: khó thiết lập hơn, yêu cầu nhiều tài nguyên tính toán hơn để phân tích dữ liệu.

Khi nào sử dụng: các nhiệm vụ quan trọng, nơi mà việc bị chặn là không thể chấp nhận (nuôi tài khoản quảng cáo đắt tiền, quản lý khách hàng VIP trong đại lý SMM).

4. Mở rộng theo lịch (Scheduled Scaling)

Đây là lựa chọn đơn giản nhất: bạn tự tay đặt quy tắc khi nào thêm hoặc tắt proxy. Ví dụ: từ thứ Hai đến thứ Sáu từ 9:00 đến 18:00 giữ 100 IP, trong thời gian còn lại — 30 IP.

Ưu điểm: đơn giản tối đa, không cần theo dõi các chỉ số, phù hợp cho các nhiệm vụ có lịch trình rõ ràng.

Nhược điểm: không linh hoạt, trả quá trong các thời gian tải thấp, nguy cơ bị chặn khi có đỉnh đột ngột.

Khi nào sử dụng: kiểm tra các sáng tạo quảng cáo (cần proxy chỉ trong thời gian khởi động các chiến dịch), các nhiệm vụ thu thập dữ liệu một lần.

Công cụ để triển khai: giải pháp sẵn có và API

Để tự động mở rộng bể proxy, bạn có thể sử dụng cả các nền tảng sẵn có và các script riêng thông qua API của nhà cung cấp. Chúng ta sẽ xem xét cả hai lựa chọn.

Các nền tảng sẵn có với mở rộng tự động

Một số dịch vụ cung cấp các công cụ tích hợp để quản lý bể proxy:

1. Bright Data (Luminati) — có chức năng Auto-Scaling trong các gói Enterprise. Hệ thống tự động tăng bể khi tải tăng, nhưng chi phí cao (từ 500$ mỗi tháng cho gói cơ bản).

2. Smartproxy — cung cấp API để quản lý số lượng IP trong thời gian thực. Bạn có thể thiết lập một script, thông qua API thêm hoặc xóa proxy dựa trên các chỉ số.

3. Oxylabs — có Dashboard với theo dõi các chỉ số (Tỷ lệ lỗi, Thời gian phản hồi). Mở rộng là thủ công, nhưng có thể tích hợp qua API để tự động hóa.

Nhược điểm của các nền tảng sẵn có — chi phí cao và phụ thuộc vào một nhà cung cấp. Nếu giá tăng hoặc chất lượng giảm, việc chuyển sang nhà cung cấp khác sẽ yêu cầu phải làm lại toàn bộ cơ sở hạ tầng.

Triển khai tự động thông qua API của nhà cung cấp

Một lựa chọn linh hoạt hơn là viết một script theo dõi các chỉ số của hệ thống bạn và thông qua API của nhà cung cấp quản lý số lượng proxy. Hầu hết các nhà cung cấp đều cung cấp API cho:

  • Lấy danh sách các proxy đang hoạt động
  • Thêm các IP mới vào bể
  • Tắt các proxy không sử dụng
  • Thay đổi vị trí địa lý hoặc loại proxy

Ví dụ về logic của script cho mở rộng phản ứng:

1. Cứ mỗi 5 phút kiểm tra các chỉ số (Tỷ lệ lỗi, Tỷ lệ CAPTCHA, Thời gian phản hồi)
2. Nếu Tỷ lệ lỗi > 3%:
   - Tính toán số proxy cần thêm (20-30% từ bể hiện tại)
   - Gửi yêu cầu đến API của nhà cung cấp: thêm N proxy
   - Cập nhật cấu hình của trình thu thập dữ liệu với danh sách IP mới
3. Nếu Tỷ lệ sử dụng proxy < 40%:
   - Xác định các proxy không sử dụng (không có yêu cầu trong 30 phút qua)
   - Gửi yêu cầu đến API: tắt các IP này
   - Cập nhật cấu hình của trình thu thập dữ liệu
4. Ghi lại tất cả các hành động để phân tích hiệu quả

Để theo dõi các chỉ số, bạn có thể sử dụng:

  • Prometheus + Grafana — các công cụ miễn phí để thu thập và trực quan hóa các chỉ số. Thiết lập dashboard với các biểu đồ Tỷ lệ lỗi, Thời gian phản hồi, Tỷ lệ sử dụng proxy.
  • Datadog — nền tảng theo dõi (từ 15$ mỗi tháng). Có các tích hợp sẵn với các trình thu thập dữ liệu phổ biến.
  • Các script tùy chỉnh — lựa chọn đơn giản nhất: một script bằng Python hoặc Node.js, mỗi 5 phút yêu cầu các chỉ số từ log của trình thu thập dữ liệu và đưa ra quyết định về mở rộng.

Tích hợp với các trình duyệt chống phát hiện

Nếu bạn làm việc với đa tài khoản qua Dolphin Anty, AdsPower, Multilogin hoặc GoLogin, việc mở rộng proxy có thể tự động hóa thông qua API của các trình duyệt này:

Dolphin Anty API — cho phép tạo các hồ sơ mới với proxy độc nhất, cập nhật IP cho các hồ sơ hiện có, chuyển đổi hàng loạt proxy cho một nhóm tài khoản.

Ví dụ về kịch bản: bạn nuôi 50 tài khoản Facebook. Script theo dõi số lượng tài khoản đang hoạt động tại thời điểm đó. Nếu có 30 tài khoản đang hoạt động — giữ 30 proxy. Nếu hoạt động tăng lên 45 — thông qua API Dolphin thêm 15 hồ sơ mới với các IP mới.

Hướng dẫn từng bước để mở rộng cho các nhiệm vụ khác nhau

Hãy xem xét các kịch bản cụ thể để thiết lập mở rộng tự động cho các nhiệm vụ phổ biến.

Kịch bản 1: Thu thập dữ liệu từ các thị trường (Wildberries, Ozon)

Nhiệm vụ: thu thập 50.000 sản phẩm hàng ngày, cập nhật giá mỗi 6 giờ. Tải không đồng đều: vào ban đêm, các thị trường dễ dàng cung cấp dữ liệu, vào buổi tối bắt đầu có các lệnh cấm.

Bước 1: Xác định bể cơ bản. Khởi động thu thập dữ liệu vào ban đêm (3:00-6:00) với số lượng proxy tối thiểu. Theo dõi số IP cần thiết để Tỷ lệ lỗi < 2%. Ví dụ, cho 50.000 sản phẩm, 30 proxy dân cư là đủ.

Bước 2: Thu thập thống kê trong một tuần. Ghi lại Tỷ lệ lỗi và Tỷ lệ CAPTCHA theo giờ. Bạn sẽ thấy rằng từ 18:00 đến 23:00, lỗi tăng lên 8-12%, và captcha xuất hiện trong 10% yêu cầu.

Bước 3: Thiết lập mở rộng chủ động. Tạo quy tắc: mỗi ngày vào 17:45 thêm 60 proxy (tổng cộng 90 IP), vào 23:15 tắt 60 (trở về 30 IP).

Bước 4: Thêm kích hoạt phản ứng cho các bất thường. Nếu bất kỳ lúc nào Tỷ lệ lỗi vượt quá 5% — khẩn cấp thêm 20 proxy.

Kết quả: thay vì một bể cố định từ 90 IP (chi phí 180-270$ mỗi tháng), bạn chỉ trả cho 30 IP hoạt động liên tục + 60 IP trong 6 giờ mỗi ngày. Tiết kiệm: 40-50% ngân sách.

Kịch bản 2: Nuôi tài khoản Facebook Ads

Nhiệm vụ: tạo và làm nóng 100 tài khoản quảng cáo trong một tháng. Mỗi tài khoản yêu cầu một IP độc nhất, hoạt động không đồng đều.

Bước 1: Chia các tài khoản thành các nhóm theo giai đoạn nuôi: mới (1-3 ngày), làm nóng (4-10 ngày), sẵn sàng khởi động (11-30 ngày). Các tài khoản mới yêu cầu hoạt động hàng ngày, các tài khoản đã sẵn sàng — 2-3 lần một tuần.

Bước 2: Thiết lập mở rộng theo hoạt động. Trong tuần đầu tiên, tất cả 100 tài khoản đều hoạt động — cần 100 proxy. Trong tuần thứ hai, 40 tài khoản chuyển sang chế độ "sẵn sàng" (chỉ cần proxy 3 ngày một tuần) — có thể giảm bể xuống còn 70 IP vào các ngày thường, 100 IP vào các ngày hoạt động của các tài khoản đã sẵn sàng.

Bước 3: Sử dụng API Dolphin Anty để tự động chuyển đổi proxy. Script theo dõi lịch trình hoạt động của từng tài khoản. Nếu tài khoản không hoạt động hôm nay — proxy của nó sẽ bị tắt và sử dụng cho một hồ sơ khác.

Kết quả: thay vì 100 proxy cố định, bạn giữ một bể từ 60-70 IP, được luân chuyển giữa các tài khoản. Tiết kiệm: 30-40% ngân sách mà không có nguy cơ bị chain-ban.

Kịch bản 3: Đăng bài hàng loạt trên Instagram

Nhiệm vụ: Đại lý SMM quản lý 150 tài khoản của khách hàng. Việc đăng bài diễn ra theo lịch: 9:00-11:00 (stories), 14:00-16:00 (bài viết), 19:00-21:00 (reels).

Bước 1: Xác định các giờ cao điểm. Trong các thời điểm đăng bài hàng loạt, tất cả 150 tài khoản đều hoạt động, trong thời gian còn lại — 20-30 (trả lời bình luận, xem dòng thời gian).

Bước 2: Thiết lập mở rộng theo lịch. Từ 8:45 đến 11:15 nâng bể lên 150 IP, từ 11:15 đến 13:45 giảm xuống 30 IP, từ 13:45 đến 16:15 lại là 150 IP, và cứ như vậy.

Bước 3: Sử dụng proxy di động cho các tài khoản quan trọng (khách hàng VIP, hồ sơ đã xác minh) — họ cần một IP cố định. Đối với những tài khoản khác, có thể sử dụng proxy dân cư với luân chuyển theo lịch trình.

Kết quả: bể cơ bản từ 30 proxy di động cho các tài khoản VIP (600$ mỗi tháng) + 120 proxy dân cư hoạt động 9 giờ mỗi ngày (tiết kiệm 60% so với việc thuê 24/7). Tổng tiết kiệm: 1500-2000$ mỗi tháng.

Tối ưu hóa chi phí: cách không trả quá nhiều cho proxy

Mở rộng tự động không chỉ là bảo vệ khỏi việc bị chặn, mà còn là công cụ tiết kiệm. Chúng ta sẽ xem xét các chiến thuật cụ thể để giảm chi phí.

1. Kết hợp các loại proxy cho các nhiệm vụ

Không phải tất cả các nhiệm vụ đều yêu cầu proxy dân cư hoặc di động đắt tiền. Sử dụng cách tiếp cận hỗn hợp:

  • Proxy dân cư — cho các nhiệm vụ quan trọng: nuôi tài khoản, làm việc với các bảng điều khiển quảng cáo, đăng bài trên mạng xã hội.
  • Proxy di động — chỉ cho các tài khoản VIP và các nền tảng có chống gian lận nghiêm ngặt (Instagram, TikTok cho các hồ sơ đã xác minh).
  • Proxy trung tâm dữ liệu — cho việc thu thập dữ liệu từ các nguồn mở, theo dõi giá trên các trang web không có chống gian lận mạnh mẽ.

Ví dụ: bạn thu thập dữ liệu từ Avito. Để thu thập các thông báo, sử dụng proxy trung tâm dữ liệu (rẻ hơn 5-10 lần so với proxy dân cư). Để đăng thông báo, chuyển sang proxy dân cư — Avito kiểm tra IP nghiêm ngặt hơn khi đăng bài.

2. Thiết lập tắt proxy không sử dụng một cách mạnh mẽ

Nhiều người giữ "dự trữ" proxy cho các tải cao điểm, nhưng quên tắt chúng sau khi tải giảm. Thiết lập tự động tắt các IP không được sử dụng trong 30-60 phút qua.

Ví dụ: trong bể có 100 proxy, 60 proxy đang hoạt động. Sau 30 phút không hoạt động, hệ thống tự động tắt 20 IP ít sử dụng nhất. Tiết kiệm: 20% ngân sách hàng ngày.

3. Sử dụng thuê theo giờ cho các nhiệm vụ một lần

Một số nhà cung cấp cung cấp thanh toán theo mức sử dụng thực tế (pay-as-you-go) hoặc thuê theo giờ. Điều này có lợi cho:

  • Kiểm tra các sáng tạo quảng cáo (cần proxy trong 1-2 giờ)
  • Thu thập dữ liệu lớn một lần
  • Kiểm tra khả năng truy cập của trang web từ các khu vực khác nhau

Thay vì một gói thuê hàng tháng cho 50 IP (150-300$), bạn thuê chúng trong 3 giờ (5-15$).

4. Theo dõi tỷ lệ sử dụng và điều chỉnh bể cơ bản

Mỗi tuần, phân tích thống kê tỷ lệ sử dụng proxy. Nếu tỷ lệ sử dụng trung bình liên tục dưới 50% — giảm bể cơ bản xuống 20-30%.

Ví dụ: bạn giữ bể cơ bản từ 80 IP, tỷ lệ sử dụng trung bình 35%. Giảm bể cơ bản xuống 50 IP, thiết lập mở rộng lên 80-100 trong giờ cao điểm. Tiết kiệm: 30-40$ mỗi tháng.

Những sai lầm phổ biến khi mở rộng và cách tránh chúng

Ngay cả khi mở rộng được thiết lập đúng cách, nó có thể hoạt động không hiệu quả do những sai lầm phổ biến. Chúng ta sẽ xem xét những vấn đề thường gặp nhất.

Sai lầm 1: Phản ứng quá chậm với sự gia tăng tải

```