Quay lại blog

Quản lý phiên cho việc phân tích và tự động hóa: cách giữ phiên trong 12+ giờ

Hướng dẫn đầy đủ về cách thiết lập phiên làm việc lâu dài cho việc thu thập dữ liệu, cày tài khoản và tự động hóa: chọn proxy, cấu hình trình duyệt, giải quyết vấn đề ngắt kết nối.

📅10 tháng 2, 2026
```html

Nếu bạn đang chạy việc phân tích các thị trường vào ban đêm, nuôi tài khoản Facebook Ads trong 8 giờ hoặc tự động hóa việc đăng bài hàng loạt trên Instagram — bạn đã gặp phải vấn đề ngắt phiên. Proxy thay đổi IP, trình duyệt mất cookies, script bị lỗi sau ba giờ làm việc. Trong hướng dẫn này, chúng ta sẽ xem xét cách thiết lập các phiên ổn định lâu dài cho các tác vụ hoạt động từ vài giờ đến cả ngày mà không dừng lại.

Quản lý phiên là gì và tại sao nó cần thiết

Quản lý phiên là việc quản lý trạng thái kết nối giữa công cụ của bạn (trình duyệt, script, bot) và dịch vụ mục tiêu trong một khoảng thời gian dài. Đối với các tác vụ ngắn — phân tích 100 sản phẩm trong 5 phút — điều này không quan trọng. Nhưng nếu tác vụ kéo dài vài giờ, điều quan trọng là phải giữ:

  • Địa chỉ IP giống nhau — để trang web không nghi ngờ về việc thay đổi thiết bị
  • Cookies và localStorage — để xác thực và theo dõi hành động
  • Fingerprint của trình duyệt — tập hợp các đặc điểm của thiết bị (User-Agent, độ phân giải màn hình, WebGL)
  • Trạng thái của script — những trang nào đã được xử lý, nơi dừng lại khi gặp lỗi

Nếu ít nhất một tham số thay đổi trong quá trình — trang web có thể khóa tài khoản, ngắt phân tích captcha hoặc đặt lại phiên xác thực.

Các tác vụ lâu dài điển hình: nuôi tài khoản Facebook Ads (6-12 giờ làm nóng), phân tích tất cả sản phẩm trong danh mục trên Wildberries (3-8 giờ), đăng bài hàng loạt trên 50 tài khoản Instagram (4-10 giờ với độ trễ), giám sát giá của đối thủ 24/7.

Các vấn đề điển hình khi có các phiên dài

Chúng ta sẽ xem xét những gì thường làm hỏng các phiên lâu dài và dẫn đến việc dừng tác vụ:

1. Xoay vòng địa chỉ IP của proxy

Nhiều dịch vụ proxy mặc định thay đổi IP mỗi 5-15 phút. Đối với việc phân tích không cần xác thực, điều này là bình thường, nhưng nếu bạn đã đăng nhập vào tài khoản Facebook Ads — việc thay đổi IP từ Moscow sang Saint Petersburg giữa phiên sẽ gây nghi ngờ. Nền tảng sẽ yêu cầu xác nhận đăng nhập, gửi mã đến điện thoại hoặc thậm chí khóa tài khoản vì hoạt động đáng ngờ.

Giải pháp: sử dụng sticky sessions (phiên dính) — chế độ mà proxy cung cấp cùng một IP trong 10 phút, 1 giờ hoặc 24 giờ. Về điều này sẽ được giải thích chi tiết trong phần dưới đây.

2. Thời gian chờ kết nối từ phía proxy

Một số nhà cung cấp proxy ngắt kết nối nếu không có hoạt động trong 10-30 phút. Nếu script của bạn tạm dừng giữa các hành động (ví dụ, giả lập con người — 5 phút xem sản phẩm, sau đó chuyển sang sản phẩm tiếp theo), proxy có thể đóng kết nối. Khi cố gắng tiếp tục làm việc, script sẽ gặp lỗi và dừng lại.

Giải pháp: cấu hình các yêu cầu keep-alive (ping proxy mỗi 2-3 phút) hoặc chọn nhà cung cấp không có thời gian chờ nghiêm ngặt. Proxy cư trú và di động thường giữ kết nối lâu hơn so với các trung tâm dữ liệu.

3. Thay đổi fingerprint của trình duyệt

Nếu bạn khởi động lại trình duyệt chống phát hiện hoặc script tạo một phiên bản trình duyệt mới — fingerprint sẽ thay đổi. Ngay cả với cùng một IP, trang web sẽ thấy rằng User-Agent, độ phân giải màn hình, danh sách phông chữ hoặc canvas fingerprint khác với phiên trước đó. Điều này kích hoạt hệ thống chống gian lận.

Giải pháp: lưu trữ hồ sơ trình duyệt (trong Dolphin Anty, AdsPower, Multilogin điều này được thực hiện tự động) và không tạo mới mỗi khi khởi động. Nếu bạn sử dụng Selenium hoặc Puppeteer — hãy lưu User Data Directory với cookies và cài đặt.

4. Mất trạng thái của script khi gặp lỗi

Script đã phân tích 6 giờ, xử lý 8000 sản phẩm trong số 10000, và bị lỗi do sự cố mạng. Nếu không lưu tiến trình — bạn sẽ phải bắt đầu lại từ đầu. Điều này đặc biệt quan trọng đối với các tác vụ kéo dài 12 giờ trở lên.

Giải pháp: lưu trữ kết quả trung gian vào cơ sở dữ liệu hoặc tệp sau mỗi N lần lặp (ví dụ, sau mỗi 100 sản phẩm). Khi khởi động lại, script sẽ tiếp tục từ vị trí đã lưu cuối cùng.

Những loại proxy nào phù hợp cho các tác vụ lâu dài

Không phải tất cả các loại proxy đều tốt cho các phiên dài. Dưới đây là bảng so sánh theo các tiêu chí về độ ổn định và thời gian sống của IP:

Loại proxy Thời gian sống của IP Độ ổn định Phù hợp cho
Trung tâm dữ liệu Không giới hạn (IP tĩnh) Cao, nhưng dễ bị phát hiện Phân tích không cần xác thực, giám sát giá
Cư trú 10 phút — 24 giờ (sticky sessions) Trung bình (tùy thuộc vào nhà cung cấp) Nuôi tài khoản, phân tích có xác thực
Di động 5-30 phút (thay đổi theo thời gian của nhà mạng) Thấp (thay đổi IP thường xuyên) Các tác vụ ngắn trên mạng xã hội, vượt qua các khóa nghiêm ngặt
Proxy ISP Không giới hạn (IP cư trú tĩnh) Rất cao Các tác vụ dài có xác thực, nuôi tài khoản cao cấp

Khuyến nghị khi lựa chọn:

  • Đối với việc phân tích các thị trường không cần xác thực (Wildberries, Ozon, Yandex.Market) — hãy sử dụng trung tâm dữ liệu với IP tĩnh. Chúng rẻ, nhanh, và nếu trang web không khóa trung tâm dữ liệu nghiêm ngặt — sẽ hoàn thành tác vụ trong 12+ giờ.
  • Đối với việc nuôi tài khoản Facebook Ads, TikTok Ads, Google Ads — chỉ sử dụng proxy cư trú hoặc ISP với sticky sessions trong 24 giờ. Proxy di động không phù hợp do thay đổi IP thường xuyên.
  • Đối với tự động hóa Instagram, TikTok — proxy cư trú với sticky sessions 1-6 giờ. Nếu tác vụ ngắn (đăng bài trên 10 tài khoản trong một giờ) — proxy di động cũng có thể phù hợp.
  • Đối với giám sát 24/7 (theo dõi giá của đối thủ, phân tích tin tức) — proxy ISP hoặc trung tâm dữ liệu, nếu trang web không khóa chúng.

Quan trọng: Proxy di động KHÔNG phù hợp cho các tác vụ lâu dài! IP thay đổi mỗi 5-30 phút theo thời gian của nhà mạng, và bạn không thể kiểm soát điều này. Chỉ sử dụng chúng cho các tác vụ ngắn (đăng ký tài khoản, đăng bài một lần, vượt qua captcha).

Sticky sessions: cách giữ IP trong 24 giờ

Sticky sessions (phiên dính) là chế độ hoạt động của proxy, trong đó bạn nhận được cùng một địa chỉ IP trong khoảng thời gian đã chỉ định: 10 phút, 1 giờ, 6 giờ hoặc 24 giờ. Điều này rất quan trọng cho các tác vụ có xác thực.

Cách hoạt động của sticky sessions

Thông thường, sticky sessions được thực hiện thông qua ID phiên trong URL của proxy. Thay vì định dạng tiêu chuẩn:

http://username:password@proxy.example.com:8000

Bạn thêm tham số phiên:

http://username-session-mysession123:password@proxy.example.com:8000

Bây giờ tất cả các yêu cầu với mã định danh mysession123 sẽ đi qua cùng một IP, cho đến khi thời gian sống của phiên hết hạn (thường là 10-30 phút theo mặc định). Nếu cần một phiên lâu hơn — nhà cung cấp có thể đề xuất tham số thời gian:

http://username-session-mysession123-lifetime-1440:password@proxy.example.com:8000

Trong đó lifetime-1440 có nghĩa là 1440 phút (24 giờ).

Cấu hình sticky sessions trong các dịch vụ phổ biến

Trong proxy cư trú: hầu hết các nhà cung cấp hỗ trợ sticky sessions thông qua các tham số trong tên người dùng. Hãy xác nhận định dạng trong tài liệu của nhà cung cấp của bạn. Các tùy chọn điển hình:

  • username-session-ABC123 — giữ IP trong thời gian mặc định (10-30 phút)
  • username-session-ABC123-sessionduration-60 — giữ trong 60 phút
  • username-country-us-session-ABC123 — IP từ Mỹ với việc giữ lại

Trong proxy ISP: thường IP là tĩnh theo mặc định, không cần sticky sessions — bạn luôn nhận được cùng một địa chỉ, cho đến khi bạn thay đổi proxy thủ công.

Trong các trung tâm dữ liệu: IP là tĩnh, không cần cấu hình bổ sung.

Ví dụ sử dụng trong trình duyệt chống phát hiện

Giả sử bạn đang nuôi tài khoản Facebook Ads trong Dolphin Anty. Tác vụ — 8 giờ làm nóng (truy cập các trang web, xem video, thích). Cấu hình:

  1. Mở hồ sơ trình duyệt trong Dolphin Anty
  2. Đi đến phần "Proxy"
  3. Chọn loại: HTTP hoặc SOCKS5
  4. Nhập máy chủ và cổng của proxy
  5. Trong trường "Đăng nhập", hãy chỉ định: username-session-farm001-sessionduration-480 (480 phút = 8 giờ)
  6. Nhập mật khẩu
  7. Nhấn "Kiểm tra proxy" — đảm bảo rằng IP được xác định
  8. Lưu hồ sơ

Bây giờ trong 8 giờ, tất cả các yêu cầu từ hồ sơ này sẽ đi qua cùng một IP. Ngay cả khi bạn đóng trình duyệt và mở lại sau một giờ — khi sử dụng cùng một ID phiên (farm001) bạn sẽ nhận được cùng một IP.

Mẹo: Sử dụng các ID phiên dễ hiểu, liên quan đến tác vụ. Ví dụ, farm-fb-account-001, parse-wb-electronics. Điều này sẽ đơn giản hóa việc gỡ lỗi nếu bạn có hàng chục tác vụ song song.

Cấu hình trình duyệt chống phát hiện cho các phiên dài

Các trình duyệt chống phát hiện (Dolphin Anty, AdsPower, Multilogin, GoLogin, Octo Browser) được tạo ra chính xác cho các phiên lâu dài với việc lưu fingerprint. Nhưng có những điểm cần lưu ý trong cấu hình, điều này rất quan trọng cho các tác vụ kéo dài 8 giờ trở lên.

1. Lưu hồ sơ trình duyệt

Hồ sơ trình duyệt là tập hợp các cookies, localStorage, fingerprint (User-Agent, canvas, WebGL, phông chữ). Tất cả các trình duyệt chống phát hiện tự động lưu hồ sơ khi đóng. Điều quan trọng là không tạo hồ sơ mới mỗi khi khởi động tác vụ!

Cách tiếp cận đúng:

  • Tạo hồ sơ một lần cho tác vụ cụ thể (ví dụ, "Nuôi tài khoản FB #1")
  • Cấu hình proxy với sticky session
  • Thực hiện lần khởi động đầu tiên, đăng nhập vào tài khoản
  • Đóng trình duyệt — hồ sơ sẽ được lưu
  • Khi khởi động lại, hãy mở cùng HỒ SƠ ĐÓ — xác thực và fingerprint sẽ được lưu lại

Cách tiếp cận sai:

  • Mỗi ngày tạo hồ sơ mới cho cùng một tác vụ
  • Xóa cookies thủ công giữa các lần khởi động
  • Thay đổi fingerprint (User-Agent, độ phân giải màn hình) giữa tác vụ

2. Cấu hình fingerprint cho độ ổn định

Đối với các tác vụ lâu dài, hãy chọn fingerprint THỰC TẾ, phù hợp với proxy. Nếu proxy từ Nga (Moscow) — đừng đặt User-Agent từ MacBook Pro với ngôn ngữ tiếng Anh. Tốt hơn:

  • Hệ điều hành: Windows 10 hoặc 11 (phổ biến nhất ở Nga)
  • Trình duyệt: Chrome phiên bản mới nhất (tự động cập nhật trong trình duyệt chống phát hiện)
  • Độ phân giải màn hình: 1920x1080 (phổ biến nhất)
  • Ngôn ngữ: ru-RU, múi giờ: Europe/Moscow
  • WebRTC: tắt hoặc thay thế bằng IP của proxy (để không rò rỉ IP thực)

Trong Dolphin Anty và AdsPower có chức năng "Tạo fingerprint ngẫu nhiên" — nó tạo ra sự kết hợp hợp lý của các tham số. Đối với các tác vụ lâu dài, điều này an toàn hơn so với việc cấu hình thủ công.

3. Tắt cập nhật tự động và khởi động lại

Nếu tác vụ chạy trong 12 giờ, hãy đảm bảo rằng:

  • Máy tính không đi vào chế độ ngủ (tắt trong cài đặt nguồn Windows/macOS)
  • Phần mềm diệt virus không khởi động lại hệ thống để cập nhật (hoãn cập nhật)
  • Trình duyệt chống phát hiện không tự động cập nhật giữa tác vụ (trong cài đặt tắt tự động cập nhật hoặc cấu hình vào ban đêm)

4. Sử dụng API của trình duyệt chống phát hiện để tự động hóa

Dolphin Anty, AdsPower, Multilogin cung cấp API để quản lý hồ sơ từ các script. Điều này cho phép:

  • Khởi động hồ sơ trình duyệt từ script Python/Node.js
  • Kết nối với nó qua Selenium hoặc Puppeteer
  • Thực hiện tác vụ lâu dài
  • Đóng hồ sơ tự động khi hoàn thành

Ví dụ khởi động hồ sơ Dolphin Anty qua API (Python):

import requests
from selenium import webdriver

# Khởi động hồ sơ qua API Dolphin Anty
profile_id = "123456"
response = requests.get(f"http://localhost:3001/v1.0/browser_profiles/{profile_id}/start")
data = response.json()

# Kết nối Selenium với trình duyệt đã khởi động
options = webdriver.ChromeOptions()
options.debugger_address = data['automation']['port']
driver = webdriver.Chrome(options=options)

# Thực hiện tác vụ
driver.get("https://example.com")
# ... mã của bạn cho việc phân tích hoặc tự động hóa ...

# Đóng hồ sơ
requests.get(f"http://localhost:3001/v1.0/browser_profiles/{profile_id}/stop")

Cách tiếp cận này đảm bảo rằng fingerprint và cookies sẽ được lưu lại, ngay cả khi script bị lỗi — khi khởi động lại bạn sẽ kết nối với cùng một hồ sơ.

Tự động hóa và lưu trạng thái

Đối với các tác vụ kéo dài 8 giờ trở lên, việc lưu tiến trình là rất quan trọng, để không phải bắt đầu lại từ đầu khi gặp sự cố. Chúng ta sẽ xem xét các phương pháp cho các công cụ khác nhau.

1. Lưu tiến trình vào cơ sở dữ liệu

Nếu bạn phân tích 10000 sản phẩm từ Wildberries, hãy lưu kết quả vào SQLite, PostgreSQL hoặc MongoDB sau mỗi 50-100 sản phẩm. Cấu trúc bảng:

CREATE TABLE parsing_progress (
  id INTEGER PRIMARY KEY,
  url TEXT,
  status TEXT,  -- 'pending', 'completed', 'error'
  data TEXT,    -- JSON với kết quả
  created_at TIMESTAMP
);

Khi khởi động, script sẽ kiểm tra những URL nào chưa được xử lý (status = 'pending') và tiếp tục từ đó. Nếu script bị lỗi — khi khởi động lại nó sẽ bỏ qua các sản phẩm đã được xử lý.

2. Sử dụng hàng đợi tác vụ

Đối với các tác vụ phức tạp (ví dụ, nuôi 50 tài khoản Facebook Ads song song) hãy sử dụng hệ thống hàng đợi: Celery (Python), Bull (Node.js), RabbitMQ. Nguyên tắc:

  • Tạo danh sách các tác vụ (50 tài khoản)
  • Mỗi tác vụ — độc lập (hồ sơ trình duyệt riêng, proxy riêng)
  • Các worker lấy tác vụ từ hàng đợi và thực hiện
  • Nếu worker bị lỗi — tác vụ sẽ trở lại hàng đợi và được lấy bởi worker khác

Điều này đảm bảo rằng không có tác vụ nào bị mất, ngay cả khi một phần các quy trình bị lỗi.

3. Ghi log và giám sát

Đối với các tác vụ kéo dài 12 giờ trở lên, hãy cấu hình ghi log chi tiết:

  • Ghi vào log mỗi hành động (đã mở trang, nhấn nút, nhận dữ liệu)
  • Lưu ảnh chụp màn hình khi có lỗi (trong Selenium: driver.save_screenshot('error.png'))
  • Sử dụng các mức độ log: INFO cho các hành động thông thường, WARNING cho các tình huống đáng ngờ (captcha, tải chậm), ERROR cho các lỗi

Ví dụ về cấu hình ghi log trong Python:

import logging

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(levelname)s - %(message)s',
    handlers=[
        logging.FileHandler('parsing.log'),
        logging.StreamHandler()
    ]
)

logger = logging.getLogger(__name__)

# Trong mã
logger.info(f"Đã xử lý sản phẩm {product_id}")
logger.warning(f"Tải trang chậm: {url}")
logger.error(f"Lỗi phân tích: {error}")

Giám sát và khôi phục sau khi ngắt kết nối

Ngay cả khi đã cấu hình đúng proxy và trình duyệt, phiên có thể bị ngắt: mạng bị lỗi, proxy khởi động lại, trang web hiển thị captcha. Quan trọng là phát hiện vấn đề nhanh chóng và khôi phục hoạt động.

1. Kiểm tra khả năng truy cập của proxy

Trước khi bắt đầu tác vụ và định kỳ (mỗi 30-60 phút) hãy kiểm tra rằng proxy đang hoạt động:

import requests

def check_proxy(proxy_url):
    try:
        response = requests.get(
            'https://api.ipify.org?format=json',
            proxies={'http': proxy_url, 'https': proxy_url},
            timeout=10
        )
        if response.status_code == 200:
            ip = response.json()['ip']
            logger.info(f"Proxy đang hoạt động, IP: {ip}")
            return True
    except Exception as e:
        logger.error(f"Proxy không phản hồi: {e}")
        return False

# Kiểm tra trước khi bắt đầu
if not check_proxy(proxy_url):
    logger.error("Proxy không khả dụng, dừng tác vụ")
    exit(1)

2. Xử lý captcha và khóa

Nếu trang web hiển thị captcha (Google reCAPTCHA, hCaptcha, Cloudflare Turnstile) — tác vụ sẽ dừng lại. Các phương án giải quyết:

  • Giải quyết captcha tự động: tích hợp với các dịch vụ 2Captcha, Anti-Captcha, CapMonster. Họ giải quyết captcha trong 10-30 giây, script tiếp tục hoạt động.
  • Thay đổi proxy: nếu captcha xuất hiện do IP đáng ngờ — hãy chuyển sang proxy khác trong nhóm và tiếp tục.
  • Tạm dừng và thử lại: đôi khi captcha xuất hiện do hành động quá nhanh. Hãy tạm dừng 2-5 phút, sau đó thử lại yêu cầu.

3. Tự động khởi động lại khi gặp lỗi

Bọc mã chính trong try-except và khi có lỗi hãy khởi động lại tác vụ:

import time

max_retries = 3
retry_delay = 60  # giây

for attempt in range(max_retries):
    try:
        # Mã chính của tác vụ
        run_parsing()
        break  # Nếu thành công — thoát khỏi vòng lặp
    except Exception as e:
        logger.error(f"Lỗi ở lần thử {attempt + 1}: {e}")
        if attempt < max_retries - 1:
            logger.info(f"Khởi động lại sau {retry_delay} giây...")
            time.sleep(retry_delay)
        else:
            logger.error("Đã vượt quá số lần thử, dừng lại")
            raise

4. Thông báo về các vấn đề

Đối với các tác vụ hoạt động vào ban đêm hoặc vào cuối tuần, hãy thiết lập thông báo khi có lỗi nghiêm trọng:

  • Bot Telegram: gửi tin nhắn khi có lỗi (thông qua thư viện python-telegram-bot)
  • Email: qua SMTP (thư viện smtplib trong Python)
  • SMS: qua Twilio hoặc các dịch vụ tương tự

Ví dụ gửi thông báo trong Telegram:

import requests

def send_telegram_alert(message):
    bot_token = "YOUR_BOT_TOKEN"
    chat_id = "YOUR_CHAT_ID"
    url = f"https://api.telegram.org/bot{bot_token}/sendMessage"
    requests.post(url, data={'chat_id': chat_id, 'text': message})

# Khi có lỗi
try:
    run_parsing()
except Exception as e:
    send_telegram_alert(f"⚠️ Lỗi phân tích: {e}")

Các kịch bản sử dụng thực tế

Chúng ta sẽ xem xét các tác vụ cụ thể và cấu hình quản lý phiên tối ưu cho mỗi tác vụ.

Kịch bản 1: Nuôi tài khoản Facebook Ads (8 giờ làm nóng)

Tác vụ: Làm nóng tài khoản Facebook Ads mới trước khi chạy quảng cáo. Cần giả lập hành vi của người dùng bình thường: truy cập Facebook, đọc dòng thời gian, xem video, thích, nhấp vào quảng cáo. Tổng cộng 8 giờ hoạt động với các khoảng dừng.

Cấu hình:

  • Proxy: Cư trú với sticky session trong 8-12 giờ, quốc gia — giống như đã chỉ định trong tài khoản (nếu tài khoản ở Mỹ — proxy từ Mỹ)
  • Trình duyệt: Dolphin Anty hoặc AdsPower, tạo hồ sơ riêng cho tài khoản này
  • Fingerprint: Thực tế cho quốc gia (Windows 10, Chrome, độ phân giải 1920x1080, ngôn ngữ en-US cho Mỹ)
  • Tự động hóa: Script trên Selenium với độ trễ ngẫu nhiên (5-15 phút giữa các hành động), giả lập cuộn và di chuyển chuột
  • Lưu tiến trình: Ghi log tất cả các hành động vào tệp, để khi gặp sự cố có thể tiếp tục từ lần cuối

Rủi ro: Thay đổi IP giữa phiên — Facebook sẽ yêu cầu xác nhận đăng nhập. Hành động quá nhanh — tài khoản sẽ bị nghi ngờ.

Kịch bản 2: Phân tích tất cả sản phẩm trong danh mục trên Wildberries (6 giờ)

Tác vụ: Phân tích tất cả sản phẩm trong danh mục "Điện tử" trên Wildberries (khoảng 50000 sản phẩm). Cần lấy tên, giá, xếp hạng, số lượng đánh giá. Phân tích diễn ra không cần xác thực.

Cấu hình:

  • Proxy: Trung tâm dữ liệu với IP tĩnh (Wildberries thường không khóa các trung tâm dữ liệu nghiêm ngặt) hoặc cư trú với sticky session trong 6+ giờ
  • Trình duyệt: Không bắt buộc, có thể sử dụng requests + BeautifulSoup (nhanh hơn) hoặc Selenium (nếu trang web sử dụng JavaScript)
  • Lưu tiến trình: Cơ sở dữ liệu SQLite, lưu mỗi 100 sản phẩm. Khi khởi động lại, bỏ qua các sản phẩm đã được xử lý.
  • Xử lý lỗi: Nếu sản phẩm không tải được (404, thời gian chờ) — bỏ qua và tiếp tục, ghi vào log

Rủi ro: Wildberries có thể hiển thị captcha khi có quá nhiều yêu cầu. Giải pháp — thêm độ trễ 1-3 giây giữa các sản phẩm hoặc sử dụng nhóm proxy với xoay vòng.

Kịch bản 3: Đăng bài hàng loạt trên 30 tài khoản Instagram (5 giờ)

Tác vụ: Đăng cùng một bài viết trên 30 tài khoản Instagram của khách hàng. Đối với mỗi tài khoản — văn bản và hashtag riêng. Cần thực hiện với độ trễ, để không bị coi là spam.

Cấu hình:

  • Proxy: Cư trú với sticky session trong 1-2 giờ, cho mỗi tài khoản — proxy riêng (để các tài khoản không liên kết qua IP)
  • Trình duyệt: Dolphin Anty, tạo 30 hồ sơ (mỗi hồ sơ cho một tài khoản), trong mỗi hồ sơ — proxy riêng
  • Tự động hóa: Script khởi động các hồ sơ lần lượt, thực hiện đăng bài qua Instagram Web hoặc API, đóng hồ sơ. Độ trễ giữa các tài khoản — 10-15 phút.
  • Lưu tiến trình: Danh sách tài khoản trong CSV, đánh dấu trạng thái (đã đăng/đang chờ/lỗi)

Rủi ro: Instagram có thể khóa tài khoản do hành động hàng loạt. Giải pháp — thêm độ trễ ngẫu nhiên, giả lập hành vi của con người (cuộn dòng thời gian trước khi đăng bài).

Kịch bản 4: Giám sát giá của đối thủ trên Ozon 24/7

Tác vụ: Theo dõi giá của 500 sản phẩm của đối thủ trên Ozon mỗi giờ, ghi lại các thay đổi vào cơ sở dữ liệu. Tác vụ hoạt động liên tục.

Cấu hình:

  • Proxy: Proxy ISP với IP tĩnh (không bao giờ thay đổi) hoặc trung tâm dữ liệu
  • Tự động hóa: Cron-job (Linux) hoặc Task Scheduler (Windows), khởi động script mỗi giờ
  • Lưu dữ liệu: PostgreSQL hoặc MySQL, bảng với các trường: product_id, price, timestamp
  • Xử lý lỗi: Nếu Ozon không khả dụng (lỗi 500) — bỏ qua vòng lặp, ghi vào log, thử lại sau một giờ

Rủi ro: Ozon có thể khóa IP khi có quá nhiều yêu cầu. Giải pháp — sử dụng nhóm 3-5 proxy với xoay vòng.

Kết luận

Quản lý phiên cho các tác vụ lâu dài — là sự kết hợp giữa việc chọn proxy đúng, cấu hình trình duyệt chống phát hiện và tự động hóa đáng tin cậy với việc lưu tiến trình. Những điểm chính:

  • Đối với các tác vụ có xác thực (nuôi tài khoản, làm việc với các bảng quảng cáo) hãy sử dụng proxy cư trú hoặc ISP với sticky sessions trong 6-24 giờ
  • Đối với phân tích không cần xác thực, các trung tâm dữ liệu với IP tĩnh sẽ phù hợp — chúng rẻ hơn và nhanh hơn
  • Proxy di động KHÔNG phù hợp cho các tác vụ lâu dài do thay đổi IP thường xuyên
  • Lưu hồ sơ trình duyệt và không thay đổi fingerprint giữa các tác vụ
  • Nhất định phải ghi log tiến trình và cấu hình tự động khởi động lại khi có lỗi
  • Đối với các tác vụ quan trọng, hãy thiết lập thông báo về các vấn đề (Telegram, email)

Nếu bạn dự định khởi động các tác vụ kéo dài 8 giờ trở lên với xác thực (nuôi tài khoản, tự động hóa mạng xã hội, làm việc với các bảng quảng cáo), chúng tôi khuyên bạn nên thử proxy cư trú với hỗ trợ sticky sessions — chúng đảm bảo IP ổn định trong suốt phiên và giảm thiểu rủi ro bị khóa. Đối với việc phân tích các thị trường và giám sát giá mà không cần xác thực, proxy trung tâm dữ liệu sẽ là lựa chọn tốt hơn — chúng nhanh hơn và rẻ hơn trong khi vẫn đảm bảo độ ổn định của kết nối.

```