Kembali ke blog

Proxy untuk Mengambil Ulasan dari Amazon, Google Reviews, dan Yelp: Panduan Lengkap Tanpa Pemblokiran

Ingin mengumpulkan ulasan secara otomatis dari Amazon, Google Reviews, dan Yelp, tetapi terus-menerus mendapatkan pemblokiran? Dalam artikel ini, kami membahas proxy mana yang harus dipilih dan bagaimana mengatur pengumpulan data tanpa pemblokiran.

📅16 Mei 2026
```html

Anda memulai pengumpulan ulasan otomatis dari Amazon atau Google — dan hanya dalam 10-20 permintaan, Anda mendapatkan CAPTCHA atau larangan IP. Apakah ini terdengar familiar? Marketplace dan platform ulasan secara aktif melindungi diri dari pengambilan data: mendeteksi bot, memblokir rentang alamat IP dari pusat data, dan meminta solusi CAPTCHA. Namun, dengan proxy yang tepat, masalah ini dapat diselesaikan sekali dan untuk selamanya.

Dalam panduan ini, kita akan membahas jenis proxy mana yang cocok untuk setiap platform, bagaimana mengatur rotasi IP, alat apa yang harus digunakan tanpa menulis kode — dan bagaimana akhirnya mengumpulkan ribuan ulasan setiap hari tanpa pemblokiran.

Mengapa Amazon, Google, dan Yelp memblokir pengambilan ulasan

Sebelum memilih proxy, penting untuk memahami: mengapa pemblokiran terjadi? Ini bukan hanya karena platform "tidak ingin berbagi data". Mereka memiliki mekanisme perlindungan teknis tertentu yang perlu dihindari dengan cerdas.

Terlalu banyak permintaan dari satu IP. Ketika orang biasa menggulir ulasan di Amazon, mereka melakukan 2-5 permintaan per menit. Sementara parser — ratusan. Sistem melihat aktivitas abnormal dan memblokir IP. Ini adalah alasan paling umum untuk pemblokiran saat mengumpulkan data.

Alamat IP pusat data dalam daftar hitam. Amazon, Google, dan Yelp telah lama memasukkan rentang IP dari penyedia cloud besar ke dalam daftar hitam: AWS, Google Cloud, DigitalOcean, Hetzner. Jika Anda menggunakan proxy pusat data murah dengan alamat yang "terkenal" — Anda akan diblokir bahkan sebelum permintaan pertama.

Analisis sidik jari browser dan header. Sistem perlindungan modern (Cloudflare, PerimeterX, DataDome) menganalisis tidak hanya IP, tetapi juga header HTTP, User-Agent, perilaku mouse, urutan permintaan. Jika header menunjukkan bot — pemblokiran tidak terhindarkan.

Pembatasan geolokasi. Beberapa ulasan di Amazon hanya tersedia untuk pengguna dari negara tertentu. Misalnya, ulasan di amazon.de terlihat berbeda dari Jerman dibandingkan dari Rusia. Untuk pengumpulan data yang benar, diperlukan proxy dengan geolokasi yang sesuai.

CAPTCHA dan tantangan JS. Google sangat aktif menggunakan reCAPTCHA. Yelp menerapkan pemeriksaan JS yang tidak dapat dilalui oleh permintaan HTTP sederhana. Mekanisme ini memerlukan penggunaan alat browser atau layanan khusus untuk menyelesaikan CAPTCHA.

Kesimpulan utama:

Pemblokiran bukanlah kebetulan, melainkan sistem. Menghindarinya hanya dapat dilakukan secara komprehensif: jenis proxy yang tepat + rotasi IP + header permintaan yang cerdas + alat yang sesuai untuk pengambilan data.

Jenis-jenis proxy yang ada dan mana yang cocok untuk pengambilan ulasan

Tidak semua proxy sama bermanfaatnya untuk mengumpulkan ulasan. Mari kita bahas tiga jenis utama dan penerapannya untuk tugas ini.

Proxy pusat data (Datacenter Proxies)

Ini adalah alamat IP yang dimiliki oleh perusahaan server. Mereka cepat, murah, dan cocok untuk tugas di mana kecepatan lebih penting daripada anonimitas. Namun, untuk pengambilan ulasan di Amazon atau Google, mereka bekerja dengan buruk: sebagian besar IP tersebut sudah masuk dalam daftar hitam. Anda mungkin dapat mengumpulkan beberapa halaman, tetapi dengan cepat akan mendapatkan pemblokiran atau CAPTCHA.

Proxy pusat data hanya dibenarkan untuk pengujian parser atau untuk platform dengan perlindungan minimal — misalnya, situs ulasan regional kecil.

Proxy residensial (Residential Proxies)

Ini adalah alamat IP dari pengguna rumah nyata. Dari sudut pandang Amazon atau Google — ini adalah orang biasa dengan internet rumah. Proxy semacam ini hampir tidak pernah masuk dalam daftar hitam, karena IP mereka terus berubah dan dimiliki oleh perangkat nyata.

Proxy residensial adalah pilihan optimal untuk pengambilan ulasan di Amazon, Yelp, dan sebagian besar platform dengan perlindungan sedang. Mereka memungkinkan permintaan dengan geolokasi yang diperlukan (negara, kota), yang sangat penting untuk mendapatkan ulasan lokal.

Proxy seluler (Mobile Proxies)

Alamat IP dari operator seluler (4G/5G). Ini adalah jenis lalu lintas yang paling "terpercaya" untuk platform mana pun: IP seluler jarang diblokir, karena satu IP dapat digunakan oleh ratusan pengguna nyata (NAT dari operator seluler). Google sangat toleran terhadap alamat seluler.

Proxy seluler sangat diperlukan untuk pengambilan Google Reviews dan Yelp, di mana perlindungan terhadap bot sangat agresif. Mereka lebih mahal daripada proxy residensial, tetapi memberikan persentase permintaan yang berhasil tanpa CAPTCHA yang tertinggi.

Pengambilan ulasan Amazon: fitur dan pengaturan proxy

Amazon adalah salah satu situs yang paling sulit untuk diambil datanya. Perusahaan ini menggunakan beberapa tingkat perlindungan sekaligus: analisis perilaku, pemeriksaan header, geolokasi, dan sistem CAPTCHA yang agresif. Namun, ribuan pemasar dan analis mengumpulkan ulasan dari Amazon setiap hari — mereka hanya melakukannya dengan benar.

Apa yang dibutuhkan untuk pengambilan ulasan Amazon yang sukses

Berikut adalah setidaknya kondisi yang diperlukan agar pengambilan data dapat berjalan stabil:

  • Proxy residensial atau seluler dengan geolokasi negara yang diperlukan (AS untuk amazon.com, DE untuk amazon.de)
  • Rotasi IP — minimal setiap 10-30 permintaan
  • User-Agent yang benar — meniru browser nyata (Chrome, Firefox)
  • Penundaan antara permintaan — 2-5 detik, agar tidak terlihat seperti bot
  • Cookies-sesi — Amazon lebih responsif terhadap permintaan dengan cookie yang disimpan

Pengaturan langkah demi langkah untuk Amazon

Langkah 1. Pilih proxy residensial dengan geolokasi negara yang diperlukan. Untuk amazon.com — AS, untuk amazon.co.uk — Inggris. Ini penting: Amazon menunjukkan ulasan yang berbeda kepada pengguna dari negara yang berbeda.

Langkah 2. Atur rotasi. Jika Anda menggunakan parser siap pakai (misalnya, Octoparse atau ParseHub), masukkan proxy di pengaturan koneksi. Sebagian besar alat semacam itu mendukung daftar proxy dengan rotasi otomatis.

Langkah 3. Atur penundaan antara permintaan. Di Octoparse, ini dilakukan di bagian "Pengaturan Penundaan" — atur interval acak dari 2 hingga 6 detik.

Langkah 4. Jalankan tes pada 50-100 halaman. Jika CAPTCHA muncul lebih dari 5% dari waktu — tingkatkan penundaan atau ganti kumpulan proxy.

Langkah 5. Skala. Setelah tes berhasil, Anda dapat mulai mengumpulkan ribuan ulasan. Kumpulan proxy residensial yang baik memungkinkan Anda mengumpulkan 5000-10000 ulasan per hari tanpa pemblokiran.

Penting tentang Amazon:

Amazon secara teratur memperbarui algoritma perlindungan. Jika parser Anda bekerja sebulan yang lalu, tetapi sekarang mulai mendapatkan pemblokiran — kemungkinan besar algoritma pemeriksaan telah berubah. Solusinya: perbarui User-Agent ke versi terbaru Chrome dan periksa apakah proxy Anda masuk dalam daftar hitam.

Pengumpulan ulasan Google Reviews: apa yang perlu diketahui

Google Reviews — ulasan di Google Maps dan Profil Bisnis Google — adalah sumber data yang sangat berharga bagi pemasar, spesialis SEO, dan analis. Namun, Google melindungi datanya dengan sangat agresif: reCAPTCHA v3, analisis perilaku, pemeriksaan sidik jari browser.

Kesulitan utama: Google Reviews tidak dimuat melalui permintaan HTTP biasa. Ulasan dimuat secara dinamis melalui JavaScript. Ini berarti bahwa parser HTTP sederhana tidak akan berhasil — Anda memerlukan alat yang dapat merender JavaScript (parser berbasis browser).

Cara mengumpulkan Google Reviews dengan benar

Opsi 1: Layanan siap pakai. Alat seperti Outscraper, Apify (aktor Google Maps Scraper) atau PhantomBuster dapat mengumpulkan Google Reviews melalui mesin browser. Anda hanya perlu memasukkan URL atau nama tempat dan menghubungkan proxy.

Opsi 2: Octoparse dengan mode browser. Octoparse mendukung mode rendering browser. Di pengaturan, masukkan proxy residensial atau seluler — dan alat akan mengumpulkan ulasan seperti pengguna nyata.

Opsi 3: Google Places API. Cara resmi — menggunakan Google Places API. Ini memberikan hingga 5 ulasan per tempat secara gratis, tetapi untuk volume yang lebih besar, diperlukan pembayaran. Namun, tidak ada pemblokiran dan proxy yang diperlukan.

Mengapa untuk Google diperlukan proxy seluler

Google adalah pencipta reCAPTCHA dan salah satu pemimpin dalam mendeteksi bot. Proxy residensial bekerja, tetapi IP seluler memberikan hasil yang jauh lebih baik. Alasannya sederhana: Google sendiri adalah platform seluler dan mempercayai lalu lintas seluler. Permintaan dari IP seluler jarang memicu CAPTCHA dan lebih jarang terkena analisis perilaku.

Untuk pengumpulan Google Reviews yang besar (ribuan tempat per hari), disarankan untuk menggunakan proxy seluler yang dapat diputar dengan geolokasi kota atau wilayah yang diperlukan. Dengan cara ini, ulasan akan sangat relevan untuk pencarian lokal.

Pengambilan Yelp tanpa larangan: petunjuk langkah demi langkah

Yelp adalah platform ulasan terbesar di AS. Bagi pemasar yang bekerja dengan pasar AS, ini adalah sumber data yang wajib tentang pesaing, sentimen pelanggan, dan tren di niche. Mengambil data dari Yelp lebih sulit daripada yang terlihat pada pandangan pertama: platform ini menggunakan Cloudflare dan sistem perlindungan botnya sendiri.

Fitur perlindungan Yelp

  • Cloudflare Bot Management — menganalisis perilaku dan sidik jari
  • Pembatasan permintaan: lebih dari 30-50 permintaan per menit dari satu IP — pemblokiran
  • Pemeriksaan JavaScript saat kunjungan pertama
  • Beberapa ulasan disembunyikan ("ulasan yang difilter") dan hanya tersedia untuk pengguna yang terautentikasi

Petunjuk langkah demi langkah untuk Yelp

Langkah 1. Pilih alat yang mendukung Cloudflare. Parser biasa tidak akan melewati Cloudflare. Gunakan Apify (aktor Yelp Scraper), Bright Data Scraping Browser, atau PhantomBuster — mereka dapat menghindari pemeriksaan JS.

Langkah 2. Hubungkan proxy residensial dengan geolokasi AS. Yelp berfokus pada pasar AS. Proxy dengan IP AS akan memberikan akses maksimum ke data dan jumlah pemblokiran yang minimal.

Langkah 3. Atur rotasi setiap 5-10 permintaan. Yelp sangat sensitif terhadap frekuensi permintaan. Rotasi IP setiap 5-10 halaman adalah syarat wajib untuk operasi yang stabil.

Langkah 4. Tambahkan penundaan 3-8 detik antara permintaan. Penundaan acak meniru perilaku pengguna nyata dan secara signifikan mengurangi risiko pemblokiran.

Langkah 5. Gunakan Yelp Fusion API untuk sebagian data. Yelp menyediakan API resmi dengan akses ke data dasar tentang bisnis dan ulasan. Untuk volume kecil, ini adalah cara paling sederhana tanpa risiko pemblokiran.

Alat untuk mengumpulkan ulasan tanpa menulis kode

Kabar baik: untuk pengambilan ulasan tidak perlu menjadi programmer. Ada alat siap pakai dengan antarmuka visual yang mendukung koneksi proxy dan rotasi IP otomatis. Mari kita bahas yang paling populer di antaranya.

Alat Platform Dukungan proxy Tingkat kesulitan
Octoparse Amazon, Yelp, situs web apa pun ✅ Daftar proxy + rotasi Rendah (mode visual)
Apify Amazon, Google Maps, Yelp ✅ Proxy bawaan + proxy Anda sendiri Rendah (aktor siap pakai)
PhantomBuster Google Maps, Yelp ✅ Proxy residensial Rendah (template)
ParseHub Amazon, Yelp, situs web apa pun ✅ Daftar proxy Sedang
Outscraper Google Reviews, Maps ✅ Terintegrasi Sangat rendah (SaaS)

Cara menghubungkan proxy di Octoparse (langkah demi langkah)

Octoparse adalah salah satu alat paling populer di kalangan pemasar tanpa latar belakang teknis. Berikut cara menghubungkan proxy:

  1. Buka Octoparse → pergi ke Settings → Proxy Settings
  2. Pilih “Use custom proxy”
  3. Tempelkan daftar proxy dalam format ip:port:login:password
  4. Aktifkan “Auto rotate proxy” — alat akan secara otomatis mengganti IP
  5. Klik “Test proxy” — pastikan semua proxy berfungsi
  6. Jalankan tugas dalam mode biasa

Cara menghubungkan proxy di Apify

  1. Kunjungi apify.com → pilih aktor yang diperlukan (misalnya, “Amazon Reviews Scraper”)
  2. Di bagian “Input”, temukan kolom “Proxy configuration”
  3. Pilih “Custom proxies” dan tempelkan data proxy Anda
  4. Masukkan URL halaman dengan ulasan atau kode ASIN produk (untuk Amazon)
  5. Klik “Start” — hasil akan tersedia dalam format JSON atau Excel

Rotasi proxy dan aturan pengambilan data yang aman

Bahkan proxy yang paling berkualitas pun tidak akan membantu jika aturan pengambilan data yang aman tidak diikuti. Platform menganalisis pola perilaku, dan satu pola permintaan yang salah dapat menyebabkan pemblokiran seluruh kumpulan IP.

Aturan 1: Rotasi IP secara teratur

Untuk Amazon, disarankan untuk mengganti IP setiap 10-20 permintaan. Untuk Google — setiap 5-10. Untuk Yelp — setiap 5-8. Jika Anda menggunakan proxy sesi (sticky sessions), pastikan sesi tidak melebihi 10-15 menit — setelah itu, mintalah IP baru.

Aturan 2: Meniru perilaku nyata

Pengguna nyata tidak melakukan permintaan dengan interval yang sempurna 2 detik. Tambahkan penundaan acak: dari 1 hingga 8 detik. Kadang-kadang, lakukan jeda selama 30-60 detik — seolah-olah seseorang sedang membaca halaman. Ini secara signifikan mengurangi kemungkinan deteksi.

Aturan 3: Gunakan User-Agent yang terkini

User-Agent harus sesuai dengan browser nyata. Versi Chrome atau Firefox yang sudah usang segera menimbulkan kecurigaan. Perbarui User-Agent setidaknya sebulan sekali. Parser yang baik (Octoparse, Apify) melakukan ini secara otomatis.

Aturan 4: Jangan ambil data di malam hari (waktu lokal platform)

Sistem perlindungan lebih sensitif terhadap lalu lintas mencurigakan di malam hari. Jika Anda mengambil data dari Amazon AS, lebih baik melakukannya di siang hari waktu Amerika (EST/PST) — ketika ada banyak pengguna nyata di platform dan permintaan Anda "tenggelam" dalam lalu lintas umum.

Aturan 5: Pantau persentase permintaan yang berhasil

Indikator yang baik adalah lebih dari 95% permintaan yang berhasil tanpa CAPTCHA. Jika persentase turun di bawah 85% — ada yang tidak beres. Periksa: apakah proxy sudah usang, apakah algoritma perlindungan telah berubah, apakah perlu memperbarui User-Agent atau meningkatkan penundaan.

Checklist pengambilan data ulasan yang aman:

  • ✅ Proxy residensial atau seluler dengan geolokasi yang diperlukan
  • ✅ Rotasi IP setiap 5-20 permintaan (tergantung platform)
  • ✅ Penundaan acak 1-8 detik antara permintaan
  • ✅ User-Agent yang terkini (versi terbaru Chrome)
  • ✅ Pengambilan data di siang hari waktu lokal platform
  • ✅ Pemantauan persentase permintaan yang berhasil (target: >95%)
  • ✅ Pembaruan kumpulan proxy setiap 1-2 bulan

Perbandingan jenis proxy untuk berbagai platform ulasan

Di bawah ini adalah tabel ringkasan yang akan membantu Anda memilih jenis proxy yang tepat untuk tugas tertentu dengan cepat. Gunakan sebagai panduan saat mengatur pengambilan data.

Platform Datacenter Residensial Seluler Rekomendasi
Ulasan Amazon ❌ Diblokir ✅ Baik ✅ Sangat Baik Residensial (AS)
Ulasan Google ❌ Diblokir ⚠️ Sedang ✅ Sangat Baik Seluler
Yelp ❌ Diblokir ✅ Baik ✅ Sangat Baik Residensial (AS)
Trustpilot ⚠️ Sebagian ✅ Baik ✅ Sangat Baik Residensial
Wildberries / Ozon ⚠️ Bekerja ✅ Sangat Baik ✅ Sangat Baik Residensial (RU)
TripAdvisor ❌ Diblokir ✅ Baik ✅ Sangat Baik Residensial

Mengapa mengumpulkan ulasan: skenario penggunaan

Pengumpulan ulasan otomatis menyelesaikan beberapa tugas bisnis sekaligus:

  • Analisis pesaing. Mengumpulkan ulasan tentang produk pesaing di Amazon → menemukan kelemahan → menggunakan dalam pemasaran Anda
  • Pemantauan reputasi. Secara otomatis melacak ulasan baru tentang merek Anda di semua platform
  • Penelitian audiens. Menganalisis ribuan ulasan → mengidentifikasi pola → meningkatkan produk
  • SEO dan konten. Mengumpulkan ulasan untuk analisis semantik, mengidentifikasi kata kunci yang digunakan oleh pembeli nyata
  • Agrigator ulasan. Membuat layanan yang mengagregasi ulasan dari beberapa platform untuk bisnis

Pengambilan ulasan di marketplace Rusia

Jika bisnis Anda berfokus pada pasar Rusia, pengumpulan ulasan dari Wildberries, Ozon, dan Yandex.Market juga relevan. Platform-platform ini memiliki perlindungan yang lebih lembut dibandingkan dengan Amazon, tetapi juga memblokir pengambilan data massal. Untuk mereka, cukup menggunakan proxy residensial dengan IP Rusia — mereka memungkinkan pengumpulan data yang stabil tanpa CAPTCHA dan pemblokiran.

Alat populer untuk pengambilan data dari marketplace Rusia: Screaming Frog (dengan proxy), Octoparse, serta layanan khusus seperti Moneyplace atau MPStats, yang sudah menyertakan proxy dalam infrastruktur mereka.

Kesimpulan: bagaimana memulai pengumpulan ulasan tanpa pemblokiran sekarang juga

Pengumpulan ulasan otomatis dari Amazon, Google Reviews, dan Yelp adalah alat yang kuat bagi pemasar, analis, dan spesialis e-commerce. Hambatan utama — pemblokiran. Dan solusi utama — jenis proxy yang tepat dikombinasikan dengan pengaturan rotasi dan penundaan yang cerdas.

Singkatnya: untuk Amazon dan Yelp, gunakan proxy residensial dengan geolokasi negara yang diperlukan. Untuk Google Reviews — gunakan proxy seluler, karena mereka memberikan persentase permintaan yang berhasil tertinggi. Proxy pusat data untuk tugas ini hampir tidak berguna — IP mereka sudah lama masuk dalam daftar hitam.

Dari alat tanpa kode, Octoparse dan Apify adalah yang paling cocok — keduanya mendukung koneksi proxy eksternal dan rotasi otomatis. Untuk Google Reviews, pertimbangkan juga Outscraper — ini adalah layanan khusus yang sudah dioptimalkan untuk pengumpulan data Google Maps.

Jika Anda berencana untuk secara teratur mengumpulkan ulasan dari beberapa platform, kami merekomendasikan untuk memulai dengan proxy residensial — mereka memberikan keseimbangan optimal antara kecepatan, anonimitas, dan biaya, serta cocok untuk sebagian besar tugas pemantauan ulasan. Untuk bekerja dengan Google Reviews, di mana perlindungan sangat agresif, pertimbangkan proxy seluler — mereka memberikan persentase permintaan yang berhasil tertinggi tanpa CAPTCHA.

```