Voltar ao blog

Como Coletar Dados Legalmente Usando Proxies: Guia Jurídico para Empresas 2024

Analisamos os aspectos legais da coleta de dados por meio de proxies: o que pode ser extraído legalmente, como não violar o GDPR e dados pessoais, quais métodos são legais para os negócios.

📅1 de março de 2026
```html

A coleta de dados através de proxies é uma prática comum para profissionais de marketing, analistas e proprietários de negócios. Mas onde está a linha entre a extração legal e a violação da lei? Neste artigo, analisamos os aspectos legais do trabalho com dados: o que pode ser coletado, quais métodos são permitidos, como não violar o GDPR e a legislação russa sobre dados pessoais.

A coleta de dados através de proxies é regulamentada por várias normas legais, dependendo da jurisdição. Na Rússia, o principal documento é a Lei Federal nº 152-FZ "Sobre Dados Pessoais", na Europa é o GDPR (Regulamento Geral sobre a Proteção de Dados), e nos EUA existem várias leis setoriais e precedentes legais.

O princípio chave: a coleta de dados em si não é ilegal. O que pode ser ilegal é a forma de obtenção dos dados, seu uso ou a violação dos direitos do proprietário do site. Proxies, nesse contexto, são apenas uma ferramenta técnica, como um navegador ou uma conexão à internet.

É importante entender: O uso de proxies não torna a coleta de dados automaticamente ilegal. Proxies são um meio de garantir privacidade e contornar restrições técnicas (geobloqueios, limites de taxa), e não uma ferramenta para atividades ilegais.

A legislação russa distingue várias categorias de dados:

  • Dados públicos — informações disponibilizadas ao público sem restrições (preços em lojas, notícias, perfis públicos)
  • Dados pessoais — informações relacionadas a uma pessoa física específica (nome, telefone, e-mail, endereço)
  • Segredo comercial — dados que têm valor comercial e são protegidos pelo proprietário
  • Dados técnicos — logs, métricas, análises que não contêm informações pessoais

Para cada categoria, existem regras específicas de coleta e uso. Por exemplo, a extração de preços de concorrentes no Wildberries ou Ozon é a coleta de dados públicos, que não viola a lei de dados pessoais. Por outro lado, a coleta de endereços de e-mail de clientes de uma base de dados alheia já é uma violação.

Dados públicos: o que pode ser extraído sem restrições

Dados públicos são informações que o proprietário do site disponibilizou conscientemente ao público sem exigir autenticação ou pagamento. A coleta desses dados através de proxies é completamente legal, desde que as normas técnicas e éticas sejam respeitadas.

Tipo de dados Exemplos Status legal
Preços de produtos Wildberries, Ozon, Yandex.Market Legal
Descrições de produtos Características, fotos, avaliações Legal (considerando direitos autorais)
Notícias e artigos Sites de mídia, blogs Legal (para análise, não publicação)
Vagas de emprego hh.ru, Avito Trabalho Legal
Anúncios Avito, Youla (sem contatos) Legal
Clima e geodados APIs abertas, serviços meteorológicos Legal

Cenários típicos de uso legal de proxies para coleta de dados públicos:

  • Monitoramento de preços de concorrentes — vendedores em marketplaces monitoram diariamente os preços através de parsers para se manterem competitivos
  • Análise do mercado imobiliário — agências coletam dados sobre anúncios no Avito e CIAN para formar análises
  • Monitoramento de vagas — agências de RH extraem dados do hh.ru para análise de salários e requisitos do mercado
  • Coleta de notícias — monitoramentos de mídia coletam publicações para clientes (agências de PR, analistas)

Para essas tarefas, geralmente são utilizados proxies de data center — eles garantem alta velocidade e estabilidade ao extrair grandes volumes de dados. O principal é respeitar intervalos razoáveis entre as solicitações para não sobrecarregar os servidores.

Dados pessoais: onde está a linha vermelha

Dados pessoais são informações que se referem direta ou indiretamente a uma pessoa específica. A coleta desses dados é a mais rigorosamente regulamentada, e aqui é importante entender claramente os limites do que é permitido.

De acordo com a Lei 152-FZ, dados pessoais são considerados:

  • Nome completo
  • Data e local de nascimento
  • Endereço de residência
  • Número de telefone
  • Endereço de e-mail
  • Dados do passaporte
  • Fotografias (se puderem identificar a pessoa)
  • Endereços IP (em algumas jurisdições)

Proibido: Coletar dados pessoais sem o consentimento do titular ou sem uma base legal. Por exemplo, extrair telefones e e-mails de perfis de redes sociais para envio de mensagens é uma violação direta da Lei 152-FZ, com multas de até 500.000 rublos.

No entanto, existem exceções em que a coleta de dados pessoais é legal:

  1. Dados publicados publicamente pelo titular — se a pessoa publicou seu telefone em um anúncio no Avito, você pode vê-lo e usá-lo para contato sobre esse anúncio
  2. Processamento para fins jornalísticos — a mídia pode coletar dados públicos para a preparação de materiais
  3. Fins estatísticos e de pesquisa — se os dados forem anonimizados e não permitirem a identificação de uma pessoa específica
  4. Consentimento explícito — a pessoa deu consentimento por escrito para o processamento de seus dados

Um exemplo prático para profissionais de marketing: você pode coletar uma lista de empresas e seus telefones de fontes públicas (sites de empresas, diretórios 2GIS). Mas você NÃO pode extrair números pessoais de funcionários de seus perfis no VK ou Instagram para ligações frias — isso é uma violação.

Cenário Legalidade Comentário
Extração de telefones de anúncios no Avito Legal Dados publicados publicamente para contato
Extração de e-mails de perfis do LinkedIn Zona cinza Viola os ToS do LinkedIn, mas nem sempre é ilegal
Coleta de nome e telefone de grupos fechados no VK Proibido Violação da Lei 152-FZ e ToS
Extração de contatos de empresas do 2GIS Legal Diretório público
Coleta de e-mails de sites de empresas para envio B2B Legal Contatos publicados para contato

GDPR e requisitos internacionais ao trabalhar com proxies

Se você coleta dados de sites direcionados ao público europeu, ou sua empresa trabalha com clientes da UE, você deve cumprir os requisitos do GDPR (Regulamento Geral sobre a Proteção de Dados). As multas por violação podem chegar a 20 milhões de euros ou 4% do faturamento anual da empresa.

Princípios-chave do GDPR que são importantes ao coletar dados:

  • Legalidade, justiça e transparência — a coleta de dados deve ter uma base legal (consentimento, contrato, interesse legítimo)
  • Limitação de propósito — os dados são coletados apenas para um propósito específico declarado
  • Minimização de dados — colete apenas os dados que são realmente necessários
  • Precisão — os dados devem ser atualizados e corretos
  • Limitação de armazenamento — não armazene dados por mais tempo do que o necessário
  • Integridade e confidencialidade — proteja os dados contra vazamentos

O uso de proxies ao trabalhar com sites europeus não isenta a conformidade com o GDPR. Se você extrai dados de cidadãos da UE, você deve:

  1. Ter uma base legal para o processamento (por exemplo, interesse legítimo para análise de mercado)
  2. Garantir a possibilidade de exclusão dos dados mediante solicitação do titular ("direito ao esquecimento")
  3. Não transferir dados a terceiros sem consentimento
  4. Proteger os dados contra vazamentos (criptografia, controle de acesso)

Dica prática: Se você coleta dados para análise de mercado (preços, sortimento, tendências), isso é considerado "interesse legítimo" sob o GDPR. Mas se você coleta e-mails para envio, é necessário o consentimento explícito de cada destinatário.

Ao usar proxies residenciais para acessar sites europeus, certifique-se de que o provedor de proxies também cumpre o GDPR — isso é importante para a cadeia de processamento de dados.

Robots.txt e Termos de Serviço: força legal das restrições

Uma das questões mais controversas na web scraping é se os arquivos robots.txt e os acordos de usuário (Termos de Serviço, ToS) que proíbem a coleta automática de dados têm força legal.

Robots.txt

O arquivo robots.txt é uma recomendação técnica para robôs de busca, e não um documento legal. Na maioria das jurisdições, a violação do robots.txt não é, por si só, um crime. No entanto, existem nuances:

  • EUA — existem precedentes em que os tribunais reconheceram a violação do robots.txt como "acesso não autorizado" (CFAA), mas isso é uma prática controversa
  • Europa — o robots.txt geralmente não tem força legal, mas pode ser usado como prova de violação dos ToS
  • Rússia — não há uma prática judicial clara, mas ignorar o robots.txt pode ser considerado como criar uma carga excessiva no servidor

Recomendações práticas: respeite o robots.txt se não quiser correr riscos. Se você precisa de dados de seções fechadas, entre em contato com o proprietário do site para obter uma API ou permissão oficial.

Termos de Serviço (ToS)

Os acordos de usuário são um contrato entre você e o proprietário do site. Muitas grandes plataformas (Facebook, LinkedIn, Amazon) proíbem explicitamente a coleta automática de dados em seus ToS.

A força legal dos ToS depende de vários fatores:

Fator Impacto na força legal
Você está registrado no site ToS tem plena força de contrato — a violação pode levar a bloqueio e ação judicial
Você não está registrado ToS tem força limitada — você não aceitou os termos explicitamente
Dados públicos ToS pode proibir o uso comercial, mas não o pessoal
Você está criando carga no servidor Violação de ToS + possível responsabilidade por DDoS

Precedentes judiciais conhecidos:

  • hiQ Labs vs LinkedIn (2019, EUA) — o tribunal decidiu que a extração de dados públicos não viola o CFAA, mesmo que proibida pelos ToS
  • Ryanair vs PR Aviation (2015, UE) — o tribunal da UE decidiu que a coleta de dados públicos sobre voos não viola a lei, apesar dos ToS
  • eBay vs Bidder's Edge (2000, EUA) — o tribunal proibiu a extração devido à carga excessiva nos servidores do eBay

Conclusão: os ToS podem proibir o uso do site, mas nem sempre podem proibir a coleta de dados públicos. No entanto, a violação dos ToS sempre representa um risco de bloqueio da conta e possível ação judicial.

Existem muitas maneiras absolutamente legais de coletar dados para tarefas comerciais. O principal é usar as ferramentas certas e respeitar as normas éticas.

1. Uso de APIs oficiais

Muitas plataformas oferecem APIs oficiais para acesso a dados. Esta é a forma mais segura:

  • Google Maps API — para geodados e informações sobre locais
  • Twitter API — para análise de menções e tendências
  • Wildberries API — para vendedores (acesso aos seus dados)
  • OpenWeatherMap API — para dados meteorológicos

As APIs geralmente têm limitações no número de solicitações (limites de taxa), mas você obtém dados estruturados e proteção legal.

2. Extração de dados públicos respeitando a ética

Se não houver API, você pode extrair páginas públicas, respeitando as regras:

  • Respeite os intervalos — faça pausas entre as solicitações (1-3 segundos) para não criar carga
  • Respeite o robots.txt — mesmo que não seja obrigatório legalmente
  • Use User-Agent — identifique seu bot honestamente
  • Extraia em horários de baixa demanda — à noite, a carga nos servidores é menor

Para essas tarefas, são adequados proxies residenciais — eles imitam usuários comuns e são menos bloqueados por sistemas anti-bot.

3. Compra de conjuntos de dados prontos

Muitas empresas vendem dados coletados legalmente:

  • Dados estatísticos — Rosstat, Banco Mundial, ONU
  • Pesquisas de marketing — Nielsen, GfK, Kantar
  • Bases de empresas — SPARK, Kontur.Focus (bases B2B legais)
  • Dados setoriais — provedores especializados para imóveis, finanças, varejo

4. Crowdsourcing e pesquisas

Colete dados diretamente dos usuários com seu consentimento:

  • Pesquisas online (Google Forms, SurveyMonkey)
  • Programas de fidelidade com troca de dados por bônus
  • Conteúdo gerado pelo usuário (avaliações, comentários em seu site)
  • Programas de parceria com troca de dados

O que é proibido: ações com alto risco legal

Alguns métodos de coleta de dados são claramente ilegais ou apresentam alto risco de litígios. Evite as seguintes práticas:

Proibido categoricamente:

  • Hacking e contorno de proteção — contornar CAPTCHA, quebrar senhas, explorar vulnerabilidades (artigo 272 do Código Penal da Federação Russa — até 7 anos)
  • Coleta de dados de contas fechadas — extração de perfis fechados de redes sociais, grupos privados
  • Ataques DDoS — carga excessiva no servidor, levando a negação de serviço (artigo 273 do Código Penal da Federação Russa)
  • Coleta de dados financeiros — números de cartões, CVV, dados bancários (artigo 159.6 do Código Penal da Federação Russa — fraude)
  • Extração de bancos de dados de concorrentes — roubo de segredo comercial (artigo 183 do Código Penal da Federação Russa)
  • Coleta de dados médicos — diagnósticos, histórico de doenças sem consentimento (categoria especial de dados pessoais)

Zona cinza — alto risco:

  • Extração de e-mails para spam — mesmo que o e-mail seja público, envios em massa sem consentimento violam a Lei 152-FZ e a lei de publicidade
  • Extração agressiva — milhares de solicitações por segundo podem ser consideradas um ataque
  • Contorno de bloqueios através de proxies — se o site bloqueou você, continuar a extração pode ser considerado acesso não autorizado
  • Extração de conteúdo pago — contornar assinaturas pagas, materiais fechados

Exemplos reais de casos judiciais:

  • Facebook vs Power Ventures (2016) — o tribunal concedeu ao Facebook $3 milhões por extração de dados de usuários
  • LinkedIn vs hiQ Labs (2022) — após longas deliberações, o caso voltou ao tribunal, e o resultado ainda é incerto
  • Clearview AI (2021) — a empresa foi multada na Europa por coletar fotos de redes sociais para reconhecimento facial

Práticas seguras: como proteger o negócio de reivindicações

Para minimizar os riscos legais ao coletar dados através de proxies, siga estas recomendações:

1. Documente as bases legais

Crie um documento interno que explique:

  • Quais dados você está coletando
  • De quais fontes (apenas públicas)
  • Para quais fins (análise de mercado, monitoramento de preços)
  • Como você protege os dados contra vazamentos
  • Por quanto tempo você armazena os dados

Isso ajudará a provar a boa-fé em caso de reivindicações.

2. Use medidas de proteção técnica

  • Limitação de taxa — limite a velocidade das solicitações (não mais que 1-2 por segundo)
  • User-Agent honesto — não se disfarce como um navegador, indique o nome do seu bot
  • E-mail de contato — adicione um e-mail para contato no User-Agent
  • Rotação de proxies — use proxies móveis ou residenciais para distribuir a carga

3. Anonimize dados pessoais

Se você coletou dados com informações pessoais:

  • Remova nomes, telefones, e-mails imediatamente após o processamento
  • Agregue dados (em vez de "Ivan, 35 anos, Moscovo" → "homens de 30-40 anos, Moscovo")
  • Use hashing para identificadores
  • Não armazene mais dados do que o necessário para a tarefa

4. Obtenha consentimento quando possível

Se você planeja usar os dados para marketing ou envios:

  • Adicione uma caixa de seleção de consentimento para o processamento de dados pessoais
  • Explique como os dados serão usados
  • Dê a opção de desistir (unsubscribe)
  • Armazene as confirmações de consentimento

5. Consulte advogados

Se o seu negócio depende criticamente da coleta de dados, contrate um advogado especializado em direito de TI. Ele pode ajudar a:

  • Elaborar uma Política de Privacidade e Termos de Uso
  • Realizar uma auditoria de conformidade com o GDPR e a Lei 152-FZ
  • Preparar respostas para reivindicações de proprietários de sites
  • Registrar o processamento de dados pessoais no Roskomnadzor (se necessário)

Checklist para coleta legal de dados:
✅ Coletar apenas dados públicos
✅ Não criar carga excessiva nos servidores
✅ Respeitar o robots.txt (quando possível)
✅ Não coletar dados pessoais sem consentimento
✅ Anonimizar dados antes do armazenamento
✅ Usar dados apenas para os fins declarados
✅ Proteger os dados contra vazamentos
✅ Estar pronto para excluir dados mediante solicitação do titular

Conclusão

A coleta de dados através de proxies é uma prática legal e comum, desde que as normas legais e éticas sejam respeitadas. Princípios-chave: colete apenas dados públicos, não viole os direitos dos titulares de dados pessoais, não crie carga excessiva nos servidores e use os dados de boa-fé.

A maioria das tarefas comerciais — monitoramento de preços em marketplaces, análise de concorrentes, coleta de notícias, pesquisa de mercado — se enquadra completamente nas normas legais. O principal é entender os limites e não ultrapassá-los.

Se você planeja coletar dados para análise ou monitoramento, recomendamos usar proxies residenciais — eles garantem um alto nível de anonimato e risco mínimo de bloqueios, permitindo trabalhar com dados de forma legal e eficaz. Para tarefas com alta velocidade de processamento, proxies de data center são adequados, e para trabalhar com plataformas móveis — proxies móveis.

Lembre-se: as tecnologias são neutras, o importante é como você as utiliza. Proxies são uma ferramenta para trabalhar legalmente com dados, e não um meio de contornar a lei. Respeite as regras, respeite os direitos dos outros, e seu negócio estará protegido contra riscos legais.

```