返回博客

无封禁的LinkedIn和HeadHunter招聘信息解析:招聘人员的工具和代理

我们将讨论如何自动收集LinkedIn和HeadHunter的职位空缺,而不被封禁——为招聘人员和人力资源专家提供的工具、代理和逐步设置。

📅2026年3月13日
```html

如果您从事招聘或HR分析,您一定遇到过这样的情况:需要快速收集500+个竞争对手的职位,跟踪薪资市场或提取雇主的联系方式——而平台在20-30个请求后就开始封锁您。LinkedIn和HeadHunter积极保护其数据,如果没有正确的方法,解析工作就会变成与验证码和封锁的无尽斗争。

在本指南中,我们将讨论2024年哪些工具真正有效,如何设置代理以稳定收集数据,以及避免哪些错误以免丢失账户。

为什么LinkedIn和HeadHunter封锁解析

这两个平台通过数据赚钱。LinkedIn通过付费的Recruiter和Recruiter Lite套餐出售数据库访问,HeadHunter则通过API和付费发布。 当有人开始免费大量收集这些数据时,平台会采取严厉的反应。以下是您将遇到的具体保护机制:

速率限制 — 请求频率限制

LinkedIn跟踪单位时间内查看个人资料和职位页面的数量。免费账户每月可以查看大约300个个人资料——之后您会收到警告或暂时封锁。 在没有请求之间延迟的情况下进行自动解析时,这个限制在几分钟内就会耗尽。HeadHunter限制来自单个IP的搜索请求数量——超过限制时会显示验证码或暂时封锁访问。

行为分析和User-Agent

平台分析行为模式:真实用户滚动页面,停留在内容上,点击不规律。机器人以相同的间隔发送请求,不滚动,发送不典型的头信息。LinkedIn还额外检查是否存在授权会话——未登录账户您只能看到有限的数据,并且很快就会因IP被封锁。

IP地址封锁

这是最常见的保护措施。如果来自一个IP的请求过多——该IP会被列入黑名单。数据中心的IP(AWS、Google Cloud、Hetzner)特别容易被封锁:平台知道这些地址范围,并对其持有高度怀疑态度。家庭和移动IP被封锁的频率较低,因为它们背后可能有真实用户。

⚠️ 重要提示

LinkedIn在2023年显著加强了保护:即使使用VPN或数据中心代理手动查看个人资料,账户也可能被封锁。使用LinkedIn时,居民或移动代理至关重要。

招聘人员和HR分析师解析什么

在设置工具之前,先确定任务——这将影响方法和代理类型的选择。以下是HR专家和招聘机构常用的主要场景:

任务 平台 数据量
市场薪资监控 HeadHunter, LinkedIn 500–5000个职位/天
收集雇主联系方式 LinkedIn 100–1000个个人资料/天
分析候选人要求 HeadHunter, LinkedIn 1000–10 000个职位
跟踪竞争对手的新职位 HeadHunter 每日监控
寻找被动候选人 LinkedIn 50–500个个人资料/天

关键点:数据量大的任务(每天数千个职位)需要轮换的代理池。数据量小的任务(每天监控50-100个职位)可以通过1-2个静态代理解决,只需在请求之间保持延迟。

现成的职位解析工具

好消息是:不需要从零开始编写代码。针对不同任务和技术水平,已经存在现成的解决方案。我们将讨论主要类别。

无代码工具(无需编程)

Apify — 云平台,提供LinkedIn和HeadHunter的现成“演员”。有现成的LinkedIn职位抓取器和HH.ru抓取器。您只需指定搜索参数,平台会做其余的。支持连接自己的代理。价格从每月49美元起,有免费限额。

Phantombuster — 专注于LinkedIn。能够收集职位、个人资料、公司联系方式。通过授权的LinkedIn账户工作。支持代理。重要提示:一个LinkedIn账户 = 一个代理个人资料,否则会因更换IP而被封锁。

Octoparse — 可视化解析器构建工具。允许您通过鼠标指向所需元素设置从任何网站收集数据,无需代码。支持代理轮换。适合HeadHunter——界面简单易懂。

技术用户的工具

ParseHub — 具有可视化界面的桌面应用程序,但比Octoparse更灵活。能够处理动态内容(JavaScript页面)。对于LinkedIn来说,这一点至关重要——大多数数据是动态加载的。

Bright Data (Web Scraper IDE) — 具有内置代理的专业平台。提供LinkedIn的现成模板。价格昂贵,但对于工业规模来说可靠。

HH.ru API — HeadHunter的官方API。非商业用途免费,商业用途收费。如果您的任务是监控职位而不是大规模收集联系方式,官方API是最稳定的选择。限制:授权应用程序每秒50个请求。

💡 建议

对于HeadHunter,建议从官方API开始——这是合法的、稳定的,并且在特定限额内免费。对于LinkedIn,必须使用第三方工具和代理,因为没有官方的公共职位API。

为什么需要代理以及选择哪种类型

代理是一个中间服务器,您的请求通过它发送。平台看到的是代理的IP,而不是您真实的地址。通过轮换代理(自动更换IP),每个请求看起来都是来自新用户的请求——这使得绕过限制和封锁成为可能。

但并不是所有代理对LinkedIn和HeadHunter都同样有效。代理类型的选择对结果有着至关重要的影响:

代理类型 LinkedIn HeadHunter 速度 价格
居民代理 ✅ 优秀 ✅ 优秀 中等 $$
移动代理 ✅ 优秀 ✅ 良好 中等 $$$
数据中心代理 ❌ 经常被封锁 ⚠️ 中等 $

居民代理——LinkedIn的最佳选择

居民代理使用真实家庭用户的IP地址。从LinkedIn的角度来看——这就是一个在家里上网的普通人。这些IP很少被列入黑名单,平台无法将其与真实用户区分开。对于LinkedIn的解析,这是行业标准。

选择用于职位解析的居民代理时的关键参数:

  • 地理位置:选择您要解析职位所在国家的IP(对于HeadHunter——俄罗斯,对于LinkedIn——所需国家)
  • 轮换:每个请求后或按定时器自动更换IP
  • IP池:越大越好,降低重复使用被封锁IP的风险
  • 支持HTTP/HTTPS和SOCKS5——大多数解析工具需要这些协议

移动代理——用于LinkedIn账户的工作

如果您通过授权账户解析LinkedIn(如Phantombuster的工作方式),移动代理提供额外优势:LinkedIn将移动运营商视为来源,并对这些IP更加信任。一个移动IP可以为成千上万的真实用户服务(通过运营商的NAT),因此即使其活动很高也不会引起怀疑。

数据中心代理——仅适用于HeadHunter

数据中心代理——快速且便宜,但LinkedIn会积极封锁它们。对于HeadHunter,它们的表现更好:平台对数据中心IP的警惕性较低,特别是在请求之间保持延迟的情况下。适合在HH上进行预算监控职位,尤其是数据量较小的情况下。

LinkedIn解析:逐步设置

LinkedIn是解析中最复杂的平台。在这里,重要的是要小心行事,以免丢失账户。我们将以Phantombuster为例,讨论一个有效的工作方案——这是招聘人员中最流行的工具之一。

步骤1:准备LinkedIn账户

切勿使用主要工作账户进行解析。创建一个单独的账户或使用次要账户。如果它被封锁——您不会失去宝贵的联系和历史。账户必须“预热”:填写完整的个人资料,添加一些联系人,在开始解析之前至少有一周的活动。

步骤2:将代理绑定到账户

关键规则:一个LinkedIn账户 = 一个IP地址。如果您今天使用IP 1登录,而明天使用IP 2——这对LinkedIn的安全系统来说是一个红色警告。为每个账户使用静态居民代理(粘性会话)。

在Phantombuster中,代理的设置如下:

  1. 登录您的Phantombuster账户,进入设置 → 代理
  2. 点击添加代理
  3. 输入代理数据:主机、端口、用户名、密码
  4. 选择类型:HTTP或SOCKS5(取决于您的代理提供商)
  5. 点击测试代理——确保代理正常工作
  6. 将此代理分配给与您的账户一起工作的特定“幽灵”(任务)

步骤3:设置LinkedIn职位导出

在Phantombuster中找到“LinkedIn职位搜索导出”幽灵。设置:

  • 搜索URL:插入带有所需过滤器的LinkedIn职位搜索URL(职位、城市、雇佣类型)
  • 每次启动的职位数量:从25-50开始。不要第一天就设置500
  • 启动频率:每2-3小时一次。不要连续启动
  • 会话cookie:从浏览器中复制li_at cookie(Phantombuster中有说明)

步骤4:设置安全限制

LinkedIn因激进行为而封锁,而不是因解析本身。一个账户的安全限制:

  • 每天不超过80-100次职位查看
  • 请求之间的延迟:至少3-5秒
  • 在夜间休息(模拟人类行为)
  • 不要在周末启动解析——这对B2B平台来说看起来很可疑

⚠️ 如果需要从LinkedIn获取大量数据

如果需要每天解析数千个职位——请使用多个账户,每个账户都有自己的居民代理。一个账户 + 一个IP = 每天最多100个职位而不风险被封锁。10个账户 × 100 = 每天1000个职位。

HeadHunter解析:特点和设置

与LinkedIn相比,HeadHunter在解析方面更简单,原因有两个:有官方API,且保护措施不那么激进。但在没有正确设置的情况下进行大规模数据收集,您仍然会遭遇封锁。

选项1:官方HeadHunter API(推荐)

如果您的任务是监控职位和市场分析(不收集联系方式),请使用官方的hh.ru API。这是完全合法的,并且提供稳定的数据访问。

  1. dev.hh.ru上注册应用程序
  2. 获取client_idclient_secret
  3. 使用端点GET /vacancies进行职位搜索
  4. 过滤参数:text、area(地区)、salary、experience、schedule
  5. 限制:授权应用程序每秒50个请求

结果以JSON格式返回——可以通过Zapier或Make(前身为Integromat)等工具轻松加载到Excel或Google Sheets中,无需编写代码。

选项2:通过Apify解析(无代码)

如果需要官方API中没有的数据(例如雇主联系方式或非标准格式的数据),请使用Apify的现成演员进行HH.ru解析:

  1. 访问apify.com并找到“HH.ru Scraper”演员
  2. 点击免费试用
  3. 在设置中指定搜索查询(职位、城市)
  4. 代理配置部分选择“自定义代理”,并插入您的代理数据
  5. 对于HeadHunter,使用带有俄罗斯IP的居民代理——该平台是区域性的
  6. 点击开始并等待结果
  7. 将数据导出为CSV、JSON或Excel

选项3:Octoparse用于高级任务

Octoparse允许您解析HH.ru页面上的任何元素——包括API中没有的元素。例如,可以完整收集职位描述、联系方式(如果可见)、公司链接。

  1. 下载并安装Octoparse
  2. 创建新任务,插入hh.ru职位搜索的URL
  3. 使用自动检测模式——Octoparse会自动识别列表结构
  4. 检查所有所需字段是否已突出显示(职位、公司、薪水、城市)
  5. 在任务设置中启用IP轮换并添加您的代理
  6. 设置请求之间的延迟:2-4秒
  7. 在云中启动(云提取)以进行持续收集

💡 HeadHunter的代理地理位置

HeadHunter根据IP确定用户的地区,并显示区域职位。如果您想解析特定城市的职位(例如,仅限莫斯科或圣彼得堡),请使用该地区的IP代理。对于全国监控,任何俄罗斯IP都足够。

常见错误及如何避免

在解析LinkedIn和HeadHunter时,大多数问题都源于相同的错误。以下是您不能做的事项清单:

❌ 错误1:使用一个IP进行所有操作

新手最常见的错误——使用自己的家庭IP或一个代理启动解析。一旦平台检测到异常活动——该IP将被永久封锁。解决方案:使用自动更换IP的轮换代理或多个静态代理池。

❌ 错误2:请求速度过快

在10分钟内解析1000个页面——这是被封锁的必经之路。真实用户不可能以这样的速度浏览页面。设置延迟:对于HeadHunter,至少在请求之间保持2-3秒,对于LinkedIn,5-10秒。添加随机延迟变化(不是精确的3秒,而是2到5秒之间——这模拟了人类行为)。

❌ 错误3:为LinkedIn账户更换IP

如果您使用轮换代理与授权的LinkedIn账户进行操作——每个请求都来自新的IP。LinkedIn将其视为账户被黑(有人从不同地方连接)并封锁它。对于授权会话,仅使用粘性代理(长时间固定IP)或静态居民代理。

❌ 错误4:忽视User-Agent

User-Agent是浏览器发送给服务器的字符串,用于识别自身。许多解析工具默认发送“python-requests/2.28.0”类型的User-Agent——这会立即暴露为机器人。设置现代浏览器的真实User-Agent。在Apify和Phantombuster中,这会自动完成,在Octoparse中则在任务设置中完成。

❌ 错误5:未检查robots.txt进行解析

LinkedIn在其robots.txt中禁止解析,并积极起诉大规模进行此操作的公司。这并不意味着不能收集数据进行个人分析——但在商业使用时,了解法律风险是重要的。HeadHunter更为宽容,特别是使用官方API时。

❌ 错误6:便宜的公共代理

免费或非常便宜的公共列表中的代理——这是一个陷阱。它们已经被大多数平台封锁,工作不稳定,常常会截取数据。进行严肃工作需要来自可靠提供商的付费代理,具有真实的居民或移动IP。

解析启动前的检查清单

  • ✅ 使用单独的账户(非主要工作账户)
  • ✅ 连接居民或移动代理
  • ✅ 对于LinkedIn:一个账户 = 一个固定IP
  • ✅ 请求之间的延迟已设置(至少3秒)
  • ✅ User-Agent设置为真实浏览器的User-Agent
  • ✅ 每日请求限制限制在合理范围内
  • ✅ 启动前测试代理
  • ✅ 代理的地理位置符合目标区域

结论

从LinkedIn和HeadHunter解析职位是招聘人员、HR分析师和劳动市场研究人员的有效工具。关键是选择正确的方法:对于HeadHunter,从官方API开始,对于LinkedIn,使用像Phantombuster或Apify这样的专业工具,并正确设置代理。

本指南的关键结论:LinkedIn需要居民或移动代理,并为每个账户提供固定IP,HeadHunter的要求较低,但在大数据量时也需要代理。遵循请求限制,模拟人类行为,切勿使用主要账户进行自动化。

如果您计划定期监控职位或大规模收集LinkedIn的数据,建议使用居民代理——它们提供与两个平台的最大兼容性,并在长期工作中降低封锁风险。

```