بازگشت به وبلاگ

قوانین CCPA و پروکسی: چگونه در سال 2024 به‌طور قانونی داده‌ها را از ایالات متحده بدون جریمه جمع‌آوری کنیم

نحوه رعایت الزامات CCPA در هنگام پارس کردن و جمع‌آوری داده‌ها از طریق پروکسی: الزامات قانونی، روش‌های ایمن کار و تنظیم پروکسی برای جمع‌آوری قانونی اطلاعات.

📅۱۱ اسفند ۱۴۰۴
```html

قانون حفاظت از داده‌های مصرف‌کنندگان کالیفرنیا (CCPA) محدودیت‌های سخت‌گیرانه‌ای بر جمع‌آوری و پردازش اطلاعات درباره ساکنان کالیفرنیا اعمال می‌کند. اگر شما در حال پارسینگ بازارهای آنلاین، نظارت بر قیمت‌های رقباء یا جمع‌آوری داده‌های عمومی از طریق پروکسی هستید، مهم است که الزامات قانونی و روش‌های رعایت آن‌ها را درک کنید.

در این راهنما، جنبه‌های عملی کار با پروکسی در زمینه CCPA را بررسی خواهیم کرد: چه داده‌هایی را می‌توان جمع‌آوری کرد، چگونه فرآیندها را برای مطابقت با قانون تنظیم کنیم و از جریمه‌های تا ۷۵۰۰ دلار به خاطر نقض جلوگیری کنیم.

CCPA چیست و به چه کسانی اعمال می‌شود

قانون حفاظت از حریم خصوصی مصرف‌کنندگان کالیفرنیا (CCPA) قانونی است که از ۱ ژانویه ۲۰۲۰ به اجرا درآمده و یکی از سخت‌گیرانه‌ترین قوانین حریم خصوصی در ایالات متحده به شمار می‌رود که اغلب با GDPR اروپا مقایسه می‌شود. در سال ۲۰۲۳، این قانون با اصلاحات CPRA (قانون حقوق حریم خصوصی کالیفرنیا) تقویت شد.

CCPA بر سازمان‌های تجاری که داده‌های شخصی ساکنان کالیفرنیا را جمع‌آوری می‌کنند، اعمال می‌شود و حداقل یکی از معیارهای زیر را دارند:

  • درآمد سالانه بیش از ۲۵ میلیون دلار
  • شرکت بیش از ۱۰۰,۰۰۰ مصرف‌کننده، خانوار یا دستگاه را در سال پردازش می‌کند
  • ۵۰٪ یا بیشتر درآمد از فروش داده‌های شخصی مصرف‌کنندگان به دست می‌آید

نکته مهم: این قانون بر شرکت‌ها صرف‌نظر از محل استقرار آن‌ها اعمال می‌شود. اگر شما از روسیه، قزاقستان یا اوکراین کار می‌کنید، اما داده‌های ساکنان کالیفرنیا را جمع‌آوری می‌کنید، CCPA به فعالیت شما اعمال می‌شود.

مثال عملی: اگر شما داده‌ها را از بازارهای آنلاین آمریکایی (Amazon، eBay، Walmart) پارس می‌کنید یا اطلاعاتی درباره قیمت‌های رقباء در ایالات متحده جمع‌آوری می‌کنید، احتمال بالایی وجود دارد که در میان این داده‌ها اطلاعاتی درباره ساکنان کالیفرنیا وجود داشته باشد.

کدام داده‌ها به عنوان داده‌های شخصی تحت CCPA شناخته می‌شوند

CCPA اطلاعات شخصی را به طور بسیار وسیعی تعریف می‌کند — این شامل هر داده‌ای است که یک مصرف‌کننده یا خانوار خاص را شناسایی، توصیف یا به طور منطقی با آن مرتبط می‌کند. این لیست شامل بیش از ۱۰ دسته داده است.

دسته داده نمونه‌ها ریسک در پارسینگ
شناسایی‌کننده‌ها نام، ایمیل، تلفن، آدرس IP، شناسه کوکی بالا
اطلاعات تجاری تاریخچه خرید، ترجیحات محصولات متوسط
داده‌های فعالیت آنلاین تاریخچه مرورگر، جستجوها، تعامل با وب‌سایت بالا
داده‌های جغرافیایی موقعیت فیزیکی، مختصات GPS متوسط
داده‌های بیومتریک اثر انگشت، شناسایی چهره پایین
اطلاعات شغلی سمت، کارفرما، تاریخچه اشتغال متوسط

نکته کلیدی: حتی اگر شما به طور مستقیم نام‌ها و ایمیل‌ها را جمع‌آوری نکنید، آدرس‌های IP و کوکی‌هایی که هنگام استفاده از پروکسی منتقل می‌شوند، به عنوان شناسایی‌کننده‌های شخصی تحت CCPA در نظر گرفته می‌شوند.

چگونه استفاده از پروکسی با الزامات CCPA مرتبط است

پروکسی‌ها به خودی خود CCPA را نقض نمی‌کنند — این‌ها ابزارهای فنی برای مسیریابی ترافیک هستند. مشکلات از استفاده از پروکسی ناشی نمی‌شود، بلکه از داده‌هایی که شما از طریق آن‌ها جمع‌آوری می‌کنید و چگونگی پردازش این داده‌ها ناشی می‌شود.

سناریوهای معمول استفاده از پروکسی که در آن‌ها سوالاتی درباره مطابقت با CCPA مطرح می‌شود:

۱. پارسینگ بازارهای آنلاین و وب‌سایت‌های تجارت الکترونیک

وقتی شما داده‌های محصولات را از Amazon، Walmart، eBay از طریق پروکسی‌های مسکونی جمع‌آوری می‌کنید، ممکن است به طور ناخواسته اطلاعات شخصی را جمع‌آوری کنید: نظرات مشتریان با نام‌ها، امتیازهای کاربران، سوالات مشتریان. اگر این کاربران ساکنان کالیفرنیا باشند، CCPA اعمال می‌شود.

۲. نظارت بر قیمت‌های رقباء

هنگام نظارت بر قیمت‌ها از طریق پروکسی، ممکن است قیمت‌های شخصی‌سازی شده‌ای را مشاهده کنید که بر اساس موقعیت جغرافیایی و تاریخچه کاربر است. جمع‌آوری چنین داده‌هایی ممکن است تحت تعریف پردازش اطلاعات تجاری مصرف‌کنندگان قرار گیرد.

۳. جمع‌آوری داده‌ها از شبکه‌های اجتماعی

پارسینگ پروفایل‌های عمومی Instagram، Facebook، LinkedIn از طریق پروکسی برای تحقیقات بازاریابی — این جمع‌آوری مستقیم داده‌های شخصی است. حتی اگر پروفایل‌ها عمومی باشند، CCPA نیاز به رعایت قوانین خاصی دارد.

استفاده از پروکسی وضعیت را پیچیده‌تر می‌کند زیرا شما هویت و موقعیت واقعی خود را پنهان می‌کنید. از نظر CCPA، این به خودی خود نقض نیست، اما اگر شما داده‌های شخصی را به طور مخفیانه جمع‌آوری کنید و به مصرف‌کنندگان امکان انصراف از جمع‌آوری را ندهید — این یک مشکل است.

CCPA جمع‌آوری داده‌ها را به طور کامل ممنوع نمی‌کند — این قانون شفافیت، کنترل مصرف‌کنندگان بر داده‌های خود و اهداف استفاده از اطلاعات را تنظیم می‌کند. در اینجا روش‌هایی وجود دارد که به شما کمک می‌کند در حین کار با پروکسی در چارچوب قانون باقی بمانید.

روش ۱: جمع‌آوری فقط داده‌های عمومی غیرشخصی

بر داده‌هایی تمرکز کنید که افراد خاصی را شناسایی نمی‌کنند:

  • قیمت‌های محصولات بدون ارتباط با کاربران
  • آمار تجمیعی (میانگین امتیاز محصول، تعداد نظرات)
  • مشخصات فنی محصولات
  • موجودی محصولات در انبارها
  • داده‌های عمومی درباره شرکت‌ها (نه افراد)

هنگام پارسینگ بازارهای آنلاین از طریق پروکسی، اسکریپت‌ها را طوری تنظیم کنید که بلوک‌های محتوای کاربر را نادیده بگیرند: نظرات با نام‌ها، سوالات خریداران، پروفایل‌های کاربران.

روش ۲: ناشناس‌سازی و تجمیع داده‌ها

اگر نیاز به جمع‌آوری داده‌هایی دارید که ممکن است شامل اطلاعات شخصی باشد، فوراً آن‌ها را ناشناس‌سازی کنید:

  • نام‌ها، ایمیل‌ها، تلفن‌ها را به طور خودکار از داده‌های جمع‌آوری شده حذف کنید
  • آدرس‌های IP دقیق را با دامنه‌ها یا مناطق جایگزین کنید
  • داده‌ها را تجمیع کنید: به جای "کاربر جان محصول X را خرید" → "محصول X به تعداد ۱۵۰ بار خریداری شده است"
  • از هش‌زنی برای شناسایی‌کننده‌ها استفاده کنید، اگر برای تحلیل ضروری است

مهم است: ناشناس‌سازی باید غیرقابل بازگشت باشد. اگر شما می‌توانید داده‌های شخصی را از مجموعه داده‌های ناشناس‌سازی شده بازیابی کنید — CCPA هنوز هم اعمال می‌شود.

روش ۳: رعایت robots.txt و شرایط خدمات

اگرچه این یک الزام مستقیم CCPA نیست، رعایت قوانین وب‌سایت‌ها نشان‌دهنده حسن نیت است:

  • قبل از پارسینگ، فایل robots.txt را بررسی کنید — بسیاری از وب‌سایت‌ها به وضوح جمع‌آوری داده‌های خاصی را ممنوع می‌کنند
  • شرایط خدمات وب‌سایت‌های هدف را بخوانید — ممکن است محدودیت‌هایی برای جمع‌آوری خودکار داده‌ها وجود داشته باشد
  • از تاخیرهای معقول بین درخواست‌ها از طریق پروکسی (محدودیت نرخ) استفاده کنید
  • اگر ممکن است، ربات خود را از طریق User-Agent شناسایی کنید

روش ۴: شفافیت و مستندسازی اهداف

CCPA از شرکت‌ها می‌خواهد که در مورد جمع‌آوری داده‌ها شفاف باشند:

  • مستند کنید که چه داده‌هایی را جمع‌آوری می‌کنید و برای چه اهدافی
  • اگر وب‌سایت دارید — سیاست حریم خصوصی را با توصیف شیوه‌های جمع‌آوری داده‌ها منتشر کنید
  • داده‌ها را فقط به مدت لازم برای اهداف اعلام شده نگه‌داری کنید
  • داده‌های جمع‌آوری شده را بدون رضایت صریح به اشخاص ثالث نفروشید

نکته عملی: اگر شما از پروکسی‌های دیتاسنتر برای پارسینگ استفاده می‌کنید، فرآیند را مستند کنید: چه چیزی را پارس می‌کنید، چگونه داده‌های شخصی را فیلتر می‌کنید، اطلاعات را چه مدت نگه می‌دارید. این در صورت بررسی کمک خواهد کرد.

داده‌های عمومی در مقابل اطلاعات شخصی: مرز کجاست

یکی از سوالات متداول: "اگر داده‌ها به صورت عمومی در اینترنت در دسترس باشند، آیا می‌توان آن‌ها را به طور آزاد جمع‌آوری کرد؟" CCPA هیچ استثنایی برای داده‌های عمومی قائل نیست — اگر اطلاعات یک ساکن کالیفرنیا را شناسایی کند، تحت پوشش این قانون قرار می‌گیرد.

نوع داده دسترسی عمومی CCPA اعمال می‌شود توصیه
قیمت‌های محصولات بله خیر جمع‌آوری ایمن
نظرات با نام‌های کاربران بله بله حذف نام‌ها در هنگام جمع‌آوری
ایمیل از پروفایل‌های عمومی LinkedIn بله بله ریسک بالا، اجتناب کنید
آمار تجمیعی فروش بله خیر جمع‌آوری ایمن
آدرس‌های IP بازدیدکنندگان وب‌سایت خیر (داده‌های فنی) بله نیاز به سیاست حریم خصوصی دارد
پست‌های عمومی در Instagram بله بستگی به محتوا دارد ناشناس‌سازی نویسندگان

قانون کلیدی: عمومی بودن داده‌ها وضعیت آن‌ها را به عنوان اطلاعات شخصی لغو نمی‌کند. اگر شما داده‌های عمومی را جمع‌آوری کنید که افراد را شناسایی می‌کند، CCPA اعمال می‌شود. تنها تفاوت این است که برای داده‌های عمومی، توجیه "منافع قانونی" به عنوان مبنای پردازش آسان‌تر است.

استثنائات CCPA

این قانون چندین استثنا را پیش‌بینی می‌کند که در آن‌ها داده‌ها به عنوان اطلاعات شخصی در نظر گرفته نمی‌شوند:

  • اطلاعات عمومی در دسترس از منابع دولتی (ثبت‌نام‌های دولتی، سوابق قضایی)
  • داده‌های غیرشناسایی‌شده که نمی‌توان آن‌ها را به یک مصرف‌کننده خاص مرتبط کرد
  • اطلاعات تجمیعی درباره مصرف‌کنندگان
  • داده‌هایی که در چارچوب تحقیقات علمی با رعایت استانداردهای اخلاقی جمع‌آوری شده‌اند

چک‌لیست رعایت CCPA هنگام پارسینگ داده‌ها

از این چک‌لیست قبل از راه‌اندازی هر پروژه جمع‌آوری داده‌ها از طریق پروکسی استفاده کنید، اگر مخاطب هدف یا منابع داده‌های شما با کالیفرنیا مرتبط است:

✅ مرحله برنامه‌ریزی

  • تعیین کنید که دقیقاً چه داده‌هایی نیاز دارید و آیا آن‌ها به عنوان داده‌های شخصی تحت CCPA محسوب می‌شوند
  • ارزیابی کنید که آیا شرکت شما تحت پوشش CCPA قرار می‌گیرد (معیارهای درآمد، حجم داده‌ها)
  • مستند کنید که مبنای قانونی جمع‌آوری داده‌ها چیست (منافع قانونی، قرارداد، رضایت)
  • شرایط خدمات وب‌سایت‌های هدف را برای محدودیت‌های پارسینگ بررسی کنید

✅ مرحله تنظیمات فنی

  • فیلترها را برای حذف خودکار شناسایی‌کننده‌های شخصی (نام‌ها، ایمیل‌ها، تلفن‌ها) تنظیم کنید
  • از پروکسی‌های مسکونی با چرخش برای حداقل کردن ردپاها استفاده کنید
  • محدودیت نرخ را برای رعایت robots.txt پیاده‌سازی کنید
  • ناشناس‌سازی خودکار آدرس‌های IP و سایر شناسایی‌کننده‌ها را تنظیم کنید
  • داده‌های جمع‌آوری شده را به صورت رمزگذاری شده نگه‌داری کنید

✅ مرحله مستندسازی

  • سیاست حریم خصوصی را ایجاد کنید که شیوه‌های جمع‌آوری داده‌ها را توصیف کند (اگر وب‌سایت یا خدماتی دارید)
  • روش‌های پردازش درخواست‌های حذف داده‌ها از مصرف‌کنندگان را مستند کنید
  • یک دفترچه ثبت پردازش داده‌ها نگه‌داری کنید: چه چیزی جمع‌آوری شده، چه زمانی، برای چه هدفی
  • مدت زمان نگهداری داده‌ها و روش‌های حذف خودکار را تعیین کنید

✅ مرحله بهره‌برداری

  • به طور منظم داده‌های جمع‌آوری شده را برای وجود اطلاعات شخصی بررسی کنید
  • داده‌ها را بدون رضایت صریح به اشخاص ثالث نفروشید و منتقل نکنید
  • سیاست حریم خصوصی را در صورت تغییر شیوه‌های جمع‌آوری داده‌ها به‌روز کنید
  • تیم را در اصول CCPA و روش‌های پردازش داده‌ها آموزش دهید
  • مکانیسم پردازش درخواست‌های مصرف‌کنندگان برای دسترسی/حذف داده‌ها را تنظیم کنید

تنظیم پروکسی برای حداقل کردن ریسک‌های قانونی

تنظیم صحیح پروکسی تضمینی برای رعایت CCPA نیست، اما به کاهش ریسک‌ها کمک می‌کند و حسن نیت را در صورت بررسی نشان می‌دهد.

انتخاب نوع پروکسی بسته به وظیفه

نوع پروکسی بهتر برای ریسک‌های CCPA
پروکسی‌های مسکونی پارسینگ بازارهای آنلاین، جمع‌آوری داده‌های عمومی از شبکه‌های اجتماعی متوسط — به عنوان کاربران عادی به نظر می‌رسند
پروکسی‌های موبایل جمع‌آوری داده‌ها از برنامه‌های موبایل، بررسی جغرافیایی متوسط — حریم خصوصی بالا
پروکسی‌های دیتاسنتر پارسینگ انبوه داده‌های غیرشخصی (قیمت‌ها، موجودی) پایین — اگر داده‌های شخصی جمع‌آوری نکنید

تنظیمات پروکسی برای مطابقت با قانون

۱. چرخش آدرس‌های IP: از چرخش خودکار IP برای توزیع بار و جلوگیری از پیوند داده‌های جمع‌آوری شده به یک شناسایی‌کننده استفاده کنید. این کار ایجاد پروفایل‌های کاربران را دشوارتر می‌کند.

۲. پیوند جغرافیایی: اگر شما با داده‌های ساکنان کالیفرنیا کار نمی‌کنید، پروکسی‌ها را طوری تنظیم کنید که IP‌های کالیفرنیا را حذف کنند. بیشتر ارائه‌دهندگان پروکسی اجازه انتخاب مناطق را می‌دهند.

۳. ثبت درخواست‌ها: تمام درخواست‌ها از طریق پروکسی را با زمان‌سنجی ثبت کنید. این به شما کمک می‌کند تا رعایت محدودیت نرخ و عدم سوءاستفاده را در صورت بررسی نشان دهید.

۴. User-Agent و شناسایی: برخی وکلا توصیه می‌کنند که از User-Agent صادقانه استفاده کنید که پارسر شما را شناسایی کند (برای مثال، "MyCompanyBot/1.0"). این شفافیت را نشان می‌دهد، هرچند ممکن است ریسک مسدود شدن را افزایش دهد.

مهم: استفاده از پروکسی‌های موبایل برای دور زدن مسدودیت‌ها به خودی خود نقض CCPA نیست، اما اگر شما برای جمع‌آوری داده‌های شخصی بدون رضایت دور زدن را انجام دهید — این ممکن است به عنوان نقض محسوب شود.

جریمه‌ها به خاطر نقض CCPA و موارد واقعی

CCPA دو نوع جریمه را پیش‌بینی می‌کند: جریمه‌های اداری (از طرف دادستان کل کالیفرنیا) و دعاوی مدنی از سوی مصرف‌کنندگان.

مقدار جریمه‌ها

  • جریمه‌های اداری: تا ۲۵۰۰ دلار برای هر نقض غیرعمدی، تا ۷۵۰۰ دلار برای هر نقض عمدی
  • دعاوی مدنی: ۱۰۰ تا ۷۵۰ دلار برای هر مصرف‌کننده برای هر حادثه نشت داده‌ها (یا خسارت واقعی، اگر بیشتر باشد)
  • دعاوی جمعی: در صورت نشت داده‌ها از هزاران کاربر، مبلغ می‌تواند به میلیون‌ها دلار برسد

موارد واقعی نقض CCPA

Sephora — ۱.۲ میلیون دلار جریمه (۲۰۲۲)

این شرکت داده‌های شخصی مصرف‌کنندگان را به اشخاص ثالث فروخت بدون اینکه امکان انصراف را فراهم کند. این اولین جریمه بزرگ به خاطر نقض CCPA است. درس: اگر شما داده‌ها را جمع‌آوری و به کسی منتقل کنید — این "فروش" تحت CCPA است که نیاز به اطلاع‌رسانی دارد.

DoorDash — دعوی جمعی (۲۰۲۰)

نشت داده‌های ۴.۹ میلیون کاربر منجر به دعوی جمعی بر اساس CCPA شد. اگرچه این پرونده به صورت خارج از دادگاه حل و فصل شد، اما نشان داد که حتی استارتاپ‌ها نیز می‌توانند با عواقب جدی مواجه شوند.

Clearview AI — تحقیقات در حال انجام

این شرکت عکس‌ها را از شبکه‌های اجتماعی (داده‌های عمومی) جمع‌آوری کرد تا پایگاه داده‌ای برای شناسایی چهره‌ها ایجاد کند. با وجود عمومی بودن داده‌ها، علیه Clearview چندین دعوی مطرح شده است، از جمله اتهامات نقض CCPA. درس: حتی جمع‌آوری داده‌های عمومی شخصی می‌تواند منجر به مشکلات شود.

برای کسب و کارهای کوچک و متوسط، ریسک جریمه‌ها واقعی است اگر شما تحت معیارهای CCPA قرار بگیرید. دادستان کل کالیفرنیا به طور فعال شکایات مصرف‌کنندگان را بررسی می‌کند و از سال ۲۰۲۳، یک آژانس ویژه به نام California Privacy Protection Agency (CPPA) برای نظارت بر رعایت قانون تأسیس شده است.

چگونه ریسک جریمه‌ها را کاهش دهیم

  • یک ممیزی داده‌ها انجام دهید: چه چیزی را جمع‌آوری می‌کنید، چگونه نگه‌داری می‌کنید، به چه کسی منتقل می‌کنید
  • روش‌های پردازش درخواست‌های مصرف‌کنندگان را پیاده‌سازی کنید (دسترسی، حذف، انصراف از فروش داده‌ها)
  • سیاست حریم خصوصی را در وب‌سایت خود با توصیف شیوه‌های جمع‌آوری داده‌ها منتشر کنید
  • تیم را در اصول CCPA و روش‌های پاسخگویی به درخواست‌ها آموزش دهید
  • به بیمه ریسک‌های سایبری فکر کنید که جریمه‌های نقض حریم خصوصی را پوشش می‌دهد
  • در صورت تردید — با وکیلی که در زمینه حقوق حریم خصوصی تخصص دارد مشورت کنید

نتیجه‌گیری

CCPA الزامات جدی‌ای را بر شرکت‌هایی که داده‌های شخصی ساکنان کالیفرنیا را جمع‌آوری می‌کنند، اعمال می‌کند، صرف‌نظر از اینکه آیا شما از پروکسی استفاده می‌کنید یا نه. اصول کلیدی رعایت این قانون: شفافیت در اهداف جمع‌آوری داده‌ها، حداقل کردن حجم اطلاعات شخصی، فراهم کردن کنترل برای مصرف‌کنندگان بر داده‌های خود و نگه‌داری ایمن.

استفاده از پروکسی برای جمع‌آوری داده‌ها قانونی است، اگر شما بر اطلاعات غیرشخصی تمرکز کنید یا به سرعت داده‌های شخصی را ناشناس‌سازی کنید. فرآیندها را مستند کنید، شرایط خدمات پلتفرم‌های هدف را رعایت کنید و آماده باشید تا قانونی بودن اقدامات خود را توجیه کنید.

به یاد داشته باشید: جریمه‌ها به خاطر نقض CCPA می‌توانند به میلیون‌ها دلار برسند، اما بیشتر مشکلات را می‌توان با تنظیم صحیح فرآیندهای جمع‌آوری و پردازش داده‌ها اجتناب کرد. سرمایه‌گذاری در رعایت قانون به عنوان محافظت در برابر ریسک‌های قانونی و اعتماد کاربران بازده دارد.

اگر شما قصد دارید داده‌ها را از منابع آمریکایی جمع‌آوری کنید، توصیه می‌کنیم از پروکسی‌های مسکونی با امکان انتخاب جغرافیا استفاده کنید — این به شما اجازه می‌دهد تا IP‌های کالیفرنیا را از چرخش حذف کنید یا برعکس، داده‌ها را به طور خاص بر اساس مناطق جمع‌آوری کنید تا با وظایف تجاری و الزامات قانونی شما مطابقت داشته باشد.

```