近期,对于微软旗下职业社交网站领英(LinkedIn)来说,可谓是站在舆论关注的风口浪尖。就在两个月前,该网站上5亿条用户记录在颇受欢迎的黑客论坛上被挂牌出售。一波未平,一波又起。近日,7亿条领英用户信息再次出现在黑客论坛上被售卖。
据Cyber News4月6日报道,领英超5亿条用户数据在某黑客论坛出售。售卖者放出了200万条数据样本证实真实性。泄露的数据包括用户姓名、性别、教育经历、工作经历、邮箱、手机号及其它社交媒体链接等。
对此,领英4月8日发布声明表示,被出售的领英数据确实是来自网站和公司的数据汇总,但部分内容是可以公开查看的会员资料数据,并不是由于领英的数据泄露,里面也不包含领英的私人会员账户数据。

此次事件尚未平息。近日,又一位名为TomLiner的卖家声称,在2021年6月22日获得7亿条领英用户记录,并在RaidForum论坛上挂出了一份100万条用户信息的样本,用来证明数据的真实性。研究人员已经查看了样本,确认了这些记录的真实性,内容包括姓名、电话号码、家庭地址、电子邮箱地址、地理位置记录、领英的用户名和个人介绍的URL链接、个人经历和职业经验、背景信息、性别、其他社交媒体的账号和用户名等。
对此,领英6月29日发表声明称,这份用于出售的数据并不是黑客攻击的成果,而是有人简单提取了大规模的公开数据。领英指出,“我们想澄清的是,这不是一次数据泄露,也没有任何领英用户的私人数据被泄露。我们的初步调查发现,这些数据是从领英和其他各种网站抓取的,其中就包括与我们在2021年4月的抓取更新中报告的相同的数据。当任何人试图获取会员数据并将其用于未经领英和用户同意之目的时,我们会努力阻止他们,并追究他们的责任。”
从领英对两次事件的回应声明来看,内容非常接近,简直是如出一辙。简单概括就是说,这两次事件并非数据泄露,而是网络公开数据的抓取,与领英没有直接责任关系。领英为什么要急于将泄露原因归咎于数据抓取呢?这可能与4年前的领英与其竞争对手hiQLabs的一场官司有关。当时,领英是微软旗下拥有7亿多用户的职场社交平台,而hiQLabs是一家主打帮助HR做决策、提供员工离职风险和技能分析的初创公司。

早在4年前,因反对数据抓取,领英就曾将竞争对手hiQ Labs告上法庭。领英方面认为,hiQ Labs对用户数据的大规模自动抓取,违反了领英用户协议中的访问和使用限制,等同于黑客行为,威胁到用户的隐私。hiQ Labs则辩称,公共数据必须保持公开,大公司不应以垄断的方式囤积公共数据,领英的诉求会影响互联网的开放和创新。并且,hiQ Labs只将抓取的信息用于宏观分析,并未售卖用户的个人资料。
2017年8月14日,位于美国加州的北区联邦地方法庭法官发出了初步禁令,要求领英必须在法庭禁令颁布后24小时内取消对hiQ Labs数据抓取的技术阻拦措施,撤回两封“勒令停止侵权函”,并不得再以同样理由发出“侵权函”。对于上述裁定,领英表示失望。
从这起案件的判决上我们不难看出,法院以反“信息垄断”为由驳回了领英禁止数据抓取的请求,并没有将数据抓取列为违法行为。这也就是领英在发生用户数据被公开售卖事件后,两次发声表示泄露原因是数据抓取而并非数据泄露的原因。
难道这样做,领英就能摆脱责任,明哲保身吗?当然不是!据彭博社报道,意大利的隐私监视机构开始对该事件展开调查,同时呼吁本国国民关注与他们的电话号码和账户有关的任何异常情况。意大利是欧洲各国中领英用户数最多的国家之一。另外值得注意的是,6月14日,美国最高法院要求第九巡回上诉法院重审hiQLabs抓取领英用户数据一案。此案判决结果有可能会峰回路转。
根据百度百科的定义,所谓数据抓取,是指在网络或计算机上获取任何公开可用的数据,然后将找到的信息导入计算机上的本地文件中。数据抓取通常体现在网页抓取中,网页抓取是使用某种应用程序从网站提取有价值信息的过程。而所谓数据泄露是指敏感的、受保护的或机密的数据被未经授权的个人或组织剽窃、盗走或使用。数据泄露最常见的方法是攻击者侵入企业网络窃取敏感数据。
从数据抓取和数据泄露的定义可以看出两者的本质区别在于:
首先,获取数据的性质不同。数据抓取的是网络公开的数据,而数据泄露的通常是敏感的、受保护的或机密的数据。其次,获取数据的方式不同。数据抓取通常使用网络爬虫等中立的、未被法律禁止的手段。作为一种信息获取手段,爬虫技术被广泛应用到各个领域,最常见的爬虫便是我们经常使用的搜索引擎,如百度、360搜索等。而数据泄露则是攻击者利用系统漏洞、病毒等方式侵入对方网络来窃取数据,这种获取方式具有负面性和破坏性,是法律明令禁止的。

作为职场社交软件,领英拥有7亿多用户,虽然此次事件并没有身份证号码、密码等敏感信息泄露,但被泄露的信息也可能会对受影响的领英用户构成威胁。
首先,随着电子邮件地址和电话号码等详细信息在网上向买家开放,个人可能成为垃圾邮件活动的目标,或者更糟糕的是,成为身份被盗的受害者。
其次,尽管这些记录似乎不包含信用卡详细信息或其他私人信息,但专业黑客往往仅通过电子邮件地址就能追踪到敏感数据。领英用户也可能成为电子邮件或电话诈骗的受害者,这些骗局可能会欺骗他们分享敏感凭证或转移大量资金。
最后,受信息泄露影响的领英用户也需要注意防范黑客攻击。利用记录中提供的电子邮件地址,黑客可能会尝试使用常见密码字符的各种组合来入侵用户的帐户。

另外值得注意的是,就在Cyber News 4月6日报道领英5亿用户数据被售卖的前一天,网络安全公司eSentire发出警告称新型网络钓鱼攻击已经盯上了在领英平台上寻找工作机会的人。一个名为“Golden Chickens”的黑客组织在获取用户的个人资料以后,开始向受害者发送与领英上的意向职位接近的虚假工作邀请,并附上一个名为Associate Editor position的压缩包。如果打开该文件,它就会在不发出任何警告的情况下,在受害者的计算机上安装木马文件,然后该木马会下载更多恶意插件,并向黑客敞开目标系统的访问。根据eSentire的说法,该木马程序利用了正常的Windows进程来运行,以躲避普通反病毒软件和自动化安全解决方案的检测。
在个人信息泛滥的今天,各类社交平台已成为最易遭受信息泄露的目标。不论是社交平台、用户还是政府,对于如何管理好个人信息以免遭受泄露的风险,直到今天都没有找到公认的简单有效的方法。在未来相当长的一段时间内,这个问题或将成为整个社会走向数字化信息化所面临的一个严重挑战。