Press "Enter" to skip to content

你的社交信息是怎么泄露的

最近,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!

一时各种猜测。

那么,首先,微信是不会透露任何关系链给第三方的。

分几种情况吧。

第一,通过直接关系的通讯录获取

你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。

所以系统标记为,你们很可能认识。这个最容易理解。

第二,通过间接关系的通讯录获取

你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。

比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。

那这个是不是很扯啊,很可能八杆子打不着的关系对不对。

可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。

现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?

再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。

第三,通过转发和访问行为获取

这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。

你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。

通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。

第四,抓取公开数据

比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?

而互相关注的数据是可以通过爬虫抓下来的。

类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。

还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。

很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。

我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。

第五,购买地下数据

应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?

除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?

开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。

其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。

大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?

另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。

总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。

来源:caoz的梦呓

您可以留下这篇文章的第一条评论

发表评论

电子邮件地址不会被公开。 必填项已用*标注