信息以及信息安全

发布 2022-08-28 06:56:28 阅读 2065

这几天网上流传一份号称某个经济酒店开房记录的数据,其原始格式是sql server的backup文件。leaskh转换了一个csv版本,分享到了网盘上,但遭到了很多人的痛骂。我开始比较惊讶为什么有人会这么激动,后来明白了,就像医生认为生死是自然规律,而普通人则觉得要避讳。

人们对于自己越不了解的事情,越喜欢表现出来天然正义的样子。

隐私确实是一个值得讨论的话题,它和每个人密切相关,可惜在信息化如此彻底的时代,多数人除了直觉之外,对此一无所知,甚至连基本的准备都没有。现实世界和科技脱节如此之大的状况并不常见,这让这个话题显得更加有意义。在这篇blog里面我想分享一下我对这个问题的看法,我所知道的现实状况,以及可行的解决方案。

一信息化改变了什么。

在信息化之前,数据的泄漏和传播比今天难的多。传统的纸质文档很难被复制和传播,对比一下早年的"手抄本",很容易就能理解,在信息可以被数字化之前,就算要刻意传播一份信息,也需要巨大的成本和时间, 那时候生产信息和传播的权利基本是被垄断的。

到了现在,一份存储在联网设备中的数据,可以瞬间被复制到世界各处。这从根本改变了传播的方式,也使得保密变得无比困难。这种低成本、速度极快的传播特性,造成了"不可撤回"的特性,即一份数据,一旦流传进公共领域,则无法被撤回或销毁,(这个观点我在几年前写google的blog中也提到过)进入公共领域之后的数据,就相当于永远存在在互联网上了。

这样就很容易明白,用任何现实世界的东西来比喻信息传播,都是不恰当的类比。现实世界的物体,无法被复制,我拿走你的东西你就没有了。信息可以被无限复制,被复制者并不会失去原有的信息,甚至很多时候被复制者并不知道自己的信息已经被复制过了。

在这种状况下,应该默认凡是以数字化形式存在的数据,都早晚会进入公共领域,即泄密。唯一的区别只在于泄密的时间早晚。所以,正确的心态是默认凡是被数字化的数据都已经是公开的。

这样你就可以提前做好准备,当泄密真的出现的时候,可以不那么慌乱。

从非公共领域到公共领域这个界限一旦突破,后面的事情就是不可阻挡的了。所以指责某一个传播者是毫无意义的,这就和**要立法追究传播超过500次的微博一样荒唐。禁止别人传播一份从公共领域获得的数据,这本质上就是信息管制。

这种行为和**以行政命令要求删贴是一样的,两者的区别只在于是否使用公权力完成,以及如何定义"不良信息"而已。注意,这里所说数据特指已经进入公共领域的,如果是从非公共领域传播到公共领域,那是应该被谴责的,这种行为不仅不道德,而且违法。

好玩的是,反对传播这些数据的人,他们的反对本身也在加速这份数据的传播,并不只是传播全部数据才叫传播,传播关于有这份数据存在的消息同样是传播方式。由于他们的反对,更多人关注了这个事件,并且找到了**方式。如果真想避免传播,那么看到这种情况最好在心里骂一下,而不要写出来。

二隐私的进化以及本质。

人们对隐私的容忍一直随着时代和开放程度的推移而进化,20年前,刚刚有互联网的时候,**就算隐私。如果有人把你的**放到bbs上,人们竟然看到了你真实形象,你会觉得隐私被严重侵犯了。而到了2023年,flickr给**加了一个people in photos功能,用户可以方便的在一张**中标记出现的人的名字。

被标记的人往往并不觉得被侵犯了隐私。

现在,**对于大多数人已经不是那么难以容忍的隐私了。有了facebook之后,贴**简直是理所应当的,有了instagram之后,你随时可能被别人拍下来,贴到一个任何人都可以看到的地方。可见关于隐私的定义是一直在变化的。

到底什么才是最重要的隐私呢?我认为是关联到一个物理的人的办法。比如我获取了一堆**访问数据,如果我只知道创建这些数据的ip地址,这不算得到了他人的隐私,而一旦我知道了当时使用这个ip的物理的人,用这种办法把访问数据和这个人连接起来,这时候这些数据就变得非常敏感了,这时候这些数据和链接关系就成为了隐私。

我非常能理解人们对于身份证号泄漏的担心,但号码本身其实并没有任何意义,真正的危害在于现实社会有很多资源是关联在身份证号上的。这也就是为什么人们不再担心**这种隐私,而担心身份证号,因为后者关联了更多的重要信息。

在恐惧身份证号被泄漏的同时,很少有人会考虑一下,为什么我们需要把这么多信息关联到一个号码上。比如说,为什么办一个手机卡需要身份证?为什么住个酒店也需要?

为什么买张火车票也需要?为什么去网吧上网也需要?为什么买把菜刀也需要?

使用带有**的官方身份证明时,主要目的是证明物理的人到底是谁。比如用来登机和安检的时候,这时候需要确认身份是正常的,但为什么上个网,住个店也需要呢?这两种只是普通的商业活动,付钱就可以完成交易,为什么关心人的真实身份呢?

在商业活动中,多数情况下都可以使用间接的验证方式,比如利用事先约定的预订号,或者**号码,或者信用卡号码完成,但现实中,至少在中国,往往必须非身份证不可。这到底是为什么?

答案是**对身份信息的极度渴求。这不仅仅是中国的问题,而是个世界性的普遍问题。

如果不是这种渴求,那么能把信息链接到物理的人的机会就会少的多。如果住酒店不需要提供身份证号,只需要验证一下订房所用的信用卡或者订单号,那么也就不会有这次的泄漏事件。

三更危险的数据。

现实中被收集的数据远远多于基本的身份信息,比这更危险的数据多的是。我一直觉得如同定时炸弹一样的信息包括:

电子商务**的购物历史记录。

google的搜索历史。

**的浏览记录。

手机的基站漫游历史数据。

铺天盖地的摄像头记录。

这些数据可不是这次泄漏的身份证号、住址这种静态信息,而是关系到人的行为记录。得到这些数据,经过一些计算,往往能挖掘出来你自己都不知道的东西。相比之下,这次泄漏的东西简直算不上隐私,一点都不值得担心。

我相信这些信息除了有关部门掌握之外,至少还有一部分同样在某些地下渠道流传,某一天他们就会突然**在所有人面前。每个人都应该认真想想这一天到来的时候怎么办。

最可怕的事情是你在不同地方的数据被汇总到一起,并且用于计算。这将计算出整个人的生活轨迹,到这种状况才是毫无隐私可言。现在连买个预付费手机卡都需要身份证,将来出现这种情况我也毫不惊奇。

donttrackus这个**非常形象的解释了在现在的网络条件下,网络广告商是如何定位一个人的。对这类数据的收集时刻都在发生,这些数据可比身份证号码重要多了,关心的人反而不多。

四对策和希望。

很诡异的,这次对leaskh骂的最狠的那些人,恰好是最不注重隐私保护的那个群体,他们不仅仅是不注重,而且在这方面缺乏基本知识。因为只要对这种状况略有所知,也不会认为身份证号和地址是多大的事,他们举出的那些仇家利用这些信息报复之类的例子更是可笑,如果真想知道一个人的身份证信息和**,一般花几十块钱就能轻松买到。

前面说过,事情的根本在于身份信息的滥用和过分的存储,在这种情况下,信息必然会泄漏。我们当然希望没有任何信息被泄漏,但在现实中,这是无法保证的。所以指责传播已经泄漏信息的人是没有意义的,更算不得解决方案,除非有办法让全世界所有人都不这样做,这也同样不可能,就算有严格的法律,仍然会有人愿意冒险,何况现在根本没有像样的法律规范这种行为。

所以,更好的办法是理解,并且接受这个事实。听起来很残酷,但这就跟北京的空气状况一样,已经是无法更改的现实了。

为了避免我前面所说的最可怕的状况出现,有一些对策可用。其中最根本的解决问题方式我们没法直接做到,只能间接推动的,另外一部分是自己就可以做到的。列在这里:

目前基于单个号码的身份验证体系不适合信息社会,应该尽早改用公私密钥方式。这不是我们能决定的,就算是美国也没能到这一步,只能尽量呼吁。

商业机构应该尽量避免直接关联身份证号码,至少做到验证了人的身份之后不存储或尽量短时间存储。这也不是我们能改变的,只能尽量呼吁。

充分理解社会规则,并灵活应用。比如有人认为不登记身份证就没办法住酒店,其实用户口本也可以。买火车票机票,护照、港澳通行证都可以用。

当然这些也属于相对敏感的信息,但关联不同证件的能力目前应该还只有少数人能做到。灵活组合这些证件的应用模式,能在数据大规模泄漏时有效降低危害。

准备不同手机号码应用于不同场景,使用voip工具做到这一点成本更低,也更方便。

面对无处不在的摄像头,和识别率已经极高的面部识别系统,学会cvdazzle化妆方法。

如果你真的关心这个领域发生的事情,仔细去思考应该能想到更多要注意的事情。不过我想多数人只是骂骂人发泄一下而已。

五泄漏的信息与权利平衡。

我支持传播已经泄漏的信息。因为信息的价值在于独享,秘密只有被少数人知道才成为秘密。一旦人人皆知,就不再是秘密,也不再有价值。

所以加速传播被泄漏的信息,反而会降低对当事人的伤害,并且有益于整个社会群体。

对于个人来说,每个人都需要尽早知道自己的信息是否已经泄漏,并作出对应的解决方案。如果你不知道自己信息已经泄漏,而其他人知道,那么危害就很大,比如可以用来敲诈,也可以用来对你的亲属行骗。用更方便查看的格式,更快的传播,有利于人们确认自己的信息泄漏状态。

当所有数据人手一份的时候,每个人之间会形成权利平衡,即,你可以查阅我的信息,我也可以查阅你的。这比只有单方面拥有权利更加可靠,也可以降低危害。

这当然不是最好的办法,但这是现实条件下瑕疵最少的办法。

毫无保留的传播这些信息的人是友好的,因为他们本可以保持私有,用来获利。比如去做个查询信息是否泄漏的**,这还能通过流量赚到广告费。(这次已经出现了好多个这种**了)。

直接毫无保留的放出全部数据的意义在于避免了进一步诈骗发生的可能性,这就是信息平等之后的好处。

举个例子说明吧。如果获得这次泄漏的身份信息的人,不直接提供全文**,而是做一个**,让你输入你的身份证号和**查询是否泄漏,这就能成为一个新的**,大量本来不在泄漏范围内的人会主动提供自己的身份信息用来查询,最终被记录下来,造成新的泄漏。

甚至在没有发生真正的信息泄漏之前,都可以利用这种方式获得敏感信息。比如故意传播出某类信息被泄漏的消息,然后提供一个查询**,把所有来查询的人的数据都记录下来。所以,在拿到你自己可以查询的全部数据之前,不要相信任何传说或者任何人。

信息安全宣传文件 信息安全

什么是信息安全?信息是经过加工 获取 推理 分析 计算 存储等 的特定形式的有价值的数据 信息安全 防止对数据进行未授权访问的措施或防止信息的有意无意泄露 破坏 篡改 丢失等破坏信息完整性的有关措施。信息安全听上去感觉很高大上,距离我们很远,也不管我们什么事,相信很多人都是这样认为的。其实不然,信息...

信息安全四要素 诠释信息安全

哈尔滨工业大学计算机网络与信息安全技术研究中心。方滨兴 摘要 本文首先将国内外对信息安全概念的各种理解归纳为两种描述,一种是对信息安全所涉及层面的描述 一种是对信息安全所涉及的安全属性的描述。然后提出了以经纬线的方式将两种描述风格融为一体的方法,即基于层次型描述方式。同时,在传统的实体安全 运行安全...

信息安全方针和信息安全目标

16 接受信息安全事件报告的主管部门应记录所有报告,及时做出相应的处理,并向报告人员反馈处理结果。七 监督检查。17 定期对信息安全进行监督检查,包括 日常检查 专项检查 技术性检查 内部审核等。八 业务持续性。18 公司根据风险评估的结果,建立业务持续性计划,抵消信息系统的中断造成的影响,防止关键...