在我们的系统里面,存在着大量的敏感信息:如公民数据、业务数据等,业务系统软件开发的最后阶段,是需要尽量真实的数据来作为基础测试软件的一系列功能。尤其是用户系统这样的大型系统实施或开发的时候,对于基础数据的要求很严格,很多时候都是直接克隆生产环境的数据来进行软件系统的测试,但是随之而来的影响却是深远的…因此,应该重视数据的泄密和脱敏。
1 数据防泄密方案
根据数据的生命周期,在数据的产生阶段、使用阶段和销毁阶段都需对数据的安全进行保护:
- 在数据生成阶段,要求新生成的数据的密级不能比源数据低。
- 在数据使用阶段,应保证数据访问控制,保证数据不能被越权访问和使用。
- 在数据销毁阶段,应保证数据无法被恢复。
- 大数据平台为了防止内部人员窃取数据造成系统风险、数据泄露,采取以下策略:
- 所有数据加密处理,即便窃取走硬盘,也无法识别里面的数据。
- 敏感数据进行多层加密,增强窃取难度,需要多层解密授权才可以获得密钥进行解密。
- 所有网络传输均加密处理,跨IDC数据传输建立VPN通道,防止数据在传输过程被窃取。
- 三员分立,没有超级管理员角色,任何人使用数据都需要通过审批,所有账号、权限操作都有审计,异常操作会形成安全事件,发出告警。
- 为了防止冒名登录,关键系统采取双因子登录策略,需要用户密码和动态密码才能登录系统,连续多次登录失败,生成安全告警事件;用户和IP可以进行绑定,非授权IP无法访问系统,非授权IP尝试访问系统将会有安全告警事件产生。
- 数据离开集群环境(比如下载、拷贝)需要通过审批流程,并通过网关敏感信息检查系统进行检测是否有敏感数据。
- 下线的服务器或磁盘严格进行消磁或粉粹处理,防止磁盘被带走形成泄露风险。
2 大数据脱敏方案
在我们的系统里面,存在着大量的敏感信息:公民数据、业务数据等,业务系统软件开发的最后阶段,是需要尽量真实的数据来作为基础测试软件的一系列功能。尤其是用户系统这样的大型系统实施或开发的时候,对于基础数据的要求很严格,很多时候都是直接克隆生产环境的数据来进行软件系统的测试,但是随之而来的影响却是深远的,生产数据中,首先它是一个真实的数据,透过数据基本上掌握了整个数据库的资料。其次,在这当中包含很多敏感数据,不光是敏感数据,而且还是真实的敏感数据。如果在测试环境中发生了信息泄露问题,那么对于用户数据安全将造成致命的后果。
近年来,政府行业重大的敏感数据泄漏事件时有发生,如下图所示:
核心数据脱敏模块的建设基于动态数据脱敏技术,通常是应用于生产系统,当对数据库提出读取数据的请求时,动态数据脱敏按照访问用户的角色执行不同的脱敏规则。如下图所示:授权用户可以读取完整的原始数据,而非授权用户只能看到脱敏后的数据。
大数据平台脱敏及模糊化模块主要包括两大功能:敏感数据发现和敏感数据脱敏。架构设计如下图所示:
敏感数据发现:通过设置敏感数据发现策略,平台自动识别敏感数据,发现敏感数据后产生报警,保障数据在产生阶段安全。敏感数据发现功能包括如下内容:
- 敏感信息规则库建立
- 关系型数据检测
- 敏感内容描述检测
敏感数据脱敏:针对Hadoop平台Hive、Hbase大数据存储组件结合用户权限提供动态数据脱敏功能,保障敏感数据访问安全,同时基于大数据安全分析技术,发现敏感数据访问的异常行为,并提供敏感数据视图,实现全局化数据管理和对各种类别敏感数据脱敏的精细化管理。
数据脱敏及模糊化功能模块是在数据库层面对数据进行屏蔽、加密、隐藏、审计或封锁访问途径的方式。该模块作为一个网关形式部署,所有需要进行敏感数据动态脱敏的应用系统需通过该产品实现对数据库的访问。
数据脱敏:当应用程序请求通过敏感数据脱敏模块时,对其进行实时筛选,并依据用户角色、职责和其他定义规则对敏感数据进行脱敏处理。脱敏的方式包括如下几种形式:
- 数据替换 – 以虚构数据代替真值;
- 截断、加密、隐藏或使之无效 – 以“无效”或 *****代替真值;
- 随机化 – 以随机数据代替真值;
- 偏移 – 通过随机移位改变数字数据;
- 访问预警:在大数据应用正常访问行为模型自学习基础上,进行应用异常行为分析、发现及告警功能强化应用安全管控,保证数据安全。