数据脱敏解决方案——金融行业

帆 世平信息 1周前

一、现状分析

行业背景

金融行业是高度信息化的行业,在人们的日常生活中扮演着重要的角色,同时也积累了大量的用户个人数据,如何保证生产环境数据安全已经成为一个行业难题。

在加强金融(银行)行业监管的大背景下,对数据安全的要求不断提高,《中国银行业“十三五”信息科技发展规则监管指导意见》、《人民银行(2011〕17号》及《银监会信息科技风险现场检查指南》等行业监管单位指导性文件中明确要求:

银行机构应规避信息风险,加强数据、文档的安全管理,对客户的敏感信息提供完善的保护,对用于测试开发的生产数据要进行脱敏、变形、实现有效保护,逐步建立信息资产分类分级保护机制,完善敏感信息存储和传输等高风险环节的控制措施。

个人隐私保护趋势

大数据及云平台的发展,最终目的在于提高信息的利用率、数据的流通性、进一步挖掘数据的价值,尤其是在金融领域长期积累的数据,其本身的价值也越来越高。

如何做到既能充分利用这些数据,又能把这些数据有效地保护起来,成为金融领域数据安全重点关注的领域。

 国内对于个人隐私数据保护的政策法律也日益完善:

  • 宪法和民法通则对个人隐私实行保护;

  • 2009年《刑法》将泄露个人信息入罪;

  • 2010年《企业内部控制基本规范》(即“中国的萨班斯法案”);

  • GBT 22239-2008 信息安全技术 信息系统安全等级保护基本要求;

  • GBT 22240-2008 信息安全技术 信息系统安全等级保护定级指南;

  • 我国首个个人信息保护国家标准——《信息安全技术公共及商用服务信息系统个人信息保护指南》2013年2月1日起实施;

  • 最高人民法院2014年10月9日公布《最高人民法院关于审理利用信息网络侵害人身权益民事纠纷案件适用法律若干问题的规定》;

  • 网络安全法第41条、第42条。

个人隐私安全所面临的挑战

1. 大量积累的业务数据,在用与防之间的流转过程中,如何保障个人隐私?

随着金融业务的快速发展,业务生产系统积累了大量包含客户账户等敏感信息的数据。而在业务分析、开发测试、审计监管,甚至是外包业务等金融业的工作场景中,工作人员使用的都是真实数据。

如果这些数据发生泄露、损坏,不仅会带来经济损失,更重要的是会大大影响用户对该金融机构的信任度,如何保证生产数据安全已成为银行必须面对的一个重要问题。

2. 上级主管部门不断推出针对性的政策法规,如何确保自身数据合规?

上文“行业背景”中已作关于行业政策法规的说明。

3. 现有技术明显跟不上业务发展的需要,输出包含有个人隐私数据的过程不够规范。

(1)备份恢复手段直接获得测试数据

  • 优点是简单快捷;

  • 弊端却是隐私数据毫无保留地被泄露。

(2)由开发商负责脱敏

  • 看似对数据进行了处理,但实际上执行者是开发商,真实数据同样已外流;

  • 效率低下,占用大量人力和时间;

  • 规则简单,通过逆向运算即可得到真实数据,并且简单的规则还会导致数据大量失真,仿真度太低,影响测试效果。

(3)写程序、脚本或命令对数据进行脱敏,效率不高,准确率无法判断

  • 对客户员工的技术水平要求较高;

  • 不成熟的算法导致测试数据质量同样不高。

二、隐私数据脱敏解决方案

方案定位

基于上述金融行业隐私数据使用以及保护过程中所存在的问题,世平信息针对银行非生产环境使用生产环境数据专门设计了“测试与隐私数据保护”解决方案。

该方案能够帮助金融机构相关部门对敏感数据的访问进行必要的管理,同时建立完善统一的脱敏机制与管理流程。该方案通过创建可在内部和外部安全共享的真实但无法识别归属的数据,防止个人隐私数据与其它重要信息意外泄露。

方案基本原理

本方案设计的主要目的是解决在金融生产环境与非生产环境敏感隐私数据的使用过程中,如何保护个人隐私数据的难题,实现金融业务与管理无缝对接,快速高效地实现生产环境数据向非生产环境的过渡。

具体原理如下图所示:

个人隐私数据漂白原理图

第一步:为生产数据建立一套隐私数据的模型和关系,同时支持自动定义和手工定义两种模式;

第二步:通过内部保存的生产数据模型,从生产系统周期性地抽取真实数据;

第三步:根据隐私数据模型,将抽取到的真实数据进行漂白脱敏,生成伪数据,这样测试数据就准备好待用,由于方案设计的平台是封闭系统,整个过程能够很好地避免数据泄露事件的发生;

第四步:当需要使用样例数据时,用户并不会直接访问内部数据,而是使用有限权限的帐号登录并将数据高速装载到外部的某个数据库中。

功能与业务流程设计

功能与流程

上图是整个方案的功能模块及业务流程,整个方案的功能与业务流程主要分成5个部分:

1. 数据智能发现

自动扫描并定位银行生产数据中的敏感数据,建立隐私数据模型,自动识别表与表之间的关联关系,世平利用自身独一无二的深度内容识别技术,在敏感数据智能发现上具有独一无二的竞争优势。

2. 数据梳理识别

根据隐私数据模型进行敏感数据匹配,定位哪些表哪些字段为隐私数据,属于哪种隐私数据,同时对于出错的数据进行进一步梳理,剔除错误数据,保证隐私数据模型的准确;

3. 数据自动抽取

根据自身记录的生产系统的元数据定义,从生产系统数据库当中抽取数据,抽取的数据源支持主流的数据库系统及文件。为安全起见,隐私数据在完成漂白之前,非数据管理员看到的都是空表。

4. 数据高效脱敏

数据漂白会自动根据元数据中隐私数据的定义,内置丰富的隐私数据模型规则,同时也可以自定义修改脱敏规则,对相应的数据进行脱敏变形。生成的伪数据具备以下特征:

  • 高度仿真;

  • 保持数据关联性;

  • 保持数据的唯一性;

  • 隐私算法灵活,保证数据的完整性。

5. 数据装载

面向不同的元数据,可以提供丰富多样的数据分发方式,同时支持对目标源的自动校验,最大限度保障用户数据的安全。

  • 支持异构平台;

  • 支持元数据的装载;

  • 支持全量装载;

  • 使用操作简单且批量写入高速。

方案收益

通过本方案的设计与实施,实现了金融行业的敏感数据保护,使其在保留数据意义和有效性的同时保证数据的安全性,并遵从金融行业数据隐私法律和法规。具体价值如下:

1. 实现了个人名称、地址、联系电话、身份证号码、卡号等个人信息数据与组织机构信息的脱敏处理。例如用相似的字符替代一些字段,用屏蔽字符替代字符等,使显示的数据是“逼真”的;

2. 脱敏后各表格中的数据关联关系依然保持一致,只需在一个表中应用替换算法,其它表格中客户相关信息同时自动更改;

3. 形成企业内部完善统一的脱敏机制与管理流程;

4. 同时整个解决方案还具有高效、易用、可扩展的特点,为后期推广打下坚实的基础。

方案特色

1. 治

依法合规,提供专业的多源异构数据管理,实现敏感信息的审计追溯,满足监管要求;

2. 智

基于深度内容识别技术的敏感信息智能发现,定制适合用户实际场景的模型;

3. 简

一站式数据脱敏任务制定,重复使用无影响,脱敏流程符合实际用户使用习惯,同时简化操作流程,脱敏规则双向保证,按需定制的同时,保证脱敏后的数据有效、多样、真实、高效及稳定;

4. 富

丰富的数据脱敏方式,支持删除、常数替换、随机查表替换等多重组合,形成对敏感生产数据的天然保护屏障;

5. 视

脱敏过程全程跟踪,结果快速比对,简化二次审核过程,脱敏结果报表可视化展现;

6. 准

灵活&自动化数据分发,支持库到库、库到文件、等多种精准输出方式;

7. 安

高等级安全标准设计系统,内置三权分立模块,脱敏结果不落地,同时提供“数据清理”功能,确保无任何剩余信息残留。

—END—

杭州世平信息科技有限公司(简称“世平信息”),致力于智能化数据管理与应用的深入开拓和持续创新,为用户提供数据安全、数据治理、数据共享和数据利用解决方案,帮助用户切实把握大数据价值与信息安全。

近期热点

 

中国保密协会副会长纪清阳等领导莅临世平信息参观考察、传经送宝

世平信息工会及党支部牵手杭州市数据资源局公益下乡

拓宽保密检查范围,管控涉密数据风险

网络安全周 | 网信办领导、沈昌祥院士莅临世平展位

世平携手阿里邀您参加2018数据安全与隐私保护大会

关键信息基础设施安全风险评估解决方案

猜你喜欢

转载自blog.csdn.net/shipinginfo/article/details/83015062
今日推荐