怎么利用人工智能和自动化大规模识别敏感数据
人工智能敏感信息检测服务商Text IQ公司首席执行官Apoorv Agarwal日前在接受行业媒体采访时,对非结构化数据面临的潜在风险以及利用人工智能和自动化技术大规模识别敏感数据进行了分析和阐述。
当企业试图解决漏洞和勒索软件攻击时,他们往往忽略了隐藏在其数据中的敏感信息。出现这种情况的主要原因是什么?ASP站长网 Agarwal:在理想情况下,企业应该掌握敏感信息在其拥有的数据中的位置。一般来说,企业将会长时间保留他们收集的信息,即使这些信息对他们没有真正的用处。我认为这归结为更广泛的数据治理问题。
如果没有实现一定程度的自动化,就不可能有强大的数据治理。例如,企业生成的数据量呈指数级增长,依赖于工作人员对隐藏在其数据库中的所有未被发现的敏感信息进行评估,而且在通常情况下,非结构化格式的数据需要进行处理,因此无法大规模地开展工作。
数据泄露和勒索软件攻击的数量将持续增长,但企业可以利用人工智能技术应对,这使他们能够主动大规模识别敏感数据和个人数据。一旦识别了这些数据,他们就可以选择编辑、删除、加密或采取任何必要的措施进行保护,以确保不会落入居心不良的人的手中。
非结构化数据如何构成风险以及可以采取哪些措施? Agarwal:80%以上的企业数据是非结构化的——其庞大的攻击面使其非常容易成为网络攻击者的目标。其次,这种非结构化数据充满了各种类型的敏感信息:商业秘密、个人信息、健康信息、知识产权等;例如,没有人能够构建包含商业秘密的结构化数据库,更有可能散布在电子邮件、聊天记录、Excel表格和其他形式的非结构化数据中。
非结构化数据带来的挑战是数据量巨大,找到其中的敏感信息就像大海捞针一样,因此需要采用可扩展的机器学习技术。 (编辑:焦作站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |