明朝萬達基于對數據安全市場深刻理解從實際應用場景出發,對自主Chinasec(安元)網絡數據防泄漏系統中提升基于深度學習的智能文本識別與文檔分類技術,以更加精準而高效產品形態為企業數據安全護航,實現與企業共贏。
隨著企業信息化水平的不斷提高,企業在產業與服務、營銷支持、業務運營、風險管控、信息披露和分析決策等經營管理活動中積累了大量的業務數據,一旦這些業務數據丟失或泄漏,則有可能造成巨大的經濟損失,或在社會、法律、信用、品牌上對企業造成嚴重不良影響,如何高效準確識別業務數據是企業數據安全所面臨的核心問題。
?
傳統數據防泄漏系統將關鍵字、正則表達式作為唯一匹配規則,面對企業復雜多樣的實際生產環境,導致大量的誤報和漏報問題,針對非結構化數據基于上下文的內容識別,一直是信息安全領域的難點和壁壘。
?
自然語言處理能夠基于文本語義特征,短時間內分析海量文本,快速實現針對文本的分類管理,與傳統的數據發現策略相融合, 幫助企業準確識別業務數據,并在此基礎上,對敏感數據施加動態化的按需防護,切實有效的保障業務數據的安全存儲和流轉。
作為明朝萬達Chinasec(安元)核心產品之一,Chinasec(安元)網絡數據防泄漏系統部署在企業外網出口,對外發數據包進行會話重組與文件恢復后獲取內容,通過策略匹配的方式來實現外發數據的內容管控,以防止企業敏感數據傳輸到企業外部。
?
本次系統升級新增智慧文檔分類功能,分為訓練、預測、糾錯三個階段。訓練階段主要利用深度內容分析引擎和聚類等相關算法,分析大量人工標注的原始樣本集,根據文本內容的語義特征和格式自動按照內容進行主題梳理,并可通過人工干預靈活調整語義相似度,獲得滿意的分類效果并生成預測模型;預測階段主要利用預測模型實時感知檢測敏感數據的使用狀況,實現對企業外發數據的有效預測與精準分類;糾錯階段主要對預測模型的誤報行為,支持用戶手動標注誤報功能,對預測模型的準確率造成積極正向干預,為數據動態分類分級奠定基礎。
?
將自然語言處理技術和分類分級相結合的智慧分類功能對企業外發數據按照敏感級別進行有效分類并智能歸檔,大幅降低傳統關鍵字、正則表達式識別的誤報率和漏報率,是敏感數據管理的重要突破,為企業實現細粒度、差異化管控提供了重要支撐。
明朝萬達是業界領先的數據安全解決方案提供商,擁有源于清華大學并積累多年的技術優勢,已申請多項數據安全領域的發明專利。目前公司已申請專利260余項。
?
在數據安全技術領域,明朝萬達深耕十余年,運用自主研發的Chinasec(安元)數據安全系列產品,基于國內首創的“動態數據安全”理念,覆蓋數據產生、存儲、交換、使用等全生命周期的重要環節,在金融、政府、公安等領域已得到廣泛應用,并獲得客戶的一致好評。

