欧美肉体xxxx裸体137大胆 I 3d动漫精品啪啪一区二区下载 I 乱码国产丰满人妻www I 伊人久久乐 I 九月婷婷人人澡人人添人人爽 I 欧美日韩一二区 I 99在线观看视频 I 亚洲,国产成人av I 色婷婷婷婷 I 亚洲蜜臀av国产aⅴ综合小说 I 污片网站在线免费观看 I 在线看片免费人成视频大全 I 国产乱子伦精品无码码专区 I 亚洲视频一区二区三区 I 久久国产人妻一区二区免费 I 福利视频三区 I 99精品欧美一区二区三区视频 I 日本一级二级视频 I 国产在线看片 I 一级在线毛片 I a天堂在线视频 I 欧美在线视频网 I 精品欧洲av无码一区二区三区 I 国产高清japanese在线播放e I 亚洲制服丝袜中文字幕自拍 I 啪啪无码人妻丰满熟妇 I 五月婷婷久久久 I 帮老师解开蕾丝奶罩吸乳视频 I 东北女人啪啪ⅹxx对白 I 日韩一级片免费看 I 亚洲天堂精品视频在线观看 I 日本成人中文字幕在线视频 I 免费黄色在线网 I 久久,天天综合 I 国产有色视频色综合

?
公司新聞
當前位置: 首頁 > 新聞中心 > 公司新聞 > 干貨分享丨AI在數(shù)據(jù)防泄漏中的應用--知識圖譜 返回
干貨分享丨AI在數(shù)據(jù)防泄漏中的應用--知識圖譜
發(fā)布時間:2020-07-14 打印 字號:



新一輪科技革命已然開啟,5G、大數(shù)據(jù)中心、人工智能等領(lǐng)域發(fā)展如火如荼。而隨著這些新型科技在各行業(yè)內(nèi)應用普及,數(shù)據(jù)量級遞增,其價值也越來越受到全社會重視。

近年來,重大數(shù)據(jù)泄漏事件頻發(fā),對數(shù)據(jù)安全領(lǐng)域從業(yè)者是機遇更是挑戰(zhàn)。創(chuàng)新技術(shù)的應用和發(fā)展,為數(shù)據(jù)安全產(chǎn)業(yè)提供新的發(fā)展力,如AI在數(shù)據(jù)防泄漏中的應用。

那么,現(xiàn)行的數(shù)據(jù)防泄漏架構(gòu)是怎樣的?AI應用下產(chǎn)生的知識圖譜又是怎么一回事?讓我們跟著明朝萬達的數(shù)據(jù)安全專家一同來探討一二。


數(shù)據(jù)防泄漏問題

明朝萬達現(xiàn)有數(shù)據(jù)防泄漏架構(gòu)主要基于PPDR模型來實現(xiàn),PPDR由策略、防護、檢測、響應四部分機制組成。

其中,策略是核心,描述系統(tǒng)哪些資源需要保護;防護是加密機制等技術(shù);響應是應急策略;檢測是入侵檢測、數(shù)據(jù)防泄漏等技術(shù)。

數(shù)據(jù)防泄漏其核心能力就是內(nèi)容識別,識別出要保護的數(shù)據(jù)對象,然后對數(shù)據(jù)進行分類分級,最后根據(jù)客戶需求設(shè)置相應等級響應策略完成相應的數(shù)據(jù)防泄漏防護策略,從而達到保護系統(tǒng)安全和數(shù)據(jù)防泄漏的目的。

PPDR模型示意圖


-----


數(shù)據(jù)內(nèi)容識別技術(shù)發(fā)展

明朝萬達數(shù)據(jù)安全專家表示,當下數(shù)據(jù)內(nèi)容識別技術(shù)的發(fā)展已經(jīng)到了第三代。在數(shù)據(jù)內(nèi)容識別技術(shù)發(fā)展過程中:

第一代是基于規(guī)則匹配方法實現(xiàn),進而對識別內(nèi)容進行分類分級策略,該方法不具備智能性,無法做到準確分類分級,且局限性很大,不利于擴展到其他行業(yè)。

第二代識別技術(shù)是基于機器學習方法去實現(xiàn),該方法已具備初步的智能性,基于機器學習方法時,需要人工進行標注數(shù)據(jù),而后構(gòu)建復雜的特征對文本內(nèi)容進行分類,此方法已具備初步智能,但是需要耗費大量人力物力來進行數(shù)據(jù)標注和特征構(gòu)建。

第三代數(shù)據(jù)識別技術(shù)是基于知識圖譜來實現(xiàn),基于知識圖譜技術(shù)能利用正向反饋機制和自我學習兩種方式減少人工標注量,減少專家先驗知識和避免知識片面性,基于遠程監(jiān)督學習達到數(shù)據(jù)自動分類分級的目的,構(gòu)建出行業(yè)知識體系和領(lǐng)域內(nèi)知識圖譜,繼而擴展到其他行業(yè)領(lǐng)域。

數(shù)據(jù)識別技術(shù)發(fā)展歷程時間軸


-----


知識圖譜簡介

知識圖譜的架構(gòu)包括自身的邏輯結(jié)構(gòu)以及構(gòu)建知識圖譜所采用的技術(shù)結(jié)構(gòu)

邏輯結(jié)構(gòu)分為數(shù)據(jù)層模式層兩個層次,數(shù)據(jù)層由各個節(jié)點和邊組成,節(jié)點表示“實體”,邊表示實體間的“關(guān)系”,然后基于實體與關(guān)系經(jīng)過知識融合得到某一類的數(shù)據(jù)本體。模式層在數(shù)據(jù)層之上,是知識圖譜的核心,由數(shù)據(jù)層經(jīng)過提煉抽象得到。

明朝萬達數(shù)據(jù)安全專家解釋:知識圖譜由這兩部分結(jié)構(gòu)提供從“關(guān)系”的角度去分析問題的能力,利用模式層預測能力去分析問題,在分析問題的過程中可以根據(jù)分析的結(jié)果,反饋到數(shù)據(jù)層,利用正向反饋過程中的先驗知識在數(shù)據(jù)層加入正反向樣本使模型更加智能化,從而達到不斷自我學習目的,在完善與構(gòu)建知識圖譜的過程中通過不斷增加正反樣本來逐步減少人為的干預,使知識圖譜更加完善,最后構(gòu)建出領(lǐng)域內(nèi)知識。


知識圖譜構(gòu)建與應用流程圖


知識的本質(zhì)是語義的集合。文檔作為知識的載體,含有豐富的語義,而知識圖譜是結(jié)構(gòu)化的語義知識庫,能夠?qū)﹀e綜復雜的文檔數(shù)據(jù)進行有效的加工處理,從而實現(xiàn)知識的快速融合與推理。因此基于知識圖譜的數(shù)據(jù)文檔分類分級應運而生。相對于第二代識別技術(shù)而言,基于知識圖譜的識別分類技術(shù)不需要依賴大量先驗知識和標注數(shù)據(jù),只需要少量甚至不需要先驗知識就可以基于知識融合知識推理來反復迭代增加知識庫的知識量,使新的文本數(shù)據(jù)可以基于形成的知識庫進行識別與分類。解決了過度依賴人工標注和無法解決無標簽文本分類的情況。


-----


知識圖譜簡介

基于知識圖譜的文本分類結(jié)構(gòu)圖


實施步驟:

本實例基于已知標簽文本的合同等類別和未知標簽文本的數(shù)據(jù)進行分類來對知識圖譜進行實施運用,大致分為數(shù)據(jù)輸入,實體關(guān)系等屬性抽取,知識融合和數(shù)據(jù)分類,然后對未知的文本進行正向反饋和自我學習,達到識別敏感數(shù)據(jù)分類分級的目的。



-----


意義與展望

知識圖譜作為人工智能的支撐基礎(chǔ),是人工智能的必經(jīng)之路,企業(yè)在發(fā)展技術(shù)的同時更應重視領(lǐng)域+知識圖譜發(fā)展。

在未來,技術(shù)不是公司的核心競爭力,多年積累的行業(yè)領(lǐng)域數(shù)據(jù)才是壁壘,要形成數(shù)據(jù)養(yǎng)育知識,知識反哺數(shù)據(jù),領(lǐng)域數(shù)據(jù)和知識圖譜應相輔相成,共同發(fā)展。知識圖譜因其能不斷自我學習和具備正向反饋機制可以很好遷移到其他領(lǐng)域。

知識圖譜擴展領(lǐng)域應用示意圖



分享到:

400-650-8968