欧美肉体xxxx裸体137大胆 I 3d动漫精品啪啪一区二区下载 I 乱码国产丰满人妻www I 伊人久久乐 I 九月婷婷人人澡人人添人人爽 I 欧美日韩一二区 I 99在线观看视频 I 亚洲,国产成人av I 色婷婷婷婷 I 亚洲蜜臀av国产aⅴ综合小说 I 污片网站在线免费观看 I 在线看片免费人成视频大全 I 国产乱子伦精品无码码专区 I 亚洲视频一区二区三区 I 久久国产人妻一区二区免费 I 福利视频三区 I 99精品欧美一区二区三区视频 I 日本一级二级视频 I 国产在线看片 I 一级在线毛片 I a天堂在线视频 I 欧美在线视频网 I 精品欧洲av无码一区二区三区 I 国产高清japanese在线播放e I 亚洲制服丝袜中文字幕自拍 I 啪啪无码人妻丰满熟妇 I 五月婷婷久久久 I 帮老师解开蕾丝奶罩吸乳视频 I 东北女人啪啪ⅹxx对白 I 日韩一级片免费看 I 亚洲天堂精品视频在线观看 I 日本成人中文字幕在线视频 I 免费黄色在线网 I 久久,天天综合 I 国产有色视频色综合

?
公司新聞
當(dāng)前位置: 首頁(yè) > 新聞中心 > 公司新聞 > 干貨丨AI在數(shù)據(jù)防泄漏中的應(yīng)用--知識(shí)圖譜之知識(shí)抽取 返回
干貨丨AI在數(shù)據(jù)防泄漏中的應(yīng)用--知識(shí)圖譜之知識(shí)抽取
發(fā)布時(shí)間:2020-09-15 打印 字號(hào):


隨著技術(shù)的不斷發(fā)展,AI(Artificial Intelligence,人工智能)逐漸在社會(huì)經(jīng)濟(jì)發(fā)展的方方面面深入,成為信息化時(shí)代最重要的支柱技術(shù)之一。

在數(shù)據(jù)安全領(lǐng)域領(lǐng)域,AI技術(shù)所能起到的作用越來(lái)越大,如針對(duì)數(shù)據(jù)防泄漏,運(yùn)用知識(shí)圖譜技術(shù)可以使數(shù)據(jù)實(shí)現(xiàn)結(jié)構(gòu)化,減少人為性工作,從而讓數(shù)據(jù)治理工作趨向智能化,提升工作效率。



在之前的文章中,明朝萬(wàn)達(dá)數(shù)據(jù)安全專家已經(jīng)就“何為 AI在數(shù)據(jù)防泄漏中的應(yīng)用--知識(shí)圖譜”做了詳細(xì)的介紹。之后我們也將以系列文章形式為大家分享“知識(shí)抽取”、“知識(shí)融合”、“知識(shí)推理”、“知識(shí)運(yùn)用”的相關(guān)知識(shí),大家一同探討,深入了解。


 知識(shí)圖譜之知識(shí)抽取 

知識(shí)抽取是指從不同來(lái)源、不同結(jié)構(gòu)的數(shù)據(jù)中進(jìn)行知識(shí)提取,提取出數(shù)據(jù)內(nèi)涵的事實(shí)性信息并供給知識(shí)圖譜做進(jìn)一步加工處理后會(huì)形成知識(shí),存入到知識(shí)圖譜。
知識(shí)抽取需處理的數(shù)據(jù)為多源異構(gòu)數(shù)據(jù),一般包括非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù),其相應(yīng)的知識(shí)抽取的方法和技術(shù)各不相同。

△多元異構(gòu)數(shù)據(jù)與對(duì)應(yīng)知識(shí)抽取技術(shù)


★ 從非結(jié)構(gòu)化中獲取知識(shí)用信息抽取,其難點(diǎn)在于結(jié)果的準(zhǔn)確率與覆蓋率;
★ 從半結(jié)構(gòu)化數(shù)據(jù)中獲取知識(shí)用包裝器,難點(diǎn)在于包裝器的自動(dòng)生成、更新和維護(hù);
★ 從結(jié)構(gòu)化數(shù)據(jù)中獲取知識(shí)用 D2R,其難點(diǎn)在于復(fù)雜表數(shù)據(jù)的處理,包括嵌套表、多列、外鍵關(guān)聯(lián)等;
★ 從鏈接數(shù)據(jù)中獲取知識(shí)用圖映射,難點(diǎn)在于數(shù)據(jù)對(duì)齊。


知識(shí)抽取:非結(jié)構(gòu)化數(shù)據(jù)

面向非結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取使用信息抽取技術(shù)解決,信息抽取包括命名實(shí)體識(shí)別、關(guān)系識(shí)別、共指消歧、事件抽取及模板填充五個(gè)任務(wù),其流程如下圖所示:





知識(shí)抽取:半結(jié)構(gòu)化數(shù)據(jù)

半結(jié)構(gòu)化數(shù)據(jù)是指類似于百科、商品列表等本身存在一定結(jié)構(gòu)但需要進(jìn)一步提取整理的數(shù)據(jù)。面向半結(jié)構(gòu)化的知識(shí)抽取使用包裝器實(shí)現(xiàn),其基本流程如下:

知識(shí)抽取:結(jié)構(gòu)化數(shù)據(jù)

結(jié)構(gòu)化數(shù)據(jù)就是指類似于關(guān)系庫(kù)中表格形式的數(shù)據(jù),該類數(shù)據(jù)往往在各項(xiàng)之間存在明確的關(guān)系名稱和對(duì)應(yīng)關(guān)系。因此可以簡(jiǎn)單的將其轉(zhuǎn)化為RDF或其他形式的知識(shí)庫(kù)內(nèi)容。
關(guān)于知識(shí)抽取,一種常用的W3C推薦的映射語(yǔ)言是R2RML(RDB2RDF),其映射結(jié)果如下:
1、數(shù)據(jù)庫(kù)表t_student結(jié)構(gòu)



2、按照R2RML語(yǔ)言映射成RDF三元組知識(shí)結(jié)構(gòu)



以及,現(xiàn)有的工具免費(fèi)的有D2RQ,Virtuoso、MOrph等。


400-650-8968