【中培課堂】新時(shí)代網(wǎng)絡(luò)空間安全的新挑戰(zhàn)
據(jù)中培小編了解隨著信息社會(huì)的發(fā)展和互聯(lián)網(wǎng)的普及,特別是Web2.0、Web3.0等技術(shù)帶來(lái)論壇、博客、微博、社交網(wǎng)絡(luò)的快速發(fā)展,“人人都有麥克風(fēng)”,由此各類(lèi)信息呈現(xiàn)出傳播渠道多、傳播速度快、傳播范圍廣的特點(diǎn),互聯(lián)網(wǎng)逐步深入到社會(huì)的各個(gè)領(lǐng)域,它提供了難以計(jì)數(shù)的有用信息,但同時(shí)也伴隨著大量的不良信息,如計(jì)算機(jī)病毒、網(wǎng)絡(luò)入侵與攻擊、垃圾郵件、色情信息、反動(dòng)言論以及泄露的機(jī)密信息等,這些不良信息不僅會(huì)造成重大的經(jīng)濟(jì)損失,而且會(huì)威脅國(guó)家的政治、科技、國(guó)防、宗教等的正常秩序,干擾人民群眾的正常生活,甚至引發(fā)社會(huì)動(dòng)蕩,網(wǎng)絡(luò)安全在國(guó)家安全中的地位和作用也越來(lái)越大。
互聯(lián)網(wǎng)已經(jīng)成為政府、企業(yè)、公安、軍隊(duì)、金融等各行各業(yè)獲取信息的重要來(lái)源,由互聯(lián)網(wǎng)上海量數(shù)據(jù)正在成為各行各業(yè)決策的重要依據(jù)。因此在新時(shí)代網(wǎng)絡(luò)空間下,針對(duì)海量數(shù)據(jù)形成全面、智能、精煉、友好的深度分析,并及時(shí)快速應(yīng)對(duì)處理,是一個(gè)非常重要、亟需解決的問(wèn)題。近年來(lái),隨著互聯(lián)網(wǎng)、云計(jì)算、移動(dòng)物聯(lián)網(wǎng)的迅猛發(fā)展,大數(shù)據(jù)作為主要的信息來(lái)源,已成為信息處理領(lǐng)域的主流。如何發(fā)現(xiàn)大數(shù)據(jù)所蘊(yùn)含的價(jià)值,并發(fā)揮其價(jià)值,已經(jīng)受到科研和企業(yè)單位的高度重視。大數(shù)據(jù)內(nèi)容理解是我國(guó)新時(shí)期所面臨的種種重大需求中的一個(gè)關(guān)鍵科學(xué)問(wèn)題,是信息科技發(fā)展新的瓶頸,是走出“數(shù)據(jù)爆炸但知識(shí)貧乏”困境的一個(gè)突破口,對(duì)大數(shù)據(jù)內(nèi)容進(jìn)行“理解”與智能化分析處理,從而挖掘大數(shù)據(jù)中蘊(yùn)含知識(shí)和信息。使大數(shù)據(jù)成為為國(guó)家、企業(yè)和社會(huì)服務(wù)的有效資源。
2003年9月7日中共中央辦公廳、國(guó)務(wù)院辦公廳發(fā)出通知貫徹落實(shí)《國(guó)家信息化領(lǐng)導(dǎo)小組關(guān)于加強(qiáng)信息安全保障工作的意見(jiàn)》(中辦發(fā)[2003]27號(hào)),2007年中共中央辦公廳、國(guó)務(wù)院辦公廳聯(lián)合印發(fā)《國(guó)家信息安全“十一五”規(guī)劃》(國(guó)信安[2007]2號(hào))。2013年11月12日,中國(guó)共產(chǎn)黨十八屆三中全會(huì)公報(bào)指出將設(shè)立國(guó)家安全委員會(huì),完善國(guó)家安全體制和國(guó)家安全戰(zhàn)略,確保國(guó)家安全。
挑戰(zhàn)之一:面向網(wǎng)絡(luò)空間大數(shù)據(jù)的并行存儲(chǔ)與計(jì)算技術(shù)
現(xiàn)在的社會(huì)已全面進(jìn)入大數(shù)據(jù)時(shí)代(Big Data),在人類(lèi)社會(huì)的信息化過(guò)程中,數(shù)字信息數(shù)量正急劇增長(zhǎng),同時(shí)它們所需保存的時(shí)間也比以前大為延長(zhǎng),全人類(lèi)每年要產(chǎn)生約10億~20億GB (1Exabytes -2Exabytes)的新信息,這一信息數(shù)量相當(dāng)于全球每人每年要產(chǎn)生250MB的信息。
新型網(wǎng)絡(luò)空間下,需要將從網(wǎng)絡(luò)上搜集過(guò)來(lái)的大量數(shù)據(jù)進(jìn)行存儲(chǔ),并對(duì)數(shù)據(jù)進(jìn)行整理、建索引、以及各種快速有效的組織和處理,以便靈活方便高效地得出各種業(yè)務(wù)結(jié)論。隨著互聯(lián)網(wǎng)的快速發(fā)展,各種移動(dòng)終端的迅速增加,結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)量越來(lái)越大。傳統(tǒng)的文件系統(tǒng)已經(jīng)不能滿(mǎn)足海量數(shù)據(jù)的存儲(chǔ)要求,分布式文件系統(tǒng)日益成為研究的熱點(diǎn);同時(shí)由于數(shù)據(jù)量過(guò)于龐大,傳統(tǒng)的單機(jī)處理方式不能滿(mǎn)足處理需求,并行的處理方式得到快速的發(fā)展。因此,急需研究面向網(wǎng)絡(luò)空間大數(shù)據(jù)的新型并行存儲(chǔ)與計(jì)算技術(shù)。
挑戰(zhàn)之二:面向網(wǎng)絡(luò)空間大數(shù)據(jù)的內(nèi)容理解技術(shù)
大數(shù)據(jù)內(nèi)容理解是我國(guó)新時(shí)期所面臨的種種重大需求中的一個(gè)關(guān)鍵科學(xué)問(wèn)題,是信息科技發(fā)展新的瓶頸,是走出“數(shù)據(jù)爆炸但知識(shí)貧乏”困境的一個(gè)突破口。大數(shù)據(jù)包含結(jié)構(gòu)化和非結(jié)構(gòu)化的種類(lèi)繁多的數(shù)據(jù),內(nèi)容包括各種文檔、視頻、圖像、語(yǔ)音等數(shù)據(jù)形式。據(jù)統(tǒng)計(jì),互聯(lián)網(wǎng)數(shù)據(jù)中約20%的數(shù)據(jù)是結(jié)構(gòu)化的,約80%則是非結(jié)構(gòu)化或半結(jié)構(gòu)化的。當(dāng)今世界結(jié)構(gòu)化信息增長(zhǎng)率大概是32%,而非結(jié)構(gòu)化信息增長(zhǎng)則是63%,非結(jié)構(gòu)化信息占有比例將達(dá)到互聯(lián)網(wǎng)整個(gè)數(shù)據(jù)量的75%以上,而非結(jié)構(gòu)化信息中50%~75%的數(shù)據(jù)都來(lái)源于人與人的互動(dòng),都是以人為中心產(chǎn)生的。隨著新時(shí)代網(wǎng)絡(luò)空間的發(fā)展,非結(jié)構(gòu)化信息越來(lái)越多,網(wǎng)絡(luò)輿情也往往由非結(jié)構(gòu)化信息引發(fā)。本系統(tǒng)研究非結(jié)構(gòu)化信息理解技術(shù),支持word、pdf等一百多種常見(jiàn)文檔內(nèi)容分析,支持圖片、圖像、電話(huà)交談、網(wǎng)絡(luò)聊天、視頻等多媒體內(nèi)容理解。只有通過(guò)理解所有信息的含義,計(jì)算機(jī)才能自動(dòng)處理信息并使用戶(hù)能夠運(yùn)用并最大化信息的價(jià)值。
針對(duì)這一特點(diǎn),需要從3個(gè)層面展開(kāi)深度研發(fā)。
(1)大數(shù)據(jù)內(nèi)容理解的認(rèn)知機(jī)理和數(shù)據(jù)基礎(chǔ)
該層面主要研究大數(shù)據(jù)內(nèi)容的各種信息來(lái)源及其表達(dá)方式,即研究感知信息的基本表達(dá)方式。探索通過(guò)感知系統(tǒng)獲取的信息在計(jì)算機(jī)中應(yīng)如何表達(dá),確定對(duì)不同種類(lèi)信息進(jìn)行計(jì)算處理的基本單元,包括視覺(jué)信息的基本表達(dá)、語(yǔ)音信息的基本表達(dá)、語(yǔ)言信息的基本表達(dá)。構(gòu)建數(shù)字內(nèi)容理解的視覺(jué)、語(yǔ)音、語(yǔ)言知識(shí)資源等,并實(shí)現(xiàn)多信息源知識(shí)的有效融合,將局部的、不完整的信息組織整合成具有意義的一個(gè)個(gè)整體。
(2)大數(shù)據(jù)內(nèi)容理解的計(jì)算模型與方法
本層面的研究主要對(duì)信息內(nèi)容理解的各種計(jì)算模型與方法展開(kāi)研究,包括語(yǔ)義層面的智能文檔信息處理技術(shù),口語(yǔ)語(yǔ)音信息的分析技術(shù)與方法,圖像序列內(nèi)容理解的模型與方法,大規(guī)模內(nèi)容計(jì)算與內(nèi)容監(jiān)控的計(jì)算模型與方法。
(3)大數(shù)據(jù)內(nèi)容理解的實(shí)踐與驗(yàn)證環(huán)境
本層面的研究主要針對(duì)第二層面研究所的計(jì)算模型和方法,開(kāi)展相應(yīng)的實(shí)現(xiàn)與驗(yàn)證,檢驗(yàn)所提出的計(jì)算模型和算法的有效性。
挑戰(zhàn)之三:面向網(wǎng)絡(luò)空間安全的數(shù)據(jù)包內(nèi)容檢測(cè)技術(shù)
為了保障網(wǎng)絡(luò)中信息內(nèi)容的安全,人們提出了深包檢測(cè)(Deep Packet Inspection)技術(shù),是很多網(wǎng)絡(luò)安全系統(tǒng)的基礎(chǔ)核心技術(shù),如防病毒、網(wǎng)絡(luò)入侵檢測(cè)和防御(IDS/IPS)、防垃圾郵件、防惡意代碼、網(wǎng)絡(luò)審計(jì)、內(nèi)容過(guò)濾、UTM(統(tǒng)一威脅管理)等安全系統(tǒng)。深包檢測(cè)技術(shù)的核心環(huán)節(jié)是用特征匹配技術(shù)檢測(cè)網(wǎng)包負(fù)載(packet payload)中是否出現(xiàn)預(yù)定義的特征(pattern)。根據(jù)具體網(wǎng)絡(luò)安全應(yīng)用,檢測(cè)的特征可以是預(yù)先提取的惡意代碼中的一個(gè)片斷,也可以是垃圾郵件中的一段字符串,也可以是用戶(hù)自己定義的關(guān)鍵字等,即可以用字符串表示,也可以用復(fù)雜的正則表達(dá)式(Regular Expression)表示。由于病毒變種的增多、攻擊形式的多樣化、入侵特征的提取難度增加、網(wǎng)絡(luò)協(xié)議的復(fù)雜性增加等因素,特征形式變得越來(lái)越復(fù)雜,只用簡(jiǎn)單字符串很難準(zhǔn)確描述,而正則表達(dá)式相對(duì)字符串具備更加強(qiáng)大和靈活的表達(dá)能力,正在逐漸成為新一代描述特征的語(yǔ)言,但由于其形式的復(fù)雜多樣導(dǎo)致匹配難度的增加和性能的下降。
隨著網(wǎng)絡(luò)安全應(yīng)用功能的豐富,其計(jì)算復(fù)雜性日益提高,防火墻、入侵檢測(cè)、防毒墻、UTM等作為網(wǎng)絡(luò)高端應(yīng)用,對(duì)每個(gè)網(wǎng)絡(luò)包的處理需要更多的指令數(shù)。可以看到,系統(tǒng)功能的豐富以“犧牲”性能為代價(jià)。現(xiàn)在的網(wǎng)絡(luò)安全系統(tǒng)功能在不斷增加,伴隨著性能的需求也在不斷提升。
挑戰(zhàn)之四:支持移動(dòng)互聯(lián)網(wǎng)等新型接入方式
隨著3G/4G/WIFI技術(shù)的普及和商業(yè)WIFI的迅速發(fā)展,越來(lái)越多的非經(jīng)營(yíng)上網(wǎng)場(chǎng)所對(duì)外提供了免費(fèi)的WIFI接入服務(wù)。同時(shí),商家越來(lái)越注重3G/4G/WIFI在營(yíng)銷(xiāo)方面的價(jià)值,對(duì)3G/4G/WIFI的增值需求也越發(fā)明顯。 因此網(wǎng)絡(luò)空間安全需要支持3G/4G/WIFI技術(shù)接入。
在全球信息化進(jìn)程中,我國(guó)正處于從被動(dòng)應(yīng)對(duì)向自主發(fā)展轉(zhuǎn)變的關(guān)鍵時(shí)期,加緊實(shí)施國(guó)家信息化發(fā)展戰(zhàn)略,強(qiáng)化信息技術(shù)創(chuàng)新,已成為支撐現(xiàn)代化建設(shè)、增強(qiáng)國(guó)家綜合實(shí)力的必然選擇。如何通過(guò)創(chuàng)新與規(guī)范,促進(jìn)新時(shí)代網(wǎng)絡(luò)空間和諧發(fā)展,充分適應(yīng)信息技術(shù)的發(fā)展和形勢(shì)的變化,積極實(shí)施網(wǎng)絡(luò)空間管理的監(jiān)督職能、引導(dǎo)職能、規(guī)范職能、懲戒職能,加快建立法律規(guī)范、行政監(jiān)督、行業(yè)自律、技術(shù)保障相結(jié)合的網(wǎng)絡(luò)空間管理體制和機(jī)制,推動(dòng)網(wǎng)絡(luò)空間健康發(fā)展。(中培偉業(yè)發(fā)文)
想了解更多IT資訊,請(qǐng)?jiān)L問(wèn)中培偉業(yè)官網(wǎng):中培偉業(yè)