內(nèi)容審計(jì)應(yīng)完成的主要功能四
(1)網(wǎng)絡(luò)信息內(nèi)容的獲取,主要研究如何在大規(guī)模網(wǎng)絡(luò)環(huán)境中快速獲取各種協(xié)議的信息內(nèi)容;
(2)網(wǎng)絡(luò)內(nèi)容還原分析,主要是將獲取的數(shù)據(jù)包還原,并分析其中的信息內(nèi)容。
在實(shí)際應(yīng)用中,網(wǎng)絡(luò)信息內(nèi)容審計(jì)系統(tǒng)主要由負(fù)載均衡模塊、包捕獲模塊、協(xié)議還原分析模塊、數(shù)據(jù)過濾與分流模塊、內(nèi)容處理模塊、結(jié)果反饋查詢模塊等組成。根據(jù)具體需求和資源限制,內(nèi)容審計(jì)系統(tǒng)分為流水線模型和分段模型兩種過程模型。
流水線是一種可使兩個(gè)或多個(gè)操作在執(zhí)行時(shí)發(fā)生重疊的技術(shù)。在流水線操作中,一個(gè)任務(wù)被分解為多個(gè)子任務(wù)。在執(zhí)行時(shí),多個(gè)子任務(wù)相互重疊。根據(jù)處理流量不同,流水線處理過程中各個(gè)時(shí)期的延時(shí)均不相同,但應(yīng)保證延時(shí)的平均值不會隨時(shí)間的推移而增大。因此,流水線處理要求各個(gè)部分處理速度基本相同。
分段式處理模型的基本思想是先收集某個(gè)網(wǎng)段一定時(shí)間內(nèi)的數(shù)據(jù),然后進(jìn)行離線式分析。此模型分為實(shí)時(shí)處理和離線處理兩部分。包捕獲以前的部分設(shè)計(jì)為實(shí)時(shí)處理部分,協(xié)議分析還原部分設(shè)計(jì)為離線處理部分。與流水線模型相比,分段式處理模型的瓶頸在于其包捕獲處理能力。分段式處理模型僅能對部分時(shí)間段內(nèi)的高速流量進(jìn)行處理。
網(wǎng)絡(luò)中不良信息的數(shù)量與日俱增,所造成的文化污染、網(wǎng)絡(luò)犯罪等問題已經(jīng)受到人們越來越多的關(guān)注。如何及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)中的不良信息,準(zhǔn)備地對其進(jìn)行識別和判斷,并采取有效的措施對其進(jìn)行監(jiān)管是當(dāng)前面臨的重大挑戰(zhàn)。