2)數(shù)據(jù)存儲
數(shù)據(jù)存儲階段是將數(shù)據(jù)持久地保存在大數(shù)據(jù)平臺中,存儲的數(shù)據(jù)包括采集的數(shù)據(jù)以及分析的數(shù)據(jù)等。存儲系統(tǒng)應支持對不同數(shù)據(jù)類型和格式的數(shù)據(jù)存儲,并且需要提供多種數(shù)據(jù)訪問接口,如文件系統(tǒng)接口、數(shù)據(jù)庫接口等。存儲活動的主要操作包括數(shù)據(jù)編解碼、數(shù)據(jù)加解密、數(shù)據(jù)持久存儲、數(shù)據(jù)備份、數(shù)據(jù)更新和數(shù)據(jù)訪問等。
在數(shù)據(jù)存儲階段涉及到的安全問題有:存儲架構安全、邏輯存儲安全、存儲訪問安全、 數(shù)據(jù)副本安全、數(shù)據(jù)歸檔安全等。
3)數(shù)據(jù)使用
數(shù)據(jù)使用活動包括利用數(shù)據(jù)預處理、數(shù)據(jù)分析和數(shù)據(jù)可視化等技術從原始數(shù)據(jù)中提取有價值信息,支撐組織作出合理決策等操作。使用活動的主要操作包括數(shù)據(jù)查詢、讀取、索引、批處理、交互式處理、流處理、數(shù)據(jù)統(tǒng)計分析、預測分析、關聯(lián)分析、可視化以及分析報告生成等。
在數(shù)據(jù)使用階段涉及到的安全問題有:分布式處理安全、數(shù)據(jù)分析安全、數(shù)據(jù)加密處理、數(shù)據(jù)脫敏處理以及數(shù)據(jù)溯源等。
4)數(shù)據(jù)分發(fā)
數(shù)據(jù)分發(fā)活動是將原始數(shù)據(jù)、處理后數(shù)據(jù)以及分析后數(shù)據(jù)等不同形式的數(shù)據(jù)傳遞給外部實體或組織內部的其他部門。數(shù)據(jù)分發(fā)階段主要操作有數(shù)據(jù)傳輸、數(shù)據(jù)交換、數(shù)據(jù)交易、數(shù)據(jù)共享等。
在數(shù)據(jù)使用階段涉及到的安全問題有:數(shù)據(jù)傳輸安全、數(shù)據(jù)訪問控制、數(shù)據(jù)脫敏處理等。
5)數(shù)據(jù)刪除
數(shù)據(jù)刪除是指刪除大數(shù)據(jù)平臺或租用的第三方大數(shù)據(jù)存儲平臺上的數(shù)據(jù)及其副本。若數(shù)據(jù)來自于外部實時數(shù)據(jù)流,還應斷開與實時數(shù)據(jù)流的連接。數(shù)據(jù)刪除階段主要操作包括刪除元數(shù)據(jù)、原始數(shù)據(jù)及副本,斷開與外部實時數(shù)據(jù)流的鏈接等操作。