1.語義特征
語義特征是以文字表達的非結構化數 據特有的語義屬性。對于書籍、電影類,語義特征一般指作者的創作意圖、主題說明等。該屬性是非必備屬性。
2.基本屬性
基本屬性是非結構化數據都具有的一般屬性,包括名稱、類型、創建者、創建時間等。
3.底層特征
底層特征是通過各種專用處理技術(如圖像、語音、視頻等處理技術)獲得的非結構化數據特性,如電話錄音的格式、時長要求、比特率等相關技術屬性。
4.原始數據
原始數據是非結構化數據的原生態文件。
四面體模型的特點在于語義特征與底層特征進行一體化表達的集成性;圖像、文本、視頻、音頻等多種異構數據表達的統一性;支持語義特征、底層特征動態變化的可擴展性和簡單性。基于四面體模型構建的非結構化數據管理模型,將能夠實現異構數據進行統一存儲與關聯操作,從而更好地支持大數據的深度處理。