(4)數(shù)據(jù)存儲(chǔ)技術(shù)
數(shù)據(jù)存儲(chǔ)技術(shù)平臺(tái)的選擇一般要結(jié)合數(shù)據(jù)的重要等級(jí)、服務(wù)等級(jí)、安全等級(jí)、數(shù)據(jù)類型、數(shù)據(jù)訪問特性(增/刪/改/查)等多種因素綜合考慮。
1)對(duì)于交易型數(shù)據(jù),由于屬于交易系統(tǒng),重要且存在大量用戶的高并發(fā)訪問,要求實(shí)時(shí)響應(yīng)并提供7×24h的服務(wù),因此一般采用面向聯(lián)機(jī)事務(wù)處理系統(tǒng)(OLTP)的關(guān)系型數(shù)據(jù)庫來實(shí)現(xiàn)。從實(shí)際情況看,絕大多數(shù)銀行采用DB2及Oracle這兩種數(shù)據(jù)庫實(shí)現(xiàn)交易型數(shù)據(jù)的存儲(chǔ)。
2)對(duì)于集成型數(shù)據(jù),該類數(shù)據(jù)主要服務(wù)于銀行的決策支持,其重要程度、服務(wù)等級(jí)相對(duì)較低,但其數(shù)據(jù)規(guī)模相對(duì)較大(一些大型銀行的集成型數(shù)據(jù)可達(dá)PB級(jí)),以后臺(tái)批量運(yùn)算為主,所以一般采用大規(guī)模并行處理系統(tǒng)( MPP)架構(gòu)的技術(shù)平臺(tái)進(jìn)行數(shù)據(jù)的存儲(chǔ)管理,如IBM DBF、Teradata、Greenplum等。而隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)呈現(xiàn)爆發(fā)式增長,而且出現(xiàn)了大量的文本、網(wǎng)頁、圖像等半結(jié)構(gòu)化和非結(jié)構(gòu)化類型的有分析價(jià)值的數(shù)據(jù),與之相應(yīng)各類技術(shù)平臺(tái)也雨后春筍般地涌現(xiàn)。目前,Hadoop、Spark是互聯(lián)網(wǎng)企業(yè)運(yùn)用較多的技術(shù),各銀行也在進(jìn)行探索和引入,并在不同業(yè)務(wù)場(chǎng)景中獲得了初步的成功。
3)對(duì)于分析型數(shù)據(jù),主要面向客戶關(guān)系管理、風(fēng)險(xiǎn)管理、績效管理等業(yè)務(wù)領(lǐng)域服務(wù),側(cè)重于各類業(yè)務(wù)指標(biāo)的計(jì)算和展現(xiàn)服務(wù),具有批量計(jì)算、在線分析挖掘與即時(shí)響應(yīng)等特點(diǎn),一般采用Oracle、SAS類產(chǎn)品存儲(chǔ),并與分析挖掘工具、可視化工具結(jié)合滿足用戶的數(shù)據(jù)分析挖掘需要。
4)對(duì)于歷史型數(shù)據(jù),一般區(qū)分結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ)技術(shù)平臺(tái)考慮。銀行的結(jié)構(gòu)化歷史型數(shù)據(jù)主要以客戶的交易明細(xì)為主,需要滿足大量客戶的并發(fā)訪問需求,傳統(tǒng)是采用Oracle等關(guān)系型數(shù)據(jù)庫,采用分庫形式(如按歷史時(shí)間段)提供服務(wù),隨著MPP類系統(tǒng)、Hadoop的查詢并發(fā)響應(yīng)能力的提高,一些銀行已經(jīng)采用此類系統(tǒng)進(jìn)行歷史數(shù)據(jù)存儲(chǔ),部分銀行正在進(jìn)行技術(shù)可行性評(píng)估,逐步考慮遷移至該類系統(tǒng)提供服務(wù),減少因分庫而帶來的架構(gòu)及操作復(fù)雜性。銀行的非結(jié)構(gòu)化歷史型數(shù)據(jù)包括電子影像文檔等。此類數(shù)據(jù)規(guī)模巨大,一般采用磁盤文件、光盤、數(shù)據(jù)庫(存放索引)等多種技術(shù)平臺(tái)實(shí)現(xiàn)該類數(shù)據(jù)的存儲(chǔ)與查詢?cè)L問。