第5章 元數(shù)據(jù)管理
近年來,大數(shù)據(jù)技術(shù)已經(jīng)開始駛?cè)肟焖侔l(fā)展的軌道,國內(nèi)外從事大數(shù)據(jù)技術(shù)研究和應(yīng)用的企業(yè)越來越多,應(yīng)用領(lǐng)域也越來越廣,應(yīng)用行業(yè)也越來越細。但是,在行業(yè)應(yīng)用中,由于缺乏統(tǒng)一的數(shù)據(jù)描述,使得數(shù)據(jù)在識別、傳輸、轉(zhuǎn)換、共享等過程中常常出現(xiàn)歧義,數(shù)據(jù)的擁有者不能及時準(zhǔn)確地按照業(yè)務(wù)要求提供數(shù)據(jù)的情況時有發(fā)生。在大數(shù)據(jù)時代,借助于元數(shù)據(jù)了解數(shù)據(jù)的業(yè)務(wù)含義、上下文等信息的需求越來越強烈。據(jù)了解,ISO/IEC、JTC1、SC32下設(shè)的多個工作組從事不同領(lǐng)域的標(biāo)準(zhǔn)研制工作,其中就包括元數(shù)據(jù)。對于我國大數(shù)據(jù)時代元數(shù)據(jù)標(biāo)準(zhǔn)的制定,有國內(nèi)專家指出,我國迫切需要加強元數(shù)據(jù)標(biāo)準(zhǔn)或元數(shù)據(jù)模型的研究和應(yīng)用,健全與完善元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范和元數(shù)據(jù)模型,使大數(shù)據(jù)向著標(biāo)準(zhǔn)化、條理化、脈絡(luò)化方向發(fā)展,實現(xiàn)無歧義溝通、理解和共享使用,更好地對數(shù)據(jù)進行管控,挖掘大數(shù)據(jù),發(fā)揮數(shù)據(jù)價值。
在傳統(tǒng)金融體系外,大數(shù)據(jù)技術(shù)及應(yīng)用風(fēng)生水起,而作為擁有大量客戶信息及客戶交易數(shù)據(jù)的銀行卻越發(fā)顯示出在數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)、信息共享、信息挖掘和利用等方面的短板。
挖掘銀行數(shù)據(jù)價值、發(fā)揮元數(shù)據(jù)作為銀行數(shù)據(jù)信息地圖的重要作用,將分散在不同系統(tǒng)、不同工具、不同人員中的元數(shù)據(jù)信息進行統(tǒng)一管理,實現(xiàn)從業(yè)務(wù)層面到技術(shù)層面的全面貫通,對銀行業(yè)務(wù)的發(fā)展具有重大意義,是銀行數(shù)據(jù)規(guī)范和高效管理的重要支撐。
元數(shù)據(jù),英文名是Metadata,意指關(guān)于數(shù)據(jù)的數(shù)據(jù),即對數(shù)據(jù)的描述。早在20世紀(jì)末,元數(shù)據(jù)管理體系的概念和相關(guān)工具就已經(jīng)廣泛出現(xiàn),但由于當(dāng)時的數(shù)據(jù)規(guī)模還不夠大,而且元數(shù)據(jù)管理本身又包含了太多的內(nèi)容,以至于它一直未得到充分的重視。而在今天看來,元數(shù)據(jù)正在成為解決諸多數(shù)據(jù)問題時必須要抓住的一個“精髓”要素。
元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容等多項內(nèi)容,提供了對數(shù)據(jù)對象的描述、定位、管理、檢索、評估、選擇和交互等功能,是數(shù)據(jù)治理的重要基礎(chǔ)。元數(shù)據(jù)是數(shù)據(jù)對象的信息地圖,通過元數(shù)據(jù)管理,能夠準(zhǔn)確勾勒出銀行數(shù)據(jù)資產(chǎn)的整體視圖,支持科學(xué)地制定信息數(shù)據(jù)管理政策。通過元數(shù)據(jù)管理,也能夠建立統(tǒng)一的數(shù)據(jù)表達形式、元數(shù)據(jù)標(biāo)準(zhǔn),使數(shù)據(jù)可視化,方便數(shù)據(jù)的靈活交互和擴展。
當(dāng)前,我國銀行業(yè)在元數(shù)據(jù)管理及體系建設(shè)方面起點不一,發(fā)展程度也不一樣。根據(jù)IBM公司對元數(shù)據(jù)管理6個階段的劃分,結(jié)合我國銀行元數(shù)據(jù)管理發(fā)展情況來看,目前我國部分元數(shù)據(jù)管理較為成熟的銀行已發(fā)展到元數(shù)據(jù)集中管理和元模型驅(qū)動階段。