在互聯(lián)網(wǎng)、大數(shù)據(jù)及云計算技術(shù)迅猛發(fā)展的當(dāng)下,保險行業(yè)作為金融領(lǐng)域的重要成員,面臨著如何拓展渠道、及時轉(zhuǎn)變方向、如何快速創(chuàng)新等問題。改革、改良現(xiàn)有的經(jīng)營管理方式、信息系統(tǒng)構(gòu)建、數(shù)據(jù)整合分析手段等,是目前保險行業(yè)重點探索的業(yè)務(wù)提升、創(chuàng)新落地的方向。
作為數(shù)據(jù)整合及處理的核心──數(shù)據(jù)倉庫,既承擔(dān)著與保險核心系統(tǒng)及其他各個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)ETL功能,又承擔(dān)著整合數(shù)據(jù)、分析挖掘數(shù)據(jù)等重要的數(shù)據(jù)處理功能,在當(dāng)下時效性要求越來越高、數(shù)據(jù)需求變化越來越快、數(shù)據(jù)容量越來越龐大的多變形式下,傳統(tǒng)的數(shù)據(jù)倉庫技術(shù)架構(gòu)已經(jīng)無法滿足新的需求,迫切需要新一代的數(shù)據(jù)倉庫解決方案。
保險業(yè)新一代的數(shù)據(jù)倉庫采用大數(shù)據(jù)平臺(Hadoop)+分布式數(shù)據(jù)庫(MPP)的混合式架構(gòu),包括了數(shù)據(jù)采集層、大數(shù)據(jù)存儲及處理層、大數(shù)據(jù)挖掘及展示層、大數(shù)據(jù)應(yīng)用層、大數(shù)據(jù)管控中心、運營及管理中心等。無論是結(jié)構(gòu)化還是非結(jié)構(gòu)化數(shù)據(jù),都可以經(jīng)由平臺進(jìn)行實時、非實時采集,使用分布式文件系統(tǒng)存儲,運用基于離線、內(nèi)存、實時流等不同計算引擎進(jìn)行處理、運算、挖掘,最終實現(xiàn)數(shù)據(jù)價值的可視化及不同應(yīng)用場景的數(shù)據(jù)支撐。
新一代數(shù)據(jù)倉庫解決了傳統(tǒng)數(shù)據(jù)倉庫無法滿足的實時流式數(shù)據(jù)處理、非結(jié)構(gòu)化數(shù)據(jù)處理、海量數(shù)據(jù)計算查詢效率過低、數(shù)據(jù)無法全時在線、擴(kuò)容成本偏高等技術(shù)及成本問題,全面應(yīng)對了新需求:
1. 數(shù)據(jù)ETL過程加速
從源系統(tǒng)的數(shù)據(jù)采集開始,運用分布式、高性能、高可靠的多種技術(shù)組件進(jìn)行數(shù)據(jù)ETL,讓源系統(tǒng)的業(yè)務(wù)數(shù)據(jù)變化以實時、準(zhǔn)實時的方式盡快反饋到數(shù)據(jù)倉庫中;
2. 數(shù)據(jù)整合及加工高效
使用分布式內(nèi)存計算等手段,輕松應(yīng)對海量數(shù)據(jù)的整合及處理,提升應(yīng)用層的客戶體驗,提升決策支持的時效性;
3. 數(shù)據(jù)實時處理
面對應(yīng)用系統(tǒng)產(chǎn)生的大量實時數(shù)據(jù),使用實時流式數(shù)據(jù)處理技術(shù),在毫秒級、秒級時間內(nèi)完成數(shù)據(jù)計算,實時生成結(jié)果,快速響應(yīng)外部需求變化;
4. 數(shù)據(jù)減負(fù),保護(hù)投資
新一代數(shù)倉技術(shù)可以很好地降低企業(yè)既有老數(shù)倉的負(fù)載,分離數(shù)據(jù),保證不同價值數(shù)據(jù)的存儲及流轉(zhuǎn),保護(hù)企業(yè)的原始投資。
為了更好的體驗,請使用豎屏瀏覽