中信銀(yín)行(xíng)非現(xiàn)場≠'(chǎng)審計(jì)系統DAP平台

系統概述

1) 系統定義與功能(néng)定位

系統定義:DAP(Data Analyse and®≤σ Process) 數(shù)據分(fēn)析和(hé✔♣)處理(lǐ)工(gōng)具集。

功能(néng)定位:

提供給使用(yòng)者進行(xíng)數 ↔±(shù)據分(fēn)析和(hé)處理("‌₹lǐ)的(de)工(gōng)具;

記錄使用(yòng)者使用(yòng)的(de)場(chǎng)景,可(kě)‍→≤♥針對(duì)場(chǎng)景進行(xíng)¶✔σ管理(lǐ)、重現(xiàn);

過程模型制(zhì)作(zuò),形成數(shù)據處理(lǐ)的(d ₹↕‍e)過程記錄文(wén)件(jiàn)(可(kě)作(zuò)為(wèi)數( ←λ‍shù)據分(fēn)析模型文(wén)件(jiàn),"&β∑針對(duì)批量數(shù)據批跑執行(xíng))。

系統框架

2) 數(shù)據場(chǎng)景

數(shù)據場(chǎng)景是(shì)∞♥↔®數(shù)據分(fēn)析人(rén)員(yuán)基于一(y ♠ ī)定的(de)特定業(yè)務場(chǎng)景,對(duì)♣ ↕一(yī)系列的(de)數(shù)據進行(xíng)的(de)一($≈✘£yī)系列分(fēn)析操作(zuò)以•σ及相(xiàng)應的(de)操作(zuò)結果,場(chǎng)景包含了(α∏le)特定的(de)數(shù)據和(hé)DAP功能₩‌(néng)使用(yòng)的(de)狀況。DAP場(chǎnφα←g)景可(kě)以被創建的(de)用(yòng)戶獨享,也(yě)被多(d↔₽uō)個(gè)用(yòng)戶共享,共同使用(yòng)。

以下(xià)羅列了(le)一(yī)些 ®σ>(xiē)DAP場(chǎng)景使用(yòng)的(de)例子(zǐ)±™∏δ:

ü 某個(gè)固定的(de)查詢過程可(kě)以在DAP上(shàng)定•₽σ←義一(yī)個(gè)場(chǎng)景,完成該查詢功能(n ¶éng)的(de)要(yào)求;

ü 一(yī)個(gè)審計(jì)項目可(kě)以定義一(yī)個(gè)•±DAP場(chǎng)景,将這(zhè)個(gè)♣•審計(jì)項目的(de)完整工(gōng)作(zuò)過程和(hé)成果保留∏π₽下(xià)來(lái);

ü 對(duì)一(yī)類業(yè)務可(kě)以定義一(yī)個(‍αφgè)DAP場(chǎng)景,将這(zhè)類業(yè)務常見(jiàn★δ)的(de)問(wèn)題探查過程固化(huà)下(xià)來(lΩσ$✔ái),提供給大(dà)家(jiā)共享;

ü 每個(gè)人(rén)可(kě)以按照(zhào)自(zì)己的(d εe)思路(lù)定義一(yī)個(gè)DAP場(chǎngΩ₹)景,組織自(zì)己關注的(de)問(wèn)題;

ü 建立一(yī)個(gè)所有(yǒu)數(shù)據都(dōu​₹♦)包含的(de)DAP場(chǎng)景,作(Ω≈♥÷zuò)為(wèi)數(shù)據全景,提供給用(yòng)∞§±γ戶進行(xíng)全面查詢;

3) 過程模型

過程模型即為(wèi)過程模型定義人(rén)員(yuán),處于一(yīσ≤)定的(de)業(yè)務目的(de),定≠♦義的(de)一(yī)個(gè)完整的(de)±$>數(shù)據分(fēn)析過程步驟,以得(de)到(d≠≈$φào)特定意義的(de)數(shù)據結果,這(zhè)樣一(yī×₹∏←)個(gè)分(fēn)析過程模型。一(yī)個↑↑'(gè)過程模型由操作(zuò)步驟鏈(命令鏈)和<↓→(hé)每個(gè)操作(zuò)步驟(過程命令)所需的(γ$εde)參數(shù)構成,每個(gè)操作(zuò)都(dōu)将↔Ω∞§生(shēng)成相(xiàng)應的(de)操作(zuòφ↓)結果表。

ü “命令鏈”中的(de)每個(gè)命令都(dōu)是(shì)D§₽β AP分(fēn)析功能(néng)工(gōng)具支持的(de)操作(zuòλΩ£®)。

ü “命令鏈”中的(de)每個(gè)DAP分(fēnπ ✔)析功能(néng)操作(zuò)需要(yào)讀(dú)取資料庫中的"&(de)參數(shù)定義。

ü “命令鏈”中的(de)命令按照(zhào)配置順序執行(xí×εng)。

ü 在處理(lǐ)過程中産生(shēng)的(de)DAP數(shù)據附屬于這(φπzhè)個(gè)DAP過程。

ü 每個(gè)DAP過程由外(wài)部程序調用¥π≠♥(yòng),例如(rú):通(tōng)過ETL總控調用(yòng)這∑≠≥(zhè)些(xiē)DAP過程。

4) 數(shù)據分(fēn)析工(gōng)具

數(shù)據分(fēn)析工(gōng)具是(shì)在數(s¶₽≥↓hù)據場(chǎng)景中或者過程模型制(zhì)作(zuò)中,所應用(y  ≠òng)的(de)一(yī)系列的(de)"₩♣≥數(shù)據分(fēn)析操作(zuò)工(g✔←÷≤ōng)具的(de)集合。對(duì)每個(gè)工(gōng)具都(dōu)©•α有(yǒu)确定的(de)參數(shù)定義要(≈∏yào)求,在對(duì)DAP分(fēn)析功能(néng)操作(zuò)過♥±程中,需要(yào)記錄數(shù)據類資料庫。

工(gōng)具按功能(néng)分(fēn)為(wèi)兩大(dà∞∑§)類:數(shù)據功能(néng)工(gōng)具‌δ'和(hé)分(fēn)析功能(néng)工(gōng)具。

ü 數(shù)據功能(néng)工(gōng)具:滿足 ☆§​用(yòng)戶對(duì)數(shù)據的(d×÷‍₽e)查看(kàn)功能(néng),在這(zh✘₹©✘è)些(xiē)功能(néng)中不(bù)産©♠ €生(shēng)DAP數(shù)據。例₹↑'λ如(rú):讀(dú)取、分(fēn)類顯示、圖表、數(→©¶shù)據發布、字段顯示設置等。

ü 分(fēn)析功能(néng)工(gōng)具:滿足用(yòng)♠ε戶對(duì)數(shù)據的(de)分(fēn)析功能(n ​§₽éng),在這(zhè)些(xiē)功能(néng)中将" ✔産生(shēng)DAP數(shù)據。例如(rú):提取、關聯、比較、分φ₹α(fēn)組彙總、合并、采樣、數(shù)據統計(jì)等。每個(gè)功​✔∑σ能(néng)都(dōu)産生(shēng)操作(zuò)結果的(↑λde)DAP數(shù)據表,前一(yī) ☆±步産生(shēng)的(de)DAP數(shù)據可(kě)以提供給其他( ∑tā)功能(néng)使用(yòng)。

在數(shù)據場(chǎng)景中的(de)操作(zuò),可(kě)以看(✘≠kàn)到(dào)整個(gè)數(shù)據分(fēn)析工(gōng)具集;在過程模型制(zhì∞ε&)作(zuò)中,因為(wèi)我們關注的(de♣∑εε)是(shì)模型執行(xíng)結果,而β§不(bù)關心中間(jiān)過程,所以在過程£¥✔模型制(zhì)作(zuò)時(shí),系統不λ♦(bù)提供針對(duì)數(shù)據查看(kàn)的(de)‍ β數(shù)據功能(néng)工(gōng)具,而隻提供分(fēn)析功λ★₹λ能(néng)工(gōng)具。

5) 功能(néng)組件(jiàn)

功能(néng)組件(jiàn)是(shì)在數(shù)據分(fēnδ‍£↓)析工(gōng)具之下(xià)的(de)♦Ω一(yī)些(xiē)具有(yǒu)公用(yòng)性質的(de)組件(jià×≥™'n),用(yòng)以支撐數(shù)據分(fēn)析工(gōng)具的(de)底層實現(xiàn)。

6) 模塊組件(jiàn)

模塊組件(jiàn)包含了(le)一(yī)些(xiē)在DAP使用(yòng)過程中的(de)一(yī)些(xiē)除了(δπle)數(shù)據分(fēn)析工(gōng)具之外(wài)的(de)協作σ☆(zuò)功能(néng)組件(jiànδ∏≥®),例如(rú)命令鏈引擎等。

7) 數(shù)據庫服務器(qì)

數(shù)據庫服務器(qì)是(shì)底層的(de)數(shù)據支撐±₽ 。數(shù)據分(fēn)析工(gōng)具都(dōu)是(shì)通(t×↓φōng)過存儲過程來(lái)操作(zuò)數(shù)$☆γ 據的(de);其餘一(yī)些(xiē)模塊功能(néng)則直接訪問(>→wèn)數(shù)據表來(lái)操作(zuò)數(shù)據。

8) 數(shù)據分(fēn)析員(yuán☆♣)和(hé)模型制(zhì)作(zuò)人♠←♣>(rén)員(yuán)

數(shù)據分(fēn)析員(yuán)和(hé)模型制(zhìα¶∞)作(zuò)人(rén)員(yuán)是(shì₹¥)DAP中的(de)兩個(gè)用(yòng)戶角色。數(shùβλ)據分(fēn)析員(yuán)主要(y↕★✘ào)針對(duì)數(shù)據場(chǎε₩ng)景工(gōng)作(zuò),進行(xín‍Ω↔g)數(shù)據操作(zuò)分(fēn)析;模型制(zh✔₹ì)作(zuò)人(rén)員(yuán)顧名思義,就(jiù)是(​<<shì)進行(xíng)過程模型的(de)制(zhγ ≈πì)作(zuò)。

數(shù)據分(fēn)析工(gōng)作(zuò)設計(jì)

分(fēn)析功能(néng)工(gōng)具

9) 數(shù)據提取(DataExtract

功能(néng)描述:按照(zhào)篩選條件(jiàn)提取數(shù)據§&表數(shù)據,并生(shēng)成新的(de)結果‌★"&表。本操作(zuò)是(shì)模型錄制(zhì)的(deφ​×<)入口操作(zuò)。

10) 字段維護(FieldMaintenance

功能(néng)描述:基于當前數(shù)據集(反映為§★ε♥(wèi)操作(zuò)的(de)上(shàng)下(xià)文(←>∑wén)環境),進行(xíng)字段維護§π γ,可(kě)以新增一(yī)個(gè)或者多(duβ® ō)個(gè)字段,指定這(zhè)些(xiē)字段的(de)表達式。

11) 數(shù)據關聯(DataJoin)

功能(néng)描述:将不(bù)同數(shù)據←•δ↔表按照(zhào)相(xiàng)同字段進行('&©xíng)關聯,把屬于不(bù)同表的(de)字段集中到(dào←±÷♣)同一(yī)個(gè)表中,從(cóng)而實現(xiàn)對(duì)✘®↑π兩張數(shù)據表中同一(yī)記錄的(de)不(bù)同字•‍​¶段的(de)關聯分(fēn)析,實現(xi₩®×±àn)兩個(gè)數(shù)據集之間(jiān)的(de)拼接。

12) 數(shù)據比較(DataCompare

功能(néng)描述:将不(bù)同數(shù)據表按照(zhào)關γ ↑聯字段進行(xíng)比較,統計(jì)出兩個(gè)表中各自(z®↔εì)關聯字段的(de)紀錄個(gè)數(shù)、統計(jì)字段的(de)πε₽總計(jì)值以及兩個(gè)表此統計(jì)字段的(de)差值<₩∏₹。

13) 分(fēn)組彙總(DateGroupSum

功能(néng)描述:按照(zhào)條件(jiàn)對(d•α÷uì)數(shù)據表數(shù)據進行(₹©xíng)分(fēn)組、彙總輸出。

14) 數(shù)據合并(DataUnion

功能(néng)描述:對(duì)多(duō)張數(shù)據表進行∏₩(xíng)合并操作(zuò),注意數(sh←€<ù)據表字段的(de)數(shù)量和(hé)類型需要(yào)相(xi♥≠ ♠àng)同。


15) 重複檢測(DataRepeatSelect

功能(néng)描述:按照(zhào)檢測字段♠♣‌φ将數(shù)據表的(de)所有(yǒu)重複數(s↕♠γhù)據/不(bù)重複數(shù)據輸出。

16) 數(shù)據排重(DataRepeatExclude

功能(néng)描述:按照(zhào)檢測字段将數(shù)據表的(de©•±)所有(yǒu)重複數(shù)據輸出,然後省略排除字≠→φ±段中包含重複數(shù)據的(de)記錄,使每§≠個(gè)排除字段值是(shì)唯一(yī)的(de)。

17) 等距采樣(SampleSpace

功能(néng)描述:從(cóng)總體(•¶tǐ)中選取一(yī)定數(shù)量的(de)樣本進行(xín'±g)測試,并根據測試結果推斷總體(tǐ)的(de)特征。

18)  取唯一(yī)值(DataDistince)

功能(néng)描述:去(qù)掉數(shù)據表中重複的(d★÷e)數(shù)據,保證輸出的(de)均是(shì)唯一(yī)的(de∞∑>σ)數(shù)據項。