金稅三期工程數據架構藍圖設計方案.ppt
《金稅三期工程數據架構藍圖設計方案.ppt》由會員分享,可在線閱讀,更多相關《金稅三期工程數據架構藍圖設計方案.ppt(99頁珍藏版)》請在裝配圖網上搜索。
1,金稅三期工程,數據架構藍圖設計方案V1.0,匯報人:總體規(guī)劃設計項目組,2,目錄,1、概述2、數據分布3、數據交換與共享4、元數據5、數據治理6、通用數據標準,3,數據架構的目標,以科學的信息資源觀和規(guī)劃理念,基于合理設計的應用系統(tǒng)的體系結構,并以信息利用能力為目標,構建全局化、規(guī)范、統(tǒng)一的數據架構,提高應用系統(tǒng)運行性能,提升稅收數據的分析利用價值,信息資源(InformationResources)與人、財、物資源一樣,都是企業(yè)的重要資源,,4,功能性:滿足當前應用的需要。靈活性:適應應用功能在一定范圍內的調整和擴展。長期性:業(yè)務數據一旦形成,保證在后續(xù)任意時段的可利用。前瞻性:為后續(xù)新業(yè)務提供支持。增值性:服務社會,服務國民經濟。,數據架構規(guī)劃原則,5,數據架構定位,6,架構規(guī)劃內容,,數據架構規(guī)劃的關鍵內容包括數據分類、數據邏輯分布、數據物理分布、數據共享交換、數據治理、數據標準,,,數據架構規(guī)劃內容,數據分類從多個角度包括業(yè)務、數據生命周期和數據本身特點對稅收產生的數據進行分類,從而分數據的分布夯實基礎;數據邏輯分布從邏輯的角度對業(yè)務環(huán)節(jié)產生的數據進行合理的規(guī)劃;數據物理分布基于邏輯分布和應用架構的劃分,從技術的角度對數據的落地進行詳細的規(guī)劃、分析和合理布局,支撐應用落地和解決全國大集中性能問題;數據交換共享從總局與外部,總局與省局,總局內部各部門間出發(fā),規(guī)劃數據交換共享的機制和內容數據治理從數據的生命周期管理、數據質量管理和數據安全三面進行規(guī)劃;數據標準簡單規(guī)劃數據標準內容體系;,,7,工作思路,8,現狀分析,,缺乏統(tǒng)一的規(guī)劃,多以迅速實現功能為主要目的,缺乏從全局的考慮,造成了數據孤島、多頭采集、業(yè)務數據分散、標準不一等問題。數據達不到全面性、規(guī)范性、一致性的要求,降低了內部管理的效率,不能為決策分析提供嚴謹、全面、細致的數據基礎;數據的實時監(jiān)控能力不強,缺乏掌握全面、及時信息的渠道,無法滿足“信息管稅”的業(yè)務發(fā)展趨勢,缺少對全國數據的高效利用、業(yè)務集成度要求不斷提高的支持。,9,數據架構的需求,,全國國地稅稅收生產數據在總局集中存儲和處理,生產數據的第一次落地點在總局。滿足應用系統(tǒng)間的松耦合性,實現應用系統(tǒng)間的故障隔離。建立數據共享、交換的機制,明確數據內容,保障數據的時效性。建立數據全生命周期管理機制,保證系統(tǒng)持續(xù)穩(wěn)定高效地運行。建立完備的數據倉庫體系,為面向管理決策的應用奠定基礎。,10,目錄,1、概述2、數據分布3、數據交換與共享4、元數據5、數據治理6、通用數據標準,11,目錄,數據分布數據分類數據分布內容典型場景,,12,按業(yè)務環(huán)節(jié)進行分類,數據分類方式,,數據分類,稅務數據分類就是滿足各種數據對數據組織的要求,并獨立于具體的數據模型和數據分布,按生命周期進行分類,按數據結構進行分類,13,舉例:按業(yè)務環(huán)節(jié)進行分類,14,舉例:按生命周期進行分類,15,舉例:按數據結構進行分類,16,目錄,數據分布數據分類數據分布內容典型場景,,17,分析應用系統(tǒng)劃分、各個應用系統(tǒng)的特性分析應用系統(tǒng)之間的數據關系結合數據分類,將數據劃為不同的數據存儲集合,形成數據的合理分布架構,數據分布,,數據分布,,,,,,數據的物理分布,數據的邏輯分布,,18,數據邏輯分布原則,當期數據與歷史數據分離操作數據與查詢數據分離,減少生產系統(tǒng)壓力生產數據與分析數據按不同的數據組織方式分離體現數據的生命周期管理需求:數據的產生、數據的采集、數據的加工,數據的利用和數據的歸檔幾個階段,19,數據邏輯分布框架圖,20,數據邏輯分布框架圖,記錄當期業(yè)務活動發(fā)生過程和結果的數據,包括與當期操作數據的同構但保留更長時間的數據、實時查詢統(tǒng)計和報表所需輔助數據、稅源管理數據、按各省清分后的數據,通過影像設備采集的各類文書憑證的影像信息和在業(yè)務環(huán)節(jié)中采集或生成的原始業(yè)務憑證資料電子明細信息,具有高業(yè)務價值、跨各業(yè)務域被共享使用的核心數據,面向業(yè)務主題、集成的、歷史的細粒度數據,面向管理決策分析主題、集成的、歷史的、按多個維度深度加工的數據,包括在線操作歷史數據、脫機存放的歷史數據,描述流程、信息和對象的數據,涉及數據的技術屬性、業(yè)務定義以及操作特征,21,術語說明,生產數據:當期操作數據:記錄當期業(yè)務活動發(fā)生過程和結果的數據;近期操作數據:包括與當期操作數據同構但保留更長時間的數據、實時查詢統(tǒng)計和報表所需輔助數據、稅源管理數據、按各省清分后的數據;主數據:具有高業(yè)務價值、跨各業(yè)務域被共享使用的核心數據;憑證數據:在業(yè)務環(huán)節(jié)中采集或生成的原始業(yè)務憑證資料電子明細信息;影像數據:通過影像設備采集的各類文書憑證的影像信息;分析型數據:統(tǒng)一視圖:面向業(yè)務主題、集成的、歷史的細粒度數據;管理決策分析數據:面向管理決策分析主題、集成的、歷史的、按多個維度深度加工的數據;歷史數據:包括在線操作歷史數據、脫機存放的歷史數據;元數據:描述數據的數據,即描述流程、信息和對象的數據。涉及數據的技術屬性、業(yè)務定義以及操作特征,22,數據邏輯分布圖,23,邏輯分布數據內容描述,24,數據物理分布原則,生產數據和分析數據分離結構化數據和非結構化數據分離不同生命周期的數據分別存放數據大集中的性能分擔降低當期交易數據庫的數據量根據業(yè)務內聚性,同一業(yè)務域的數據盡量放在同一庫中滿足業(yè)務操作的同時,平衡數據查詢的代價在分的同時,平衡數據交換和共享的代價在合的同時,平衡應用分包管理的復雜度,25,物理分布設計的關注點,,數據的生命周期,與各層的對應如何保障申報征收/發(fā)票業(yè)務的效率,滿足高并發(fā)性查詢效率如何解決在數據共享和交換時,如何保證業(yè)務的連續(xù)性,解決應用系統(tǒng)間的故障隔離問題如何解決省局決策分析和其他增值業(yè)務的數據獲取、使用的問題。與數據模型、數據標準的關系,支持度如何關鍵點的技術考慮,產品選型的風險,26,數據物理分布總圖,,,ETL,27,數據物理分布總圖,,,,,,,,,,,,28,數據物理分布總圖,,,,,,,,,,,29,數據物理分布總圖,,,,,,,30,數據物理分布總圖,,,主數據管理,31,主數據管理內容,稅務主數據是指納稅人基本信息、納稅人公共狀態(tài)信息等稅務核心業(yè)務實體的數據,這些信息一般被多個應用系統(tǒng)共享使用。借鑒應用劃分的U/C矩陣方法,以征管業(yè)務操作平臺為例,如下表所示:,通過上面的分析我們得出,金稅三期主數據為:納稅人基本信息:納稅人識別號、納稅人名稱、登記注冊類型等;納稅人基礎狀態(tài)信息:納稅人登記狀態(tài)、增值稅一般納稅人資格、納稅人信用等級、防偽稅控納稅人資格、出口退稅納稅人資格、是否具有其它資格、定期定額征收、減免優(yōu)惠標志、稽查案件未結、違法違章未處理等;代碼,32,主數據管理方案,33,數據物理分布-核心生產庫說明,,,34,數據物理分布-核心生產庫說明,,,,35,數據物理分布-核心生產庫說明,,,,36,數據物理分布-核心生產庫說明,,,,37,數據物理分布-核心生產庫說明,,,,38,征管生產數據庫群(一),屬前臺生產數據,通過各種渠道從納稅人處采集,包括相關流程數據,覆蓋稅務登記、認定、優(yōu)惠、申報、征收、發(fā)票內外部管理、個稅等業(yè)務環(huán)節(jié);業(yè)務環(huán)節(jié)中產生的各類憑證,獨立存儲在憑證庫中;面向增、刪、改類型操作,特點為數據量大,增長快,交易并發(fā)量高,訪問更新頻繁,事務小,需要實時響應;支持納稅人管理、申報征收、發(fā)票管理應用;申報征收庫當前設計是一個庫,后續(xù)將根據大集中試運行后的性能狀況決定是否按區(qū)域分庫,最小單位為省。,,39,征管生產數據庫群(二),后臺生產數據,主要由稅務人員在處理風險類業(yè)務時采集,以流程類數據為主,覆蓋評估審計、納稅人信用等級、稽查、法制等業(yè)務環(huán)節(jié);業(yè)務環(huán)節(jié)中產生的各類憑證,獨立存儲在憑證庫中;面向增、刪、改類型操作,特點為數據量小,增長緩慢,訪問更新頻度低;支持納稅評估、稽查、法制應用;,,,,40,征管應用數據庫群(三),以會計賬務數據為主,數據量很大,增長快,訪問更新頻度低;業(yè)務環(huán)節(jié)中產生的各類憑證,獨立存儲在憑證庫中;支持稅收會計核算應用;,,41,存儲的數據包括:同征管操作數據保持同結構、保留時間較長的數據,征管操作數據實時復制而得稅源管理數據實時查詢輔助數據,如報表基礎數據、統(tǒng)計基礎數據等按省局清分的數據分擔操作數據庫的查詢、統(tǒng)計業(yè)務,減少操作型數據庫壓力實時性要求不高的定制報表實時跨系統(tǒng)查詢統(tǒng)計應用系統(tǒng)和跨系統(tǒng)大數據量的批量計算,近期征管操作數據庫,42,征管操作-憑證處理,憑證是進行稅務活動時需要使用或產生的各類單證信息憑證信息分為后續(xù)稅務活動需要頻繁訪問的關鍵業(yè)務數據和使用頻度低的其它數據關鍵業(yè)務數據以結構化進行存儲,同時全部憑證信息以XML格式存儲在憑證庫憑證庫中的信息需要定時抽取到近期操作數據庫中,并解析為結構化數據近期操作數據庫中的結構化憑證數據定時抽取到統(tǒng)一視圖,43,數據物理分布總圖-分析型數據說明,,,,,,44,,分析主題,納稅人分布主題,申報征收主題,企業(yè)經營主題,案件稽查主題,公共維度,主題私有維度,,N+X+Y個月的統(tǒng)一視圖,,星型模型,外部信息交換數據,管理決策數據倉庫,生產數據,,X+Y個月征管應用數據庫,影像憑證資料庫,,網絡發(fā)票數據庫,各渠道應用數據庫,省級遺留系統(tǒng)系統(tǒng)數據庫,,法人數據,管理認定數據,發(fā)票業(yè)務數據,違法違章數據,信用評定數據,申報繳款數據,風險評估數據,,自然人數據,基本信息數據,家庭關系數據,財產數據,信用評定數據,收入數據,風險評估數據,經營信息,,稅務機關,納稅人分布,稅收收入分布,出口退稅,重點稅源,一般納稅人情況,比對信息,,,數據字典,業(yè)務指標字典,分析維度字典,ETL流程數據,數據生命周期數據,指標/維度映射數據,元數據,政策數據,法規(guī)數據,業(yè)務經驗數據,,業(yè)務指標數據,分析算法數據,標準數據,挖掘算法數據,,,,財產,,,財產內容,財產分布,財產流動,,發(fā)票,系統(tǒng)管理,外部信息,發(fā)票生命周期,發(fā)票票面信息,發(fā)票加密信息,知識庫,總局分析型數據,查詢統(tǒng)計,管理決策數據集市(共享數據邏輯匯總+應用個性數據),征管狀況分析,報表管理,績效管理,風險管理,政策管理,知識管理,45,管理決策數據與應用架構關系,整體設計思想基礎數據共享,一數多用,以數據規(guī)劃視角,物理集中存儲在統(tǒng)一視圖和數據倉庫中;應用的個性化數據,物理單獨存放在數據集市中,并且用邏輯視圖匯總應用所需基礎共享數據;,,46,,,查詢統(tǒng)計邏輯視圖,自然人視圖,法人視圖,稅務機關視圖,決策應用與決策數據的對應,,征管狀況分析邏輯視圖,稅務機關視圖,數據倉庫分析主題,,報表管理邏輯視圖,稅務機關視圖,,績效管理邏輯視圖,系統(tǒng)管理視圖,數據倉庫績效模型,,風險管理邏輯視圖,數據倉庫風險模型,法人視圖,稅務機關視圖,稅務機關視圖,,邏輯視圖,自然視圖,,邏輯視圖,系統(tǒng)產生數據,,數據倉庫風險模型,知識庫視圖,業(yè)務規(guī)則模型,,政策管理邏輯視圖,邏輯視圖,,知識庫視圖,,知識管理邏輯視圖,視圖深加工產生數據,系統(tǒng)產生數據,視圖深加工產生數據,系統(tǒng)產生數據,視圖深加工產生數據,系統(tǒng)產生數據,視圖深加工產生數據,數據倉庫標準數據,數據倉庫其他業(yè)務模型,數據集市的數據內容,47,關注焦點問題-查詢,48,應用邏輯架構,49,數據物理分布與應用的對應,,,50,數據物理分布與應用的對應,,,行政辦公平臺,征管業(yè)務處理平臺納稅人管理、個人明細管理、申報征收發(fā)票管理、核算、評估審計、稽查、法制,外部統(tǒng)一交換,納稅服務平臺、統(tǒng)一門戶,,,管理決策平臺,,51,渠道數據庫與子系統(tǒng)對應關系,數據庫,子系統(tǒng),52,生產數據庫與子系統(tǒng)對應關系,數據庫,子系統(tǒng),53,目錄,數據分布數據分類數據分布內容關鍵流程,,54,關鍵流程-稅務登記,55,關鍵流程-涉稅審批,56,關鍵流程-記帳,57,關鍵流程,58,關鍵流程,59,關鍵流程,60,關鍵流程-憑證,61,目錄,1、概述2、數據分布3、數據交換與共享4、元數據5、數據治理6、通用數據標準,62,數據交換與共享策略,主數據共享采取推送(訂閱)方式,保持數據的實時性、一致性;征管核心數據庫間共享采取推送(訂閱)或服務調用方式,對于交互頻繁、數據量大的采取推送方式(采用數據庫復制技術),對于數據量較小的采取服務方式。從生產數據采取ETL方式抽取到統(tǒng)一視圖中總局到省局數據下發(fā)(主數據除外)建議采取ETL方式,63,數據交換與共享示意圖,64,數據物理分布總圖-核心庫間數據關系,,,,,,,,,,核心交易庫的數據共享,65,數據物理分布總圖-核心庫間數據關系,,,,,,,,,,核心交易庫的數據共享,66,數據物理分布總圖-核心庫間數據關系,,,,,,,,,,核心交易庫的數據共享,67,總局數據交換與共享概覽,68,外部門統(tǒng)一交換,外部門統(tǒng)一交換實現稅務機關和其他政府部門之間實現數據共享和數據交換。主要包括財政、銀行、國庫、工商、技監(jiān)、海關、外匯管理、公安、統(tǒng)計、勞動和社會保障、郵政、民政、國土管理、房產、法院等政府部門。兩級交換:總局一級和省局一級。系統(tǒng)包括:外部信息交換系統(tǒng)和稅庫銀系統(tǒng)。,69,外部門統(tǒng)一交換,基于消息中間件的數據傳輸,70,稅庫銀(稅銀),71,外部信息交換,72,總局與省局,數據下發(fā)(總局到各?。┛偩窒掳l(fā)支撐生產數據總局下發(fā)支撐決策數據數據集中(各省到總局)省局遺留系統(tǒng)數據和自有系統(tǒng)數據(如果總局需要)省局交換的第三方數據(如果總局需要),73,征管數據清分下發(fā),74,主數據清分下發(fā),主數據:代碼、納稅人基本信息、納稅人基本狀態(tài),75,總局與省局,76,總局與省局,77,總局一級,征管數據庫群之間:征管操作數據庫群之間;操作數據庫與鏡像庫之間操作型與分析型之間:當期操作數據庫、近期操作數據庫、統(tǒng)一視圖、數據倉庫、數據集市之間內部系統(tǒng)與渠道之間:內部系統(tǒng)與內外部渠道系統(tǒng)(網上辦稅廳、網站)之間,78,征管數據庫群之間,79,內部系統(tǒng)與渠道之間,80,總局操作型與分析型之間,81,交換實現手段總結,82,目錄,1、概述2、數據分布3、數據交換與共享4、元數據5、數據治理6、通用數據標準,83,元數據管理,84,元數據管理方案,85,元數據管理實施策略,金稅三期項目實施中,元數據管理涉及從數據抽取到數據展示的整個過程,是金稅三期方案實施過程中十分重要的一環(huán)。本方案將在源系統(tǒng)、ETL、數據倉庫、前端展現幾個方面進行元數據管理,建議實現策略是:從分散管理向集中管理逐步過渡。在分散管理階段,ETL過程主要通過ETL工具進行元數據管理。在數據倉庫環(huán)境中,通過數據字典、倉庫建模工具(可以提供更高層的與特定業(yè)務相關的語義)和ETL工具進行元數據管理。在前端展現部分,通過前端展現工具進行元數據管理。在集中管理階段,通過建立標準的元數據交換格式,采用專門的元數據管理工具,實現元數據的集成管理。,根據金稅三期大集中的戰(zhàn)略,金稅三期元數據管理最終實現集中式管理。,根據金稅三期大集中的戰(zhàn)略,金稅三期元數據管理最終實現集中式管理。,86,目錄,1、概述2、數據分布3、數據交換與共享4、元數據5、數據治理6、通用數據標準,87,數據生命周期管理實施方法,,,88,數據生命周期管理分類與分層管理,89,數據生命周期管理分類與分層管理,90,數據生命周期管理分類與分層管理,91,數據質量管理規(guī)劃與框架,數據質量管理是一個沒有終點的過程,它是一個持續(xù)的,不斷改善的從數據質量管理規(guī)劃階段到數據質量審計及改進形成的數據質量管理的閉環(huán)過程。,針對數據質量現狀,在數據質量管理上,規(guī)劃事前預防、事中監(jiān)測和控制、事后補救和改進的管理策略,規(guī)劃數據質量管理框架,92,數據質量管理過程(模型),93,數據質量管理方案設計原則,94,數據質量管理方案,1、分析源數據,從業(yè)務和數據本身的角度剖析,包括對數據源中存儲的邏輯定義,表、視圖結構定義,約束,觸發(fā)器,唯一性等等,得出相關的定義。由定義以及定義的關聯(lián)產生相應的檢驗規(guī)則2、檢驗對象管理利用這些產出的規(guī)則,對源數據和目標數據進行校驗,并對應校驗規(guī)則保存校驗結果;3、在數據質量管理中,需要對數據檢驗結果和修正結果進行分析,利用校驗結果發(fā)現數據源和數據流程中存在的問題,同時可以參考修正記錄,對數據的質量提出適當的改進策略,并采取適當的行為。,95,數據質量管理方案關鍵指標設計,96,數據安全,97,目錄,1、概述2、數據分布3、數據交換與共享4、元數據5、數據治理6、通用數據標準,98,通用數據標準,99,99,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 金稅三期 工程 數據 架構 藍圖 設計方案
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.820124.com/p-3736125.html