1. 住房和城鄉建設部科技與產業化發展中心;2. 珠海卓邦科技有限公司;3. 上海勘測設計研究院有限公司
摘要:當前我國智慧水務的發展由建設營收、GIS、SCADA 等MIS系統為主的業務數據化,逐步轉變為以數據治理和管理為主的數據業務化。目前,國內有很多水務企業啟動了數據治理和大數據中心建設項目。水務行業數字化轉型進入新的發展階段。本文結合國內水務企業開展水務系統數據管理面臨的挑戰和存在的主要問題,進行分析探討,提出城鎮水務系統數據管理體系構建模式,闡述數據管理的實施路徑和多場景應用價值。本文可為水務企業數字化建設和發展提供參考和借鑒。
關鍵詞:城鎮水務;智慧水務;數據管理體系;數據治理
當前我國正步入數字化發展新時期。習近平總書記指出,要充分發揮我國海量數據和豐富應用場景優勢,促進數字技術與實體經濟深度融合,賦能傳統產業轉型升級,催生新產業、新業態、新模式,不斷做強、做優、做大我國數字經濟。近年來,以數字技術為支撐、數據資源為關鍵要素的數字經濟蓬勃興起,正在成為重塑各國經濟競爭力和全球競爭格局的關鍵力量。數字經濟發展的核心,是要充分發揮數據作為新型生產要素的重要作用。
我國智慧水務發展正處于由“業務數據化”逐步轉為“數據業務化”的過渡階段。多數水司已經完成了水務系統信息化基礎建設、基于網絡和物聯感知的系統平臺建設,實現了建設營收、GIS、SCADA 等MIS系統為主的業務數據化,逐步轉變為以數據治理和管理為主的數據業務化。對于水務企業而言,水務系統的數字化發展可以提升水務管理的精細化,為智慧化發展奠定良好的基礎,提升水務企業社會服務能力,并成為未來市場競爭的核心基礎資源。經過近些年的發展,水務系統的大數據管理已經初步形成了一個較為完整的產業鏈,包括數據采集、整理、傳輸、存儲、分析、呈現和應用。眾多企業開始參與到大數據產業鏈中,并形成了一定的產業規模。水務企業也不斷加大數據收集、管理、應用的投入力度,逐步形成數據分析、數據診斷、數據決策的大數據發展生態。
1 城鎮水務系統數據管理面臨的挑戰
水務企業面向海量基礎數據,其工作重心逐步由“注重數據生產和收集”轉為“注重數據資源管理和數據資產化”。但是,在數據管理和應用過程中,很多企業面臨巨大挑戰,主要包括以下幾個方面:
(1)數據種類多。水務數據的來源多樣,包括了勘測、規劃、設計、施工、管理等多種渠道的數據源。同時,其形式多樣,包括了水務企業長期積累的結構化、半結構化數據和大量非結構化數據。一個公司的數據量級通常在數百TB或PB以上,并且隨著各工作環節和應用領域的信息化程度不斷增加、監測密度及指標不斷提升、數據增加速度不斷加快,數據量呈現持續高速增長態勢。
(2)數據質量差。水務企業的數據管理,數據質量差是一個非常嚴重的問題。水務企業大多已歷經十余年的信息化建設,系統中已存儲了海量數據,包括客戶信息、水表信息、歷史水量、水質、水壓數據等。其中一些系統數據年代久遠,標準化程度不高,改造成本大,給數據集成應用帶來很大困難。如果數據質量達不到要求,則會導致水務企業對業務管理的評估和預測不準確,甚至會導致整個系統決策失敗。
(3)數據標準不統一。水務信息化發展的初期階段,水務企業不同部門的信息化系統分散管理和無序開發,數據采集和管理難以在標準和規則層面達成一致,致使數據標準不統一,跨部門信息共享困難。且由于缺乏統一標準和數據關聯,大量的數據清洗依靠人為判斷,數據清洗難度大、風險高。另外,由于業務分散在多個部門,信息系統功能重疊,數據重復錄入,數據冗余問題嚴重,數據使用效率低下。
(4)決策支持作用不足。一些企業智慧水務建設由于缺乏頂層設計和總體部署,決策層、管理層和業務層等不同層級對數據管理缺少完整、統一的思路。智慧水務初期發展階段的系統平臺缺少有效的數據挖掘與分析功能,導致數據過于死板僵化,難以發揮數據對業務管理的追溯,無法對現在及未來的業務管理進行指導,對水務企業的業務管控和決策分析的支撐效果不明顯。
2 城鎮水務系統數據管理體系構建模式
城鎮水務系統數據管理體系是對水務企業海量數據進行管理的一種工作手段。通過數據管理體系的構建,可以匯聚城鎮水系統全過程、全要素的各個主題領域內的數據,形成統一集中的數據資源中心,并對數據資源進行有效治理和管理,同時充分利用大數據分析等技術,挖掘數據價值,服務于水務企業的管控、決策、生產、運營、客服等各個環節。
2.1 城鎮水務數據管理體系
城鎮水務數據管理體系主要包含數據抽取、數據存儲、數據挖掘、數據管理、數據可視化和智能算法六部分內容。
2.2.1 數據抽取
數據抽取是數據管理體系構建的重要一環,運用數據提取工具,從數據源抽取出所需的數據,經過數據處理,最終按照預先定義好的數據模型,將數據加載到大數據中心中去,從而實現以下功能:對不同來源不同種類的數據進行融合;針對數據進行清洗加工,形成主題庫;把數據分析能力作為服務提供給上層應用。
2.2.2 數據存儲
數據存儲建議采用分布式文件系統,相較于傳統的存儲方式,成本更低,且具備良好的擴展性、安全性和可靠性,能夠滿足數據平臺海量的存儲需求。大數據中心能夠將傳統的結構化數據存儲技術和非結構化數據存儲技術相結合,滿足數據存儲和處理的靈活性,實現對海量數據的存儲與計算分析。
2.2.3 數據挖掘
數據挖掘技術可提供多種監督和非監督學習算法,應用于結構化和非結構化數據,如聚類、主成分分析、線性和非線性回歸、邏輯回歸、分位數回歸、決策樹、隨機森林、梯度提升、神經網絡、支持向量機、因子分解機等。數據挖掘過程中,可通過圖論和網絡分析算法進行數據拓展,通過交互式界面進行模型創建。數據挖掘技術,能夠完成數據融合匯聚,通過數據挖掘建模和深度學習框架,讓系統具有“自己思考”能力,形成具有智慧決策的人工智能大腦。
2.2.4 數據管理
通過抽取、存儲和挖掘后的海量數據,需要通過科學的數據管理,使之能夠更好地服務于水務生產及業務決策。數據管理主要包括數據分類、數據服務和數據接口管理等。數據分類主要包括對元數據、主數據及不同類型數據交換的管理;數據服務是基于數據形態演變的一種信息技術驅動服務,包括數據采集、數據傳輸、數據存儲、數據處理(包括計算、分析、可視化等)、數據交換、數據銷毀等。數據接口管理可對數據接口進行定義、配置、查詢、授權等操作,管理所有的業務接口,實時增加或者刪減服務器,并對單個服務器的接口服務進行配置,向外提供優質的數據接口服務等。
2.2.5 數據可視化
數據可視化及交互技術,主要是利用二維、三維地圖引擎、時空分析引擎、圖文交互引擎等,實現人機交互界面的可視化。該技術通過有效融合計算機的計算能力和人的認知能力,獲得對于大規模復雜數據集的洞察力,從而實現多維數據管理、多維數據分析、多維數據展現等功能,為數據分析的實效性提供強有力的保證。
2.2.6 數據智能算法
基于大數據的人工智能技術,可對數據資源進行深層次的分析和挖掘,在智慧客服、故障診斷、工藝調控、設備管控等方面做出更準確的預測和判斷,輔助管理層進行科學決策。通過基礎算法庫、組合算法庫和定制算法庫等 AI 算法庫的建立,靈活運用多種類型智能算法,構建數據模型,如分區計量數據模型、管道泄漏定位模型、用水量實時預測模型、智能加藥模型等,加強工況預測、優化工藝調控,提高水務管理水平。
2.2 城鎮水務數據管理體系平臺架構
圖1 城鎮水務數據管理體系平臺架構圖
城鎮水務系統數據管理體系平臺,其功能為向下接入業務系統數據,向上對業務應用系統提供數據支持,中間為大數據中心核心能力支持。其架構主要包含數據接入層、數據加工層和數據服務層。其中,數據接入層負責從各業務系統及數據源頭接入數據,數據加工層負責對接入的數據進行數據治理及加工處理,數據服務層負責將加工好的數據提供給各應用系統。城鎮水務數據管理體系平臺架構圖,如圖 1 所示。
2.3 城鎮水務數據管理體系構建重點任務
為了做好對城鎮水務智慧管理系統的應的支撐,數據管理體系建設的重點任務主要包括:標準中心、應用中心、大數據中心、能力共享中心、物聯感知中心以及資源中心等六大板塊。其中,大數據中心作為核心組成部分,與其他各板塊有機緊密結合。標準中心確保大數據中心獲取規范統一的標準化數據;應用中心、能力中心和物聯感知中心分別向大數據中心提供應用系統、生產監測、事件等場景實時數據;大數據中心則向其他板塊提供統一的數據服務、主數據管理等功能。各板塊的邏輯關系,如圖 2 所示。
圖2 城鎮水務系統數據管理體系建設重點任務
3 城鎮水務系統數據管理體系建設實施路徑
科學的實施路徑是保障城鎮水務數據管理體系建設的必要條件。不同水務企業數據基礎不同,需求也有所差異。因此,水務企業在構建數據管理體系時,需要結合企業自身實際情況,進行頂層設計和系統部署。但是總體而言,數據管理體系的建設,需要注重摸現狀、理需求、繪藍圖、定設計、制標準、搭基座、治數據、建數倉、布應用、守運營這 10 項工作內容。
3.1 摸現狀
在前期廣泛開展業務現狀調研的基礎上,通過對業務模式加以分析,結合數據管理成熟度評價指標與評估模型,評估水務企業數據資產管理現狀。其中,數據管理成熟度評估可參考《數據管理能力成熟度評估模型》(GB/T 36073-2018)。評估內容主要包括數據戰略、數據治理、數據架構、數據標準、數據質量、數據安全、數據應用、數據生命周期管理等。通過對系統數據管理成熟度評估,評判企業數據管理能力水平,發現存在的主要問題,明確未來數據管理能力提升的路徑。
3.2 理需求
水務企業在數據管理體系構建過程中,面向眾多業務方向,需同時結合“自上而下”和“自下而上”的建設思路,理清業務架構,掌握業務痛點,確定業務范圍,明確建設程度。具體需要明確的內容包括數據范圍、硬件資源數量、數據標準數量、平臺集群規模、數據治理范圍、數據倉庫范圍、數據應用類型等。數據管理的核心是數據應用,這項工作是為業務管理進行服務的,也是數據管理體系建設工作獲得投資回報的最重要途徑。因此,其他數據建設內容都是在為數據應用提供支撐。
3.3 繪藍圖
數據管理體系建設是一項周期長、投入大、實施復雜的工程,需要進行全盤考慮,做好整體規劃設計。水務企業可以大數據中心建設為核心內容,在此基礎上,逐步建設管理管控業務平臺、營銷客服業務平臺、生產運營業務集成管理平臺等其他業務平臺。大數據平臺的建設,可實現對各條業務線的基礎數據、財務、人力、物資、資產設備等進行集中管控、統一授權,并通過直觀的展現方式,讓不同層級的管理人員得到不同的管控指標及管控信息。
3.4 定設計
在以上各項工作基礎上,數據管理體系建設的目標、要求和總體架構已經基本清晰明確。水務企業管理層和信息化技術人員共同商討,確定數據管理體系和大數據平臺的設計方案。方案可包含數據管理體系建設實施方案、大數據平臺規劃設計方案、數據倉庫構建模式,數據支撐業務范圍和內容,數據應用場景等等。設計方案和實施方案,是水務企業數據管理、數據治理、系統平臺開發等各項智慧水務建設的總體綱領,長期指導水務企業的數字化建設和管理工作。
3.5 制標準
水務企業在數據管理體系構建過程中,應該采納行業內部通識的數據標準,或建立企業自身的數據標準體系。數據標準一般包括基礎標準、業務體系標準、應用體系標準、數據資源標準、IT 基礎設施標準、信息安全標準、信息化管理標準和系統評價標準等。標準建設可促進智慧水務建設按照一定模式有序進行,對大量的看似無序的數據資源進行提前約定,從而消除數據孤島,并在一定程度上避免投資浪費,使數據資源具有可持續發展的生命力。
3.6 搭基座
采用成熟的商用大數據平臺軟件、主流的大數據技術手段或工具,如HDFS、HBase、Hive等,通過多模塊、多組件搭建大數據平臺,作為整個數據管理體系的基礎底座。數據存儲可采用基于分布式存儲方式,支持水平擴容,支持多種存儲數據類型。數據平臺提供結構化、半結構化、非結構化數據的存儲解決方案。前期架構設計應能夠實現數據整合、存儲、計算、分析等多種功能。在此基礎上配置數據質量管理、數據安全管理、數據資產管理、數據服務等模塊。另外,數據平臺基座也可借助云平臺進行靈活部署。云平臺的應用可有效應對突發狀況下計算能力不足的問題,保障數據管理系統安全穩定運行。
3.7 治數據
數據治理包括數據管控機制和管控手段兩大模塊。管控機制由管控組織、管控政策、管控流程及技術支撐四個方面組成。管控手段指實施數據治理所采取的技術手段,包括數據架構、主數據、數據標準、元數據、數據質量、數據安全等。數據治理主要是通過組織、管理、技術三者相互協作,提高數據質量,保證數據安全性、保密性、完整性和可用性,實現數據資源在各單位的共享,推進數據資源的整合、對接和共享,從而提升水務企業信息化水平。
3.8 建數倉
數據倉庫是指對各類數據資源進行集中、集成、共享、分析的場地。數據倉庫是數據中心的核心組成部分,具備數據抽取、轉換與加載能力,能夠高效地將前端業務分析所需的各類數據移動到數據倉庫內,根據預先制定的業務規則對數據進行處理轉換使其符合目標數據格式,并根據前端展現需求提供高性能數據加載機制。通過數據倉庫,幫助水務企業實現按業務主題進行數據集中存儲,完成對分散數據的集成整合工作,形成企業內部“唯一事實”。
3.9 布應用
智慧水務系統的應用場景包括安全保障、管理增效、優質服務、節能降耗、企業形象、管理創新、應急指揮、智能決策等多個方向,內容涉及水廠、管網、水環境、客戶服務等多個領域。智慧水務建設,應面向各類應用場景,基于大數據中心數據治理和管理,開展系統平臺建設。不同的應用系統平臺與大數據平臺進行深度數據交換,進行分析和模擬。平臺建設的出發點,要以數據驅動的精細化管理為目標,提升運營效率,預見潛在風險。
3.10 守運營
數據管理體系和大數據中心建設完成后,需要保持數據的持續更新,并確保數據的真實、穩定、準確、可用和高效,以實現數據資產價值最大化。在數據中心運營管理過程中,工作人員需定期檢查數據資產當前的狀態,尤其是數據質量和安全情況,如更新頻率、合規性、空值率等;同時,從數據采集到數據應用,對數據管理全過程進行監控,及時發現和排除故障,保障數據資產的穩定性。