基礎數據是智慧園區的基礎,基于基礎數據的分析、處理及整合,可以協調不同業務、不同領域、不同部門之間的業務處理,實現園區資源的綜合利用,在大數據技術領域,主要目的是圍繞打造信息優勢并向決策優勢轉換的發展目標,通過突破高效、穩定、易用、安全的大數據分析處理技術,解決當前數據資源利用單一、分析挖掘手段缺乏、智能化輔助能力低的問題,為智慧園區建設提供支撐。大數據關鍵技術的能力將瞄準在平臺運算處理能力和對業務的支撐,優化、提升平臺存儲和運算能力,進一步對跨系統及各類數據進行整合,提升數據分區二次存儲能力,滿足數據支撐不同類型的業務需要。對行業業務數據進行積累和沉淀,形成可復用算法庫。因此,基于大數據平臺的分析、處理及融合的相關技術是解決支撐平臺能夠智能運行的關鍵。
1、海量數據存儲技術
針對不同應用場景滿足海量數據存儲管理需求,提供異構數據統一管理,支持關系數據庫、分布式文件系統、分布式數據庫、圖數據庫的數據存儲。
2、多種計算模式的海量數據并行計算技術
針對不同數據處理需求特征,提供涵蓋批量計算、流式計算、圖計算多種計算模式,為大規模數據高效挖掘分析提供計算支撐。提供批處理計算框架、流處理計算框架、圖計算框架等計算引擎,并對集群的大規模計算資源進行統一管理。
3、大數據挖掘引擎技術
實現大數據挖掘平臺技術,為業務分析人員提供圖形化大數據挖掘算法運行、監控功能以及圖形化大數據挖掘流程構建與運行功能;為分布式開發人員提供大數據挖掘算法開發基礎軟件環境以及工具庫;提供大數據挖掘算法、流程管理功能,集成Mahout、MLib開源分布式挖掘算法,支持分布式挖掘算法注冊與搜索。
4、大數據交互式分析技術
實現海量數據交互式內容分析,一方面提供交互式數據操作接口,支持select、join、insert、union、avg、group等典型SQL操作;另一方面封裝數據分析典型需求,支持全局有序數據重組、數據統計、數據抽樣等一鍵式數據分析。降低數據分析人員的分析復雜度,提升數據內容分析效率。