亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        智慧城市大數(shù)據(jù)系統(tǒng)設計及實現(xiàn)

        2020-04-21 09:29:26
        廣東通信技術 2020年3期
        關鍵詞:數(shù)據(jù)系統(tǒng)數(shù)據(jù)挖掘子系統(tǒng)

        當前,“城市病”問題日益突出。智慧城市從概念提出到落地實踐至今,據(jù)不完全統(tǒng)計,中國95%的副省級城市、89%的地級城市,總計至少超過500個城市,在政府工作計劃中提出建設智慧城市[1]。

        智慧城市被公認是治療“城市病”的最佳途徑[2]。但在實際建設中發(fā)現(xiàn),智慧城市建設具有長期性、間接性、復雜性等特點,城市內(nèi)各組織和部門內(nèi)部存在著多種彼此孤立的應用系統(tǒng),系統(tǒng)之間信息無法實現(xiàn)共享,系統(tǒng)中可復用的功能被重復建設,數(shù)據(jù)一致性也無法得到保證,使得應用系統(tǒng)成為一個個“信息孤島”。

        針對智慧城市建設中普遍存在的跨單位,跨系統(tǒng)的異構數(shù)據(jù)共享及交換的業(yè)務場景,傳統(tǒng)的點對點數(shù)據(jù)通訊方式不能滿足安全性,靈活性、可擴展性等方面的要求,需要建立一個高度靈活、快速響應、共享協(xié)同、資源集中的數(shù)據(jù)共享和交互的大數(shù)據(jù)系統(tǒng),滿足信息共享和協(xié)同,支持不斷演進的智慧城市迭代。

        1 需求分析

        1.1 數(shù)據(jù):共享交換需求

        數(shù)據(jù)對于城市的價值已經(jīng)不言而喻。隨著城市信息化建設的不斷發(fā)展,數(shù)據(jù)越來越多,如何建立信息資源采集、處理、交換、共享、運營和服務的機制和規(guī)程,實現(xiàn)分布在各業(yè)務部門的信息資源的有效采集、交換、共享和應用,是智慧城市建設的關鍵任務。

        因此,迫切需要建設基于大數(shù)據(jù)技術的信息共享與交換機制,通過建設數(shù)據(jù)共享交換平臺實現(xiàn)城市內(nèi)部的信息交換與共享,讓信息資源得到充分的開發(fā)和利用,提高城市的整體信息化水平。

        1.2 應用:決策分析需求

        數(shù)據(jù)整合共享只是手段,數(shù)據(jù)分析服務才是目的。依托于大數(shù)據(jù)系統(tǒng),有效整合政府各部門所掌握的全市經(jīng)濟社會信息資源,充分融合物聯(lián)網(wǎng)和互聯(lián)網(wǎng)等城市數(shù)據(jù),提升政府形勢分析預測水平,給政府在進行發(fā)展規(guī)劃、投資布局、資源環(huán)境、管理創(chuàng)新等業(yè)務提供有力支撐[2]。

        當前在眾多組織單位被廣泛采用的仍然是人工分析的方法,這種人工分析的方法針對目前一些信息處理的現(xiàn)狀,往往面臨很大的挑戰(zhàn)。例如分析的數(shù)據(jù)和信息通常分布在許多不同的數(shù)據(jù)源,信息量大且缺少關聯(lián)性,并且人工的分析手段通常被看作是一種特殊的專業(yè)技能,很難在一個大的組織中進行經(jīng)驗的共享和傳遞,因而存在一定的局限性。

        因此,便捷、高效的情報可視化關聯(lián)分析平臺將在決策中發(fā)揮重大作用,將已有的信息化業(yè)務系統(tǒng)中的各類數(shù)據(jù)以圖形的方式展現(xiàn)出來,通過圖形方式對數(shù)據(jù)與數(shù)據(jù)間的關聯(lián)進行描述和展現(xiàn),更進一步地,運用眾多圖形分析的方法(關聯(lián)分析、網(wǎng)絡分析、路徑分析、時間序列分析、空間分析等)來發(fā)現(xiàn)和揭示數(shù)據(jù)中隱含的公共要素和關聯(lián),幫助各部門、各人員將大量的、未知質(zhì)量的、低關聯(lián)性的、低價值的信息轉(zhuǎn)化為少量的、易于理解的、高關聯(lián)性的、高價值的可操作的情報,從而為分析調(diào)查工作提供幫助。

        1.3 設計:前瞻性需求

        大數(shù)據(jù)系統(tǒng)建設內(nèi)容并非一成不變,而是隨著現(xiàn)代城市管理業(yè)務、信息技術的發(fā)展和相關國際標準、國家標準、行業(yè)標準的不斷完善而進行充實和更新,可以在應用中不斷由用戶補充和更新功能,具備良好的與其他系統(tǒng)的數(shù)據(jù)交換和功能兼容能力,具備統(tǒng)一的軟件和數(shù)據(jù)接口,為后續(xù)系統(tǒng)的開發(fā)留余地。

        系統(tǒng)應全面支持XML、SOAP、Web Service、LDAP、UDDI等當前受到普遍支持的開放標準,系統(tǒng)支持異構數(shù)據(jù)庫之間數(shù)據(jù)交換和共享,支持主流關系型數(shù)據(jù)庫,支持不同操作系統(tǒng)之間信息交換應用的互聯(lián)互通。系統(tǒng)應能滿足今后人口基礎庫、跨部門協(xié)同辦公等其他應用建設對信息共享和整合的需要。

        2 方案設計及實現(xiàn)

        國內(nèi)各地智慧城市建設各有差異,但是大數(shù)據(jù)系統(tǒng)都占據(jù)重要地位[3]。圖1是典型的智慧城市總體框架,其中平臺層屬于智慧城市的主要建設范疇,平臺層是集數(shù)據(jù)交換、信息存儲、大數(shù)據(jù)分析挖掘的綜合中心。

        圖1 典型的智慧城市框架圖

        平臺層包括兩部分:

        (1)大數(shù)據(jù)系統(tǒng),是一個高速、安全、可靠、互聯(lián)互通的支撐平臺,實現(xiàn)相關部門業(yè)務之間的相互通信,采集、處理及存儲分散在各部門的相關數(shù)據(jù),形成基礎數(shù)據(jù)庫、業(yè)務數(shù)據(jù)庫和分析數(shù)據(jù)庫,實現(xiàn)信息共享與交換,并通過智慧挖掘和分析海量數(shù)據(jù),為上層業(yè)務提供決策支撐關鍵數(shù)據(jù)。

        (2)云數(shù)據(jù)中心,建有基礎架構云,目前通常采用服務器虛擬化、數(shù)據(jù)庫高可用集群、存儲虛擬化、網(wǎng)絡虛擬化和網(wǎng)絡負載均衡等技術,使軟硬件資源得到共享和最大化利用,根據(jù)需要提供云基礎設施服務等。

        本文重點針對大數(shù)據(jù)系統(tǒng)部分的設計及實現(xiàn)進行介紹。

        3.1 大數(shù)據(jù)系統(tǒng)組成

        大數(shù)據(jù)系統(tǒng)包括數(shù)據(jù)共享交換子系統(tǒng)、城市基礎數(shù)據(jù)庫子系統(tǒng)、大數(shù)據(jù)挖掘分析子系統(tǒng)。

        數(shù)據(jù)共享交換子系統(tǒng):負責對外提供的各類共享數(shù)據(jù)的存儲和共享管理;

        城市基礎數(shù)據(jù)庫子系統(tǒng):負責存儲和管理外部系統(tǒng)及相關基礎數(shù)據(jù)的收集及信息管理;

        大數(shù)據(jù)挖掘分析子系統(tǒng):負責基于基礎的結(jié)構化數(shù)據(jù)和非結(jié)構化數(shù)據(jù)的實時分析處理和大數(shù)據(jù)海量信息的分析歸類,并將最終的分析和挖掘結(jié)果提供給共享交換子系統(tǒng)進行數(shù)據(jù)共享處理。

        圖2是智慧城市大數(shù)據(jù)系統(tǒng)與外部系統(tǒng)之間的關系示意。

        圖2 大數(shù)據(jù)系統(tǒng)與外部系統(tǒng)關系圖

        3.2 關鍵模塊設計和實現(xiàn)

        3.2.1 數(shù)據(jù)共享交換子系統(tǒng)

        數(shù)據(jù)共享交換子系統(tǒng)面對的是數(shù)量繁多的應用系統(tǒng),數(shù)據(jù)來源的種類、格式、存儲方式各不相同,需要數(shù)據(jù)共享交換子系統(tǒng)能適配各種不同的數(shù)據(jù)來源。在數(shù)據(jù)提供單位發(fā)布共享資源后,對于不同的使用單位,希望獲取到的內(nèi)容不完全相同。

        數(shù)據(jù)共享交換子系統(tǒng)采用分布式架構(如圖3),可以多個采集服務器并發(fā)工作,不同的服務器可以分別運行不同的數(shù)據(jù)采集流程。

        主控節(jié)點(Master):Master端負責任務的創(chuàng)建與分發(fā),并且根據(jù)各工作節(jié)點(Slave)的執(zhí)行能力智能預測任務的調(diào)度分配,提高資源的利用率,實現(xiàn)系統(tǒng)的負載均衡。

        圖3 分布式架構圖

        工作節(jié)點(Slave):Slave端負責任務的執(zhí)行,并且根據(jù)資源的情況可以建立多個,所以在邏輯上可以進行橫向擴展,并構成了一個分布式運行網(wǎng)絡,提供了高的系統(tǒng)性能與系統(tǒng)吞吐量。

        工作節(jié)點網(wǎng)格(Slave Grid):Slave支持Grid,同一個Grid的Slave可以并行執(zhí)行相同的任務。

        數(shù)據(jù)共享交換子系統(tǒng)是平臺的核心組件[4],實現(xiàn)以下功能:

        (1)數(shù)據(jù)采集:可通過前置機、爬蟲、物聯(lián)網(wǎng)關等采集委辦局政務數(shù)據(jù)、社會眾包數(shù)據(jù)、企業(yè)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)。

        (2)數(shù)據(jù)清洗:將各種采集起來的數(shù)據(jù)進行統(tǒng)一標準、格式轉(zhuǎn)換,保證數(shù)據(jù)的正確性、準確性,清洗掉冗余數(shù)據(jù)、過期數(shù)據(jù)、錯誤數(shù)據(jù)。

        (3)數(shù)據(jù)存儲:數(shù)據(jù)經(jīng)過清洗后,分門別類地存放在城市基礎數(shù)據(jù)庫中

        3.2.2 大數(shù)據(jù)挖掘分析子系統(tǒng)

        大數(shù)據(jù)的核心是挖掘業(yè)務目標,建立分析模型。大數(shù)據(jù)挖掘分析采用當前主流的大數(shù)據(jù)處理和分析技術,對數(shù)據(jù)進行交叉分析,任意組合,設計業(yè)務模型,幫助用戶從大型數(shù)據(jù)集中提取感興趣的知識。

        通常大數(shù)據(jù)挖掘分析流程如圖4所示包括以下六個步驟:

        圖4 大數(shù)據(jù)挖掘分析業(yè)務流程圖

        大數(shù)據(jù)挖掘分析的流程:

        (1)業(yè)務理解:理解業(yè)務目標與需求,將其轉(zhuǎn)化為一個數(shù)據(jù)挖掘的問題和實現(xiàn)目標的初步計劃;

        (2)數(shù)據(jù)理解:對挖掘所需所有數(shù)據(jù)的調(diào)查、收集,并熟悉數(shù)據(jù)以便鑒別數(shù)據(jù)質(zhì)量、洞察數(shù)據(jù);

        (3)數(shù)據(jù)準備:將原始數(shù)據(jù)轉(zhuǎn)換為適合挖掘的目標數(shù)據(jù)。包括數(shù)據(jù)清洗、選擇、轉(zhuǎn)換;

        (4)建立模型:選擇多種不同的建模(數(shù)據(jù)挖掘)技術,通過測試數(shù)據(jù)驗證模型質(zhì)量和有效性;

        (5)評價:評價模型的計算結(jié)果是否達到預期?是否有還未充分考慮的問題;

        (6)實施:由最終客戶而不是數(shù)據(jù)分析人員來實施。

        大數(shù)據(jù)挖掘分析子系統(tǒng)當前主流趨勢是利用Spark在迭代計算和內(nèi)存計算上的優(yōu)勢,將并行的機器學習算法與統(tǒng)計算法運行在Spark上。至于Spark的實現(xiàn)方式,則是集成MLLib。MLlib 是Spark對常用的機器學習算法的實現(xiàn)庫,支持常見的機器學習問題。現(xiàn)有常見的機器學習并行算法和并行化統(tǒng)計算法分別如表1和表2所示。

        平臺一般還集成RStudio Server。Rstudio是R語言的一種強大而便捷的IDE(Integrated Development Environment集成開發(fā)環(huán)境),提供基于web的開發(fā)環(huán)境,同時提供RStudio并行化后臺以及并行化執(zhí)行引擎的連接模塊,并將R語言腳本的編寫、編譯、跟蹤執(zhí)行以及中間變量查看和繪圖集于一體,為用戶提供了一個強大的R的操作環(huán)境。用戶除了可以自行編寫R語言的程序腳本、調(diào)用開源版本R提供了數(shù)千個R語言的包和函數(shù)之外。

        系統(tǒng)需要實現(xiàn)的并行化機器學習算法包括常用的分類、聚類、回歸等功能,還會根據(jù)需求在平臺開發(fā)中進一步實現(xiàn)更多的并行化算法,通過將數(shù)據(jù)裝載入分布式內(nèi)存列式存儲,支持對海量數(shù)據(jù)的交互式數(shù)據(jù)分析,具備在秒級分析和掃描數(shù)十億條數(shù)據(jù)的能力。

        表1 現(xiàn)有機器學習并行算法列表

        表2 現(xiàn)有的并行化統(tǒng)計算法列表

        3.2.3 城市基礎數(shù)據(jù)庫子系統(tǒng)

        城市基礎數(shù)據(jù)一般會經(jīng)常被政府各部門所使用。城市基礎數(shù)據(jù)庫由人口數(shù)據(jù)庫、法人數(shù)據(jù)庫、宏觀經(jīng)濟數(shù)據(jù)庫、地理空間數(shù)據(jù)庫及建筑物數(shù)據(jù)庫等五大類數(shù)據(jù)庫組成[5]。

        人口庫是城市基礎數(shù)據(jù)庫之一,是智慧城市必不可少的組成部分,在基礎數(shù)據(jù)庫中最具典型性。下文以人口庫為例說明建庫過程和涉及的信息數(shù)據(jù):

        (1)數(shù)據(jù)接收:接收信息來源部門的人口信息;

        (2)數(shù)據(jù)檢查清理:對接收到的人口數(shù)據(jù)進行入庫前的檢查,包括數(shù)據(jù)量、數(shù)據(jù)有效性和數(shù)據(jù)格式,以確定數(shù)據(jù)是否符合接受規(guī)范;對不合格數(shù)據(jù)不予入庫,并將數(shù)據(jù)問題反饋給信息來源單位;

        (3)數(shù)據(jù)加載:經(jīng)過檢查符合接受規(guī)范的數(shù)據(jù)裝載入庫;

        (4)數(shù)據(jù)質(zhì)量檢驗和控制:建立發(fā)現(xiàn)問題、修改問題的循環(huán)回饋機制,逐步提高人口數(shù)據(jù)的質(zhì)量?;仞佭^程包括發(fā)現(xiàn)數(shù)據(jù)問題;分析問題原因;向責任單位發(fā)布有關問題,通知其修改;責任單位處理問題數(shù)據(jù),返回修改后的數(shù)據(jù),要求保留數(shù)據(jù)質(zhì)量檢驗活動的記錄和問題數(shù)據(jù),作為評估數(shù)據(jù)源數(shù)據(jù)質(zhì)量和各部門工作的依據(jù);

        (5)數(shù)據(jù)維護:建立數(shù)據(jù)更新維護機制,保持人口基礎信息數(shù)據(jù)的鮮活。根據(jù)信息來源和責任歸屬單位的不同,需要建立不同的維護機制,保證人口基礎信息庫中的數(shù)據(jù)與來源數(shù)據(jù)的一致性、完整性和時效性。圖6是數(shù)據(jù)維護當中,典型的人口庫數(shù)據(jù)比對業(yè)務流程圖。

        4 小結(jié)

        大數(shù)據(jù)是智慧城市的智慧引擎。大數(shù)據(jù)通過對多個維度、多種類數(shù)據(jù)的記錄、挖掘、推薦、分類、關聯(lián)等智慧處理,使城市的發(fā)展有更合理的依據(jù),以便向市民提供方便、精準和快捷的服務。同時大數(shù)據(jù)建立后提供的高速并行運算、海量數(shù)據(jù)、更優(yōu)化的算法共同促成了人工智能發(fā)展的突破。

        圖6 人口庫數(shù)據(jù)比對業(yè)務流程圖

        今年的政府工作報告[6]明確提出:“發(fā)展壯大新動能。做大做強新興產(chǎn)業(yè)集群,實施大數(shù)據(jù)發(fā)展行動,加強新一代人工智能研發(fā)應用,在醫(yī)療、養(yǎng)老、教育、文化、體育等多領域推進‘互聯(lián)網(wǎng)+’。發(fā)展智能產(chǎn)業(yè),拓展智能生活。運用新技術、新業(yè)態(tài)、新模式,大力改造提升傳統(tǒng)產(chǎn)業(yè)?!贝髷?shù)據(jù)、人工智能作為當前最核心的關鍵技術,兩者的深度結(jié)合,必將會推動智慧城市向更高層次迭代。

        猜你喜歡
        數(shù)據(jù)系統(tǒng)數(shù)據(jù)挖掘子系統(tǒng)
        不對中轉(zhuǎn)子系統(tǒng)耦合動力學特性研究
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        GSM-R基站子系統(tǒng)同步方案研究
        基于Spark的高速收費站大數(shù)據(jù)系統(tǒng)的設計與實現(xiàn)
        基于計算機軟件開發(fā)技術的物聯(lián)網(wǎng)數(shù)據(jù)系統(tǒng)
        駝峰測長設備在線監(jiān)測子系統(tǒng)的設計與應用
        非均勻采樣數(shù)據(jù)系統(tǒng)的新型模型描述方法
        自動化學報(2017年5期)2017-05-14 06:20:51
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        車載ATP子系統(tǒng)緊急制動限制速度計算
        国产成人永久在线播放| 日本少妇高潮喷水视频| 国产精品久久久亚洲| 午夜视频在线在免费| 欧美午夜精品久久久久久浪潮| 国产免费爽爽视频在线观看| 免费无码av一区二区| 国产成人无码区免费内射一片色欲| 精品久久久久久无码不卡| 亚洲精品白浆高清久久| 国产在线观看女主播户外| 欧美最猛性xxxx| 97人人超碰国产精品最新| 男女啪啪无遮挡免费网站| 永久免费av无码网站yy| 亚洲欧洲久久久精品| 精品国产亚洲人成在线观看| 日韩精品一区二区三区av| 国产一区二区三区在线观看第八页 | 国产一区二区av在线观看| 国产精品国产三级野外国产| 精品精品国产自在97香蕉| 丰满人妻被中出中文字幕| av无码一区二区三| 青青草免费视频一区二区| 免费观看91色国产熟女| 在线观看老湿视频福利| 天天摸夜夜摸摸到高潮| 亚洲国产精品sss在线观看av| 三级全黄的视频在线观看| 亚洲精品国产av成拍色拍| 日本xxxx色视频在线观看| 国产精品久久久久精品一区二区| 国产老熟女狂叫对白| 无遮高潮国产免费观看韩国| 国产亚洲3p一区二区| 高潮毛片无遮挡高清视频播放| 99久久人人爽亚洲精品美女| 国产一区二区欧美丝袜| 亚洲av本道一本二本三区| 琪琪色原网站在线观看 |