亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘技術(shù)在地鐵中的應用研究

        2022-06-21 21:09:05彭瓊芳
        交通科技與管理 2022年12期
        關(guān)鍵詞:檢票客流備份

        摘要 探討地鐵中的數(shù)據(jù)挖掘技術(shù),可以提高數(shù)據(jù)挖掘技術(shù)的質(zhì)量與效果,從而為地鐵工程工作的推進奠定良好的基礎。基于此,文章從智能決策分析系統(tǒng)的系統(tǒng)架構(gòu)、系統(tǒng)運行方式等方面,分析了地鐵自動售檢票系統(tǒng)在地鐵工程中的應用。在此基礎上,提出客流分析預測系統(tǒng)過程、建立客流分析模型兩方面來加強數(shù)據(jù)挖掘技術(shù)的應用策略,希望能給相關(guān)人員一些借鑒。

        關(guān)鍵詞 數(shù)據(jù)信息資源挖掘;地鐵;自動售檢票系統(tǒng);聚集式計算;可視化技術(shù)

        中圖分類號 TP311.13 文獻標識碼 A 文章編號 2096-8949(2022)12-0050-03

        收稿日期:2022-04-15

        作者簡介:彭瓊芳(1982—),女,本科,高級工程師,研究方向:電氣工程及自動化。

        0 引言

        科學的進步,社會的發(fā)展,促使信息時代的到來。在當前,人們可以在短時間內(nèi)獲得大量的信息,這些信息毫無規(guī)律,并且相對模糊,相關(guān)人員很難找到目標信息促進自身的工作有效開展。而數(shù)據(jù)挖掘技術(shù)的應用,則可以改變這種情況。將數(shù)據(jù)挖掘技術(shù)應用到工作中,使用者就能夠在相對較短的時間內(nèi),從海量的信息中,經(jīng)過科學地篩查與歸類,最終找出目標信息及其傳播規(guī)律。

        1 數(shù)據(jù)挖掘技術(shù)

        1.1 產(chǎn)生的背景

        隨著計算機技術(shù)的飛速發(fā)展,數(shù)據(jù)庫被普遍地應用于很多領(lǐng)域,產(chǎn)生了大量數(shù)據(jù)庫。這些數(shù)據(jù)庫可以為管理者帶來統(tǒng)一、全局的視角,但是數(shù)據(jù)的豐富也使得人們?nèi)狈τ行Х椒▉碜R別一些隱藏的、對決策有益的信息,而傳統(tǒng)查詢方法和報表工具也根本無法滿足信息數(shù)據(jù)挖掘的需要。因此需要一套技術(shù)來管理這些冗雜的數(shù)據(jù),從中選擇并挖掘出有用的信息,由此就形成了數(shù)據(jù)挖掘技術(shù)[1],如圖1。

        另一方面,數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)倉庫技術(shù)逐步發(fā)展和完善的成果,但并不是任何信息挖掘的技術(shù)都可以歸類到數(shù)據(jù)挖掘技術(shù)。比如,信息檢索技術(shù)也能夠利用數(shù)據(jù)庫的管理系統(tǒng)來檢索個別記錄,又或者利用互聯(lián)網(wǎng)的檢索功能來找到特殊的頁面,這些都不屬于數(shù)據(jù)挖掘技術(shù)。

        1.2 概述

        以數(shù)據(jù)庫、數(shù)理統(tǒng)計學、人工智能、可視化研究等為基石,算法的設計工作需要這些來描述和解釋數(shù)據(jù)分析。算法的設計工作主要包括錄入、產(chǎn)出和數(shù)據(jù)處理。數(shù)據(jù)庫是數(shù)據(jù)挖掘的計算入口,計算產(chǎn)出是挖掘數(shù)據(jù)信息知識的模型,而算法處理的流程則是設計具體工作的方式。

        1.3 分類

        數(shù)據(jù)挖掘可以按不同的方式分為不同的類別。

        以數(shù)據(jù)庫的視角來定義數(shù)據(jù)挖掘的3個基本技術(shù)方面,分別為數(shù)據(jù)信息挖掘視角、數(shù)據(jù)挖掘?qū)ο?、?shù)據(jù)分析信息挖掘方式。數(shù)據(jù)信息挖掘視角是將數(shù)據(jù)挖掘?qū)ο蠹毞譃槿舾蓚€信息庫或數(shù)據(jù)源,如關(guān)聯(lián)、面對的對象、空間環(huán)境、時態(tài)、文本庫、多媒體、歷史等相關(guān)領(lǐng)域方面的數(shù)據(jù)庫和萬維網(wǎng)等[2]。

        而數(shù)據(jù)分析信息挖掘方式則可粗分為數(shù)據(jù)分析方式、機器學習方法、神經(jīng)網(wǎng)絡方式和數(shù)據(jù)庫方法。數(shù)據(jù)分析方式可劃分為回歸式數(shù)據(jù)分析、判別分析方式等。機器學習方式可劃分為遺傳算法等。神經(jīng)網(wǎng)絡方式可劃分為前向神經(jīng)網(wǎng)絡、自組織神經(jīng)網(wǎng)絡等。數(shù)據(jù)庫方法則主要為多維的數(shù)據(jù)挖掘方式等。

        1.4 作用

        數(shù)據(jù)挖掘過程是指自動提取并利用各種數(shù)據(jù)表中隱藏的有價值信息的過程,消息的類型可分為規(guī)律、法則、定義和模型等。管理人員通過這一技術(shù),能剖析當前數(shù)據(jù)信息、歷史數(shù)據(jù)信息及二者之間的關(guān)聯(lián),并從中找到隱藏的模型和關(guān)系,以便于預見未來可能出現(xiàn)的重大事件。這一過程也是人們探索認知系統(tǒng)的過程,是一個涉及方面非常廣泛的新興交叉性學科,主要應用于數(shù)據(jù)庫、大數(shù)據(jù)計算、新一代人工智能和信息可視化與并行計算等領(lǐng)域。

        1.5 常見技術(shù)形式

        數(shù)據(jù)分析挖掘中掌握專業(yè)知識的重要技能是機器學習和數(shù)理分析計算,目前研究數(shù)據(jù)挖掘的重點聚集于計算基礎理論與應用方面。機器學習作為另一種深入研究人工智慧的分支方法,被稱作歸納與推理;采用關(guān)聯(lián)分析法,也可以從關(guān)系數(shù)據(jù)庫中獲取相關(guān)聯(lián)系。而挖掘關(guān)聯(lián)則是指根據(jù)系統(tǒng)查找各種事件,以找出符合條件概率比較高的模式;資源數(shù)據(jù)分析挖掘以人工神經(jīng)元網(wǎng)絡使用最為普遍,計算方法是采用模擬個人神經(jīng)系統(tǒng),不斷地訓練和掌握相應的數(shù)據(jù)集合,在每個待分析數(shù)據(jù)的集合里,出現(xiàn)可估計和分析的建模。決策方法是一個預測模型,呈樹型構(gòu)造,非終端節(jié)點顯示屬性,葉節(jié)點則顯示不同類型;遺傳算法則是一種基于優(yōu)化生物學發(fā)展理論研究的技術(shù),基礎觀念是“適者生存”。遺傳算法可進行多種類型、并行處理大量數(shù)據(jù)分析[3];聚合后發(fā)現(xiàn),整個數(shù)據(jù)庫都能夠分為不同集群,群和集群之間存在明顯區(qū)別,同一個群的數(shù)據(jù)信息也盡量接近。聚類分析方法只是其他如特征和類型等預處理的第一步,算法在新生成的簇上等待數(shù)據(jù)處理。與分類方法不同的地方是在開始聚合之前,人們不清楚如何將數(shù)據(jù)信息分門別類,也不清楚如何按照變量分類。在聚合后,熟悉業(yè)務的人有多種方式理解分群的含義。大多數(shù)情形第一次聚合后所獲得的分群信息對業(yè)務沒有直接價值,需要通過刪減和添加變數(shù),來修正數(shù)據(jù)信息分群所采用的多種方法。如此,在重復多次以后,就會得出一個非常理想的結(jié)論。聚合方法主要分為兩類,即神經(jīng)網(wǎng)絡方法和統(tǒng)計分析方法。K-均值和自組織的神經(jīng)網(wǎng)絡方式在聚合計算中應用更為普遍。

        2 地鐵自動售檢票系統(tǒng)

        2.1 智能決策分析系統(tǒng)的系統(tǒng)架構(gòu)

        由于現(xiàn)有自動售檢票系統(tǒng)都自建內(nèi)部網(wǎng)絡,在管理上屬于私有內(nèi)網(wǎng)范圍。目前自動售檢票系統(tǒng)的數(shù)據(jù)庫中一般存儲60天歷史數(shù)據(jù),但出于行業(yè)需要和安全方面的要求,可首先采取增加備用策略,把自動售檢票系統(tǒng)的數(shù)據(jù)庫數(shù)據(jù)備份到備用數(shù)據(jù)庫服務器,之后再提取歷史數(shù)據(jù)到本信息系統(tǒng)業(yè)務數(shù)據(jù)庫,同時再向其他的輔助管理系統(tǒng)導入新數(shù)據(jù),從而構(gòu)成了該信息系統(tǒng)的全部服務統(tǒng)計信息。所以,在大數(shù)據(jù)分析集成處理過程中,必須本著安全性第一、兼顧成本的原則,通過防火墻實現(xiàn)隔離,以確保自動售檢票系統(tǒng)與該信息系統(tǒng)業(yè)務數(shù)據(jù)庫的安全性。

        2.2 系統(tǒng)運行方式

        每天自動售檢票系統(tǒng)處于空閑時,一般在凌晨2點之后,分析系統(tǒng)應用服務器開啟中間件,將自動售檢票系統(tǒng)數(shù)據(jù)備份到備用數(shù)據(jù)庫服務器,并采用編程方法實現(xiàn)了自動售檢票系統(tǒng)數(shù)據(jù)庫的實時備用以及到備用數(shù)據(jù)庫服務器的增量備用方法,同時實現(xiàn)錄入歷史數(shù)據(jù)信息和為本系統(tǒng)業(yè)務數(shù)據(jù)庫進行直接抽取歷史數(shù)據(jù)信息的要求,并將成果保存到數(shù)據(jù)分析管理系統(tǒng)服務器上。

        用戶帳號安全方案:通過不同的員工帳號、角色等定義,分別獲得對應的授權(quán),以確保系統(tǒng)用戶帳號與系統(tǒng)數(shù)據(jù)的安全。

        在辦公網(wǎng)的分析系統(tǒng)服務器上,以實時方式存取資產(chǎn)數(shù)據(jù)庫信息,對數(shù)據(jù)采用拉(PULL)的方法,只讀取所需要的資料數(shù)量,以增加管理系統(tǒng)的反應時間。

        分析系統(tǒng)客戶端的接入方式使用了純B/S模型,以滿足地鐵辦公室OA與分析管理系統(tǒng)的兼容,支撐最大規(guī)模的并發(fā)性使用。

        備份功能:用SQL2000編程腳本,可以定時實現(xiàn)自動售檢票系統(tǒng)與備份服務器的2臺數(shù)據(jù)庫同步,所有決策支持系統(tǒng)的數(shù)據(jù)信息都來自備份服務器數(shù)據(jù)庫。而針對備份數(shù)據(jù)庫服務器與本管理系統(tǒng)業(yè)務數(shù)據(jù)庫之間的備份問題,可以使用光盤塔為備份設備,利用數(shù)據(jù)庫中的自動備份功能自動完成,將來也能夠利用索引管理系統(tǒng)還原需要的數(shù)據(jù)信息。

        2.3 相關(guān)客流的數(shù)據(jù)

        按站點計算每日的出入站客流信息,分時間(輸入起止時間和間隔時間)計算每日各站點的進出站客流和實時客流信息,按周計算各時間段的實時客流、進出站客流信息,以及多種檢索條件下的客流信息。

        (1)根據(jù)輸入的卡號、日期查詢進出站記錄。

        (2)統(tǒng)計每臺設備的分時段進出站客流。

        (3)統(tǒng)計每天在各個站點單程票的銷售、進站、出站情況。

        (4)統(tǒng)計每月通卡會員的乘車人次和總額。

        (5)計算每天在用地鐵專屬卡的張數(shù),并占所有可用地鐵專屬卡片的比例。

        (6)數(shù)據(jù)備份功能,將全年的每日交易數(shù)據(jù)都儲存到同一個數(shù)據(jù)庫中。

        (7)運營日報中的相關(guān)數(shù)據(jù)統(tǒng)計。

        (8)特殊交易查詢:查找超出所提供的許可區(qū)域的特殊交易的有關(guān)設備信息。

        (9)按照某市地下鐵路專用卡的卡號查看此卡的有關(guān)出站信息內(nèi)容以及剩余次數(shù)。

        (10)地鐵專用卡到期的提示。

        (11)退款申請查詢:對某一設備在某一時段的交易信息查詢。

        (12)員工考勤:票務中心可查看、打印每張卡片的進、出站等相關(guān)信息(員工卡的卡號、可變賦值金額和數(shù)量),可查看和打印當班的操作員的所有操作數(shù)據(jù),如初始化數(shù)量、編碼數(shù)量、賦值金額之和數(shù)量、注銷數(shù)量。

        2.4 系統(tǒng)數(shù)據(jù)管理

        數(shù)據(jù)分析抽?。簩⑵髽I(yè)數(shù)據(jù)從自動售檢票系統(tǒng)數(shù)據(jù)庫備份到企業(yè)智能決策與支持分析管理系統(tǒng)、企業(yè)備份數(shù)據(jù)庫服務器,再按照實際服務需求,提取相關(guān)數(shù)據(jù)分析到本管理系統(tǒng)服務信息庫中。然后從擴展視角出發(fā),保留端口,直接從外部大數(shù)據(jù)系統(tǒng)庫提取所要求的數(shù)據(jù)分析。

        信息系統(tǒng)備份:將通過智能決策支持分析系統(tǒng)備份數(shù)據(jù)庫服務器中的服務數(shù)據(jù)信息,并且將該管理系統(tǒng)用抽取數(shù)據(jù)分析信息自動備份到光盤塔等備份設施。

        備份與恢復:根據(jù)企業(yè)運營需求,通過索引從光盤塔等備份設施中將數(shù)據(jù)恢復至企業(yè)智能決策與支持的分析管理系統(tǒng),備份數(shù)據(jù)庫服務器供本系統(tǒng)業(yè)務數(shù)據(jù)庫管理之用。

        應用管理:實現(xiàn)本管理系統(tǒng)的使用者登錄、注銷、角色分派、密碼與授權(quán)管理等功能,將使用數(shù)據(jù)分析整合于對業(yè)務管理系統(tǒng)客流的數(shù)據(jù)分析[4]。

        3 數(shù)據(jù)挖掘技術(shù)的應用

        互聯(lián)網(wǎng)的高速發(fā)展將為用戶帶來許多新信息服務,而互聯(lián)網(wǎng)因內(nèi)涵豐富、功能強大以及使用簡便,在所有獲取信息的服務方法中尤為突出,成為了數(shù)據(jù)挖掘發(fā)展的重點方向。又由于當前互聯(lián)網(wǎng)信息服務的主要趨勢是單向與被動信息服務的模式,使網(wǎng)絡應用挖掘信息服務更符合性能要求,提高了互聯(lián)網(wǎng)與應用之間的互動性,使互聯(lián)網(wǎng)與應用能真正地相互融合。

        與以前的使用方法和被操作方式完全不同,通過運用數(shù)據(jù)挖掘技術(shù),使互聯(lián)網(wǎng)針對應用需要進行更針對性的、更主動的信息服務,并能形成具有個性化信息服務特點的體系,而根據(jù)對不同用戶信息服務提供不同需要的滿足方法,進行信息服務特點就有所不同。構(gòu)建的個性化信息服務體系也更加依賴于挖掘應用信息服務的需要。

        以某市地鐵客票業(yè)務為例,大資料數(shù)據(jù)挖掘技術(shù)在客運數(shù)據(jù)分析中發(fā)揮最快捷的功能??瓦\數(shù)據(jù)分析預測體系流程由數(shù)據(jù)分析源形成、建立數(shù)據(jù)分析集市形成;而客流分析模型的構(gòu)建過程由大樣本數(shù)據(jù)分析、對BP神經(jīng)網(wǎng)絡的數(shù)據(jù)處理兩部分形成。

        3.1 客流分析預測系統(tǒng)過程

        3.1.1 數(shù)據(jù)源構(gòu)成

        因客票管理系統(tǒng)的資料數(shù)據(jù)庫與恢復業(yè)務所使用SYBASE產(chǎn)品,而資料倉儲的制作所使用Microsoft公司產(chǎn)品的SQLSerner2000,因此面臨著轉(zhuǎn)換為異相數(shù)據(jù)源的問題。在技術(shù)上采用了數(shù)據(jù)庫對接技術(shù),把所需要的基礎表導入到了SQLServer中。

        3.1.2 構(gòu)建數(shù)據(jù)信息集市

        數(shù)據(jù)挖掘技術(shù)對于中小型公司的運用,更偏向于在不影響信息體系上先構(gòu)建中小型數(shù)據(jù)集市。首先將相應的數(shù)據(jù)分析提取至小型數(shù)據(jù)集市中,再將其中的各個關(guān)系表格數(shù)據(jù)分析提取至大型數(shù)據(jù)集市中,最后再將數(shù)據(jù)集市中各個表格的數(shù)據(jù)分析提取至特定關(guān)系表格中,并在此基礎上利用零LAP技術(shù)工具來構(gòu)建多維分析的模型立方體,從而通過建立的數(shù)據(jù)分析挖掘來進行高鐵客流數(shù)據(jù)分析與預報[5]。

        3.2 建立客流分析模型

        因為在前期就已設置了大量數(shù)據(jù)集市,人們就可以據(jù)此抽取出相應的數(shù)量來完成數(shù)據(jù)分析挖掘。在大量數(shù)據(jù)集市中,有各大車站、區(qū)間和線路中的售票數(shù)量、貨物總收入、旅客票價總收入、乘客上車的數(shù)量,以及各種類型的統(tǒng)計運量信息,通過BP神經(jīng)網(wǎng)絡進行信息處理。

        數(shù)據(jù)變換也是一種預處理數(shù)據(jù)分析的關(guān)鍵部分。數(shù)據(jù)變換就是將大量數(shù)據(jù)信息內(nèi)容加以轉(zhuǎn)化,并使之更適合于數(shù)據(jù)分析挖掘類型,也就是說將特征向量的統(tǒng)計信息內(nèi)容按百分比加以壓縮,進而將其落入到某個較小的特定區(qū)域。所采用的技術(shù)是歸一化處理。在此網(wǎng)絡模式的運算中,將輸入樣本和檢驗樣品中的所有數(shù)據(jù)信息,都統(tǒng)一加以量化為0~1之間的實數(shù)。

        4 結(jié)語

        綜上所述,數(shù)據(jù)挖掘技術(shù)在地鐵中的應用優(yōu)勢是相當明顯的,因此相關(guān)地鐵工作單位要加強對數(shù)據(jù)挖掘技術(shù)的應用,以便為地鐵的相關(guān)工作開展創(chuàng)造有利的條件。隨著大數(shù)據(jù)的發(fā)展,城市軌道交通中的大數(shù)據(jù)研究是地鐵管理升級的需要,也是滿足乘客多種需求的必然要求。通過數(shù)據(jù)挖掘技術(shù),深入探究城市軌道交通信息系統(tǒng)的運維和數(shù)據(jù)規(guī)律,指導運營實踐和規(guī)劃,對提升城市軌道交通的運營管理水平具有重要的理論和現(xiàn)實意義。

        參考文獻

        [1]王露. 數(shù)據(jù)挖掘技術(shù)在智能交通系統(tǒng)中的應用[J]. 工程技術(shù), 2015(23): 215.

        [2]陳靖. 數(shù)據(jù)挖掘技術(shù)在智能交通信息處理中的研究與應用[J]. 電腦知識與技術(shù), 2018(25): 7-8.

        [3]陸化普, 周錢, 周永華, 等. 數(shù)據(jù)挖掘技術(shù)在智能交通系統(tǒng)綜合信息平臺中的應用[J]. ITS通訊, 2004(1)79-84.

        [4]周健. 無線網(wǎng)絡技術(shù)在智能交通系統(tǒng)中的應用分析[J]. 數(shù)碼世界, 2017(12): 538.

        [5]李萬欣, 李玉. 大數(shù)據(jù)技術(shù)在智能交通系統(tǒng)中的應用研究[J]. 科學與財富, 2019(33): 324.

        猜你喜歡
        檢票客流備份
        “備份”25年:鄧清明圓夢
        客流增多
        檢票
        有軌電車售檢票方案綜合分析
        基于自學習補償?shù)氖覂?nèi)定位及在客流分析中的應用
        淺析數(shù)據(jù)的備份策略
        科技視界(2015年6期)2015-08-15 00:54:11
        人工免疫算法在電梯客流時段劃分的應用
        現(xiàn)代有軌電車售檢票系統(tǒng)方案的研究
        城市軌道交通運營客流數(shù)據(jù)分析缺陷及應對
        自動售檢票線網(wǎng)化維修管理系統(tǒng)的構(gòu)建
        丰满熟妇人妻无码区| 国产真实乱对白精彩久久老熟妇女| 亚洲人成绝费网站色www| 国产免费人成视频在线播放播 | 老色鬼在线精品视频| 成人小说亚洲一区二区三区| 日韩一二三四精品免费| 国产中文字幕亚洲国产| 欧美最猛黑人xxxx| 嫩草影院未满十八岁禁止入内| 亚洲人成网站18男男| 成人爽a毛片在线播放| 无码国内精品久久人妻| 污污污污污污污网站污| 日本人妻av在线观看| 日本久久精品中文字幕| 亚洲av无码久久精品蜜桃| 在线精品无码一区二区三区| 日本女优爱爱中文字幕| 日本精品久久久久中文字幕| 国产成人麻豆精品午夜福利在线 | 最新亚洲人成无码网站| 日韩精品人妻中文字幕有码| 国产av久久在线观看| 国产免费av片在线播放| 亚洲五月激情综合图片区| 国产另类人妖在线观看| 久久久久久久久毛片精品| 亚洲国产精品一区二区久| 国产蜜臀精品一区二区三区| 亚洲 欧美 偷自乱 图片| 日韩人妻无码一区二区三区久久99 | 玩弄少妇高潮ⅹxxxyw| 成人午夜免费福利| 四季极品偷拍一区二区三区视频| 中文人妻熟妇乱又伦精品| 久久久久久久98亚洲精品| 在线观看av不卡 一区二区三区| 欧美最猛黑人xxxx| 宅男噜噜噜| 亚洲一区视频中文字幕|