張治斌 劉威
摘要:近年人工智能和大數(shù)據(jù)在各個國家的多個領(lǐng)域的應(yīng)用中取得了良好的效果,為人們生活的方便、安全、高效提供了便利,人工智能和大數(shù)據(jù)也經(jīng)常成為人們茶余飯后所談?wù)摰脑掝},兩者之間互為依存、又各有特點,所以經(jīng)常被混淆視聽,本文從兩者的定義、發(fā)展歷程、核心技術(shù)與應(yīng)用等反面相互對照說明,以解讀兩者的聯(lián)系與區(qū)別。
關(guān)鍵詞:人工智能;大數(shù)據(jù);發(fā)展
中圖分類號:TP18 文獻標(biāo)識碼:A 文章編號:1007-9416(2018)08-0235-02
人工智能和大數(shù)據(jù)是目前非常流行的專業(yè)術(shù)語,無論從政府中長期規(guī)劃、企業(yè)創(chuàng)新發(fā)展、大專院校專業(yè)建設(shè)規(guī)劃,以及近年來對求職人才稀缺崗位和職位熱度分析,都不難看出人工智能與大數(shù)據(jù)已經(jīng)成為耳熟能詳并深受熱捧的行業(yè),兩者也常常被人們拿出來相提并論,但事實上二者之間因為既有相似之處,又有各自的特點,因此很容易被混為一談,下面,本文將從兩者的定義、發(fā)展歷程、相互約束的關(guān)系等角度通俗解讀二者區(qū)別。
1 定義及發(fā)展歷程
1.1 人工智能的基本定義及發(fā)展歷程
根據(jù)人工智能學(xué)會與羅蘭貝格聯(lián)合發(fā)布的最新報告,人工智能的定義是利用計算機模擬人類智能行為科學(xué)的統(tǒng)稱,它涵蓋了訓(xùn)練計算機使其能夠完成自主學(xué)習(xí)、判斷、決策等人類行為的范疇。
依據(jù)不同層級人工智能又分為弱人工智能、強人工智能和超強人工智能。所謂弱人工智能是指只能專注于解決某一類特定領(lǐng)域問題,并不真正擁有智能,也不會有自主意識。例如我們現(xiàn)在熟知的AlphaGo雖然能夠輕松戰(zhàn)勝人類圍棋世界冠軍,但其所有的軟硬件功能只能為圍棋服務(wù),因此屬于這一范疇;強人工智能是指能夠真正具有推理和解決問題能力的智能機器,這種機器既有知覺又具備自我意識,能夠快速、獨立地完成思考、計劃、抽象思維以及所有人類大腦能完成的各種腦力勞動,而且這一階段的人工智能已經(jīng)具備對“生存”和“安全”的渴求,電影《人工智能》中的大衛(wèi)正是屬于這一范疇;超人工智能的計算和思維能力已經(jīng)遠遠超出人類預(yù)想,其觀察和思考的范圍已經(jīng)為人類難以理解。從以上分析可見,目前我們所有人工智能算法和應(yīng)用也僅僅止步于弱人工智能領(lǐng)域。
從1950年圖靈第一次提出對人工智能的設(shè)想,繼而1956年達特茅斯會議AI正式誕生,人工智能發(fā)展經(jīng)歷了:1956年-1976年研究不聚焦,但市場期望過高的第一階段;1976年-1986年左右,探索商業(yè)化但迅速被替代的第二階段;到從1997年深藍戰(zhàn)勝國際象棋冠軍開始至今的設(shè)施就位,與應(yīng)用結(jié)合,但存在非理性繁榮的第三階段。今天,伴隨著物聯(lián)網(wǎng)、大規(guī)模并行計算、深度學(xué)習(xí)算法和大數(shù)據(jù)技術(shù)的呈現(xiàn),將人工智能發(fā)展進一步推向高潮。
物聯(lián)網(wǎng)作為計算機感知和控制世界的接口和手段,可以實現(xiàn)數(shù)據(jù)的采集、記憶、分析、傳送數(shù)據(jù)、交互、控制等功能,類同于人類的感官;大規(guī)模的并行計算擺脫了CPU處理器的計算方式,擁有更多的內(nèi)核去處理更多的并行計算任務(wù),而云計算的出現(xiàn)、GPU的大規(guī)模應(yīng)用使得集中化的數(shù)據(jù)計算處理能力變得前所未有的強大;海量的數(shù)據(jù)是人工智能的學(xué)習(xí)和發(fā)展的溫床,為優(yōu)化計算機的處理性能提供了土壤;而深度學(xué)習(xí)算法卻是當(dāng)前人工智能最先進、應(yīng)用最廣泛的核心技術(shù),深層神經(jīng)網(wǎng)絡(luò)逐層訓(xùn)練的高效算法和優(yōu)異的實驗結(jié)果,讓神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練成為了可能,使人類開始重新關(guān)注人工智能。
1.2 “大數(shù)據(jù)”的基本定義及發(fā)展歷程
“大數(shù)據(jù)”一詞最初在1997年由美國宇航局飛行員來描述20世紀(jì)90年代的挑戰(zhàn),用于形容“模擬飛機周圍的氣流——是不能被處理和可視化的”;麥肯錫全球研究所給出大數(shù)據(jù)的定義是一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征。
大數(shù)據(jù)技術(shù)在2002年9月11日美國被恐怖組織襲擊后已經(jīng)逐漸被涉足和重視,到2008年,隨著社交網(wǎng)絡(luò)用戶的普遍推廣和用戶激增,使得“大數(shù)據(jù)”的飛速增長獲得溫床,同年9月,《自然》雜志推出以“大數(shù)據(jù)”為主題的封面,預(yù)示著大數(shù)據(jù)年代的到來。此后,大數(shù)據(jù)技術(shù)發(fā)展經(jīng)歷了2009年-2011年的熱門階段;2012年-2016年的“大數(shù)據(jù)”時代特征階段;乃至2017年至今的“大數(shù)據(jù)”爆發(fā)階段。
人的大腦存儲著各種紛繁復(fù)雜的海量知識,這些或碎片或系統(tǒng)的知識獲取渠道是通過感官進行信息采集,通過神經(jīng)中樞傳導(dǎo)并存儲在大腦皮層,這些知識在邏輯上通常不能存在一定的關(guān)系,更有大量雜亂無章的干擾信息阻止人類搜索到有效地信息用于指導(dǎo)決策和行為的計劃、分析與執(zhí)行。那么形象上理解,可以將人腦中的海量信號理解為大數(shù)據(jù),這些大數(shù)據(jù)在被使用之初要經(jīng)歷采集、傳輸、存儲、分類等工作,并做適當(dāng)?shù)那謇硪蕴岢龈鞣N復(fù)雜的干擾信號;而人工智能可以理解為人類在通過各種渠道獲取知識,通過反復(fù)訓(xùn)練來積累、總結(jié)經(jīng)驗,進而提升個人分析、決策,乃至執(zhí)行能力的這一系統(tǒng)過程。
2 主要技術(shù)與應(yīng)用
從以上論述可知,大數(shù)據(jù)技術(shù)的宗旨是在數(shù)據(jù)轉(zhuǎn)變?yōu)橛杏玫闹R之前進行必要的清理、集成、分類、結(jié)構(gòu)化等操作,是對數(shù)據(jù)的屬性、狀態(tài)、存儲形式的操作;人工智能更側(cè)重于知識的產(chǎn)出,即通過數(shù)據(jù)的內(nèi)涵產(chǎn)生有意義的智能輸出。故此,兩者在技術(shù)路線與框架上也勢必有所區(qū)別。
2.1 人工智能的主要技術(shù)
支持人工智能的機器旨在分析和解釋數(shù)據(jù),然后根據(jù)這些解釋解決問題,以便對決策和學(xué)習(xí)做出最佳決定。通過機器學(xué)習(xí),計算機會學(xué)習(xí)如何對某個結(jié)果采取行動或做出快速、準(zhǔn)確的反應(yīng),并在未來知道采取相同的行動。
人工智能更關(guān)注算法與計算形式,通過不斷優(yōu)化算法提升機器的認知與執(zhí)行能力,針對某種輸入獲取人類期許的輸出。與傳統(tǒng)計算應(yīng)用程序不同,人工智能放棄所有響應(yīng)都采用編碼的方式,而是通過不斷分析和解釋數(shù)據(jù),繼而調(diào)整和優(yōu)化對某種情景采取行動或作出響應(yīng),并在后續(xù)同種情況采取相同行動。
第三次浪潮的人工智能把一些技術(shù)、神經(jīng)元網(wǎng)絡(luò)和統(tǒng)計的方法結(jié)合在一起。人工智能技術(shù)在神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上發(fā)展成多層神經(jīng)網(wǎng)絡(luò),進而進行深度學(xué)習(xí)。目前人工智能技術(shù)涉及機器學(xué)習(xí)、知識圖譜、自然語言處理、計算機視覺、人機交互、生物特征識別、虛擬現(xiàn)實/增強現(xiàn)實等關(guān)鍵技術(shù)。而人工智能學(xué)科研究的主要內(nèi)容包括:知識表示、自動推理和搜索方法、機器學(xué)習(xí)和知識獲取、知識處理系統(tǒng)、自然語言理解、計算機視覺、智能機器人、自動程序設(shè)計等方面,主要應(yīng)用體現(xiàn)在:機器視覺,指紋識別,人臉識別,視網(wǎng)膜識別,虹膜識別,掌紋識別,專家系統(tǒng),自動規(guī)劃,智能搜索,定理證明,博弈,自動程序設(shè)計,智能控制,機器人學(xué),語言和圖像理解,遺傳編程等。
2.2 大數(shù)據(jù)主要技術(shù)
大數(shù)據(jù)多采用傳統(tǒng)的統(tǒng)計計算方法,可以針對各種紛繁復(fù)雜的數(shù)據(jù),尋求內(nèi)涵的結(jié)果,進而獲得潛藏在數(shù)據(jù)背后能夠指導(dǎo)人類行為決策的洞察力,例如淘寶可以根據(jù)用戶每次瀏覽的商品內(nèi)容的種類、價格、屬性等獲取用戶的消費能力與消費習(xí)慣,進而推薦用戶喜聞樂見的商品。這些被分析處理的數(shù)據(jù)可以是結(jié)構(gòu)化(關(guān)系型數(shù)據(jù)庫中的事務(wù)數(shù)據(jù)表)、非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)(電子郵件、網(wǎng)站瀏覽信息、圖像、視頻、聲音、傳感器數(shù)據(jù)等)。
根據(jù)大數(shù)據(jù)處理的生命周期,大數(shù)據(jù)的技術(shù)體系涉及數(shù)據(jù)的采集與預(yù)處理、大數(shù)據(jù)存儲與管理、大數(shù)據(jù)計算模式與系統(tǒng)、大數(shù)據(jù)分析與挖掘、大數(shù)據(jù)可視化分析及大數(shù)據(jù)隱私與安全等幾個方面[2]。大數(shù)據(jù)的飛速發(fā)展更離不開云計算,單臺計算機無法完成海量數(shù)據(jù)的處理,通過采用云計算的分布式架構(gòu),才能有效對海量數(shù)據(jù)進行分布式數(shù)據(jù)挖掘、分布式處理、分布式數(shù)據(jù)庫和云存儲和虛擬化等技術(shù)。大數(shù)據(jù)的價值體現(xiàn)在能夠為企業(yè)產(chǎn)品和服務(wù)的精準(zhǔn)營銷;幫助中小企業(yè)實現(xiàn)服務(wù)轉(zhuǎn)型;幫助傳統(tǒng)企業(yè)充分利用大數(shù)據(jù)背后的價值。目前大數(shù)據(jù)應(yīng)用的主要場景包括:精準(zhǔn)營銷、風(fēng)險控制、決策支持、效率提升、醫(yī)療精診、生物基因改良等。
3 結(jié)語
大數(shù)據(jù)技術(shù)作為人工智能發(fā)展的必備條件,成為構(gòu)建人工智能技術(shù)框架的重要支點,與深度學(xué)習(xí)算法和基于分布式計算的核心部件共同完成人工智能突飛猛進的三大基礎(chǔ)技術(shù)支撐,如圖1所示。
人工智能和大數(shù)據(jù)雖然有很大區(qū)別,但兩者之間的聯(lián)系也越來越就緊密。大數(shù)據(jù)技術(shù)主要針對大規(guī)模無規(guī)則數(shù)據(jù)的處理,包括數(shù)據(jù)的 采集、存儲、管理以及挖掘使用等。同時,這些處理過程的改善越來越依賴于人工智能技術(shù)的的參與,可以說大數(shù)據(jù)的一些關(guān)鍵技術(shù)也屬于人工智能的范疇。因此,人工智能的快速發(fā)展也促進了大數(shù)據(jù)相關(guān)技術(shù)的發(fā)展。人工智能技術(shù)是將軟硬件結(jié)合起來,通過神經(jīng)網(wǎng)絡(luò)算法、機器學(xué)習(xí)等技術(shù)處理手段對大數(shù)據(jù)進行處理,其在特定領(lǐng)域取得 良好的效果離不開大數(shù)據(jù)的支撐??傊?,大數(shù)據(jù)和人工智能在各類行業(yè)中密不可分,二者的結(jié)合,是實現(xiàn)計算機達到人類智能水平目標(biāo)的有效手段。
參考文獻
[1]趙方宇.淺析大數(shù)據(jù)與人工智能的關(guān)系[J].數(shù)字通信世界,2018,07:129,135.
[2]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):146-169.