據(jù)合眾國際社(UPI)的報道,麻省理工學院通過裝有促銷銷售日期和每周利潤的數(shù)據(jù)庫測試了一個計算機系統(tǒng)——“數(shù)據(jù)科學機器”(The Data Science Machine),并認為該系統(tǒng)在數(shù)據(jù)模式發(fā)現(xiàn)方面優(yōu)于人類。
通常,人類在模式識別領(lǐng)域的表現(xiàn)優(yōu)于計算機。直到現(xiàn)在,數(shù)據(jù)分析和數(shù)據(jù)挖掘過程還需要人工介入。但麻省理工的科學家們認為他們可能已經(jīng)破解人類完成模式識別任務(wù)的密碼,并聲稱他們的“數(shù)據(jù)科學機器”在大數(shù)據(jù)分析和模式提取方面比人類速度更快且更可靠。他們的機器參加過三次和人的比賽,任務(wù)是通過N種算法對幾個月的數(shù)據(jù)進行模式預測?!皵?shù)據(jù)科學機器”預測的準確率分別為94%、96%和87%。其中一次比賽中,“數(shù)據(jù)科學機器”與906人組成的團隊對抗,最后機器戰(zhàn)勝了其中的615人。報告稱計算機通過使用一些數(shù)字標識符試圖找到數(shù)據(jù)中的相關(guān)關(guān)系,然后更新標識符,繼續(xù)緊縮數(shù)據(jù),隨后,機器改進其過程并開始分辨數(shù)據(jù)中的趨勢。
這些測試如果成功,將大大減輕人類的工作量,特別是數(shù)據(jù)分析方面的工作量。目前,“數(shù)據(jù)科學機器”在預測學生是否會放棄在線課程方面已經(jīng)有了較高的準確度,但是系統(tǒng)至少需要兩套算法才能做出預測。它需要分析學生在在線課程上所花的時間以及學生在截止日期前花在作業(yè)上的時間。哈佛大學的一位計算機科學家認為,這類新機器不僅能解決問題,還能為如何看待問題提供不同的視角。
http://www.themarketbusiness.com
謝 洵 編譯
(本欄目由北京師范大學遠程教育研究中心、交互媒體與遠程學習實驗室同本刊合辦)