范昕
摘要:介紹了大數(shù)據(jù)及農(nóng)業(yè)科技檔案的概念,分析了目前我國(guó)農(nóng)業(yè)科技檔案缺乏連續(xù)性及完整性、管理模式單一、服務(wù)缺乏共享機(jī)制的現(xiàn)狀。闡述了大數(shù)據(jù)背景下農(nóng)業(yè)科技檔案的管理,即提升檔案管理的“價(jià)值鏈”,注重科技檔案價(jià)值的綜合評(píng)價(jià),建立農(nóng)業(yè)科技檔案數(shù)據(jù)庫(kù),注重?cái)?shù)據(jù)挖掘,利用運(yùn)籌學(xué)來進(jìn)行農(nóng)業(yè)科技檔案信息優(yōu)化,并保障檔案安全。
關(guān)鍵詞:大數(shù)據(jù);農(nóng)業(yè)科技檔案;管理
中圖分類號(hào):F49文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.19311/j.cnki.16723198.2017.32.031
1何為大數(shù)據(jù)
大數(shù)據(jù)是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,是基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式,通過整合共享、交叉復(fù)用,形成的智力資源和知識(shí)服務(wù)能力。大數(shù)據(jù)的特點(diǎn)具有囊括各行各業(yè)的海量數(shù)據(jù),查找所需數(shù)據(jù)時(shí)運(yùn)算速度超快、指數(shù)型、對(duì)數(shù)型、超越型等數(shù)據(jù)類型冗繁數(shù)據(jù)的利用價(jià)值超高,既能進(jìn)行回顧性統(tǒng)計(jì)分析,又能進(jìn)行前瞻性預(yù)測(cè)。
大數(shù)據(jù)的核心是預(yù)測(cè),通過對(duì)海量數(shù)據(jù)的分析來預(yù)測(cè)事情發(fā)生的可能性。大數(shù)據(jù)不關(guān)注定量的存在,而是致力于數(shù)據(jù)價(jià)值的深層挖掘和開發(fā)。
隨著大數(shù)據(jù)時(shí)代的來臨,數(shù)據(jù)已經(jīng)成為人們生活中不可缺少的資源,數(shù)據(jù)可視為航空航天、經(jīng)濟(jì)金融、醫(yī)療教育、工業(yè)制造、農(nóng)業(yè)信息等行業(yè)的資產(chǎn)??蒲须x不開數(shù)據(jù)為支撐,離開了數(shù)據(jù)則變?yōu)槁齑蛘ɡ住?/p>
2何為農(nóng)業(yè)科技檔案
檔案是一種原始信息,它具有真實(shí)可靠性。檔案類型眾多,內(nèi)容復(fù)雜。其中之一的農(nóng)業(yè)科技檔案,就含文字和計(jì)算、圖表和照片等二維資料,還包含實(shí)物和標(biāo)本等三維材料。
農(nóng)業(yè)科技檔案本質(zhì)上為農(nóng)業(yè)信息。農(nóng)業(yè)信息的特點(diǎn)為:受季節(jié)和氣候的影響,具有強(qiáng)烈的地域性,土壤的酸堿度南北方差異大。它包含二維、三維等不同維度,富有立體感處于動(dòng)態(tài)之中。因此,農(nóng)業(yè)科技檔案的內(nèi)容很復(fù)雜。
在大數(shù)據(jù)背景下,我國(guó)農(nóng)業(yè)正在逐步轉(zhuǎn)向現(xiàn)代農(nóng)業(yè)、數(shù)字農(nóng)業(yè)與信息農(nóng)業(yè)。農(nóng)業(yè)科技檔案正在成為具有科學(xué)價(jià)值和實(shí)用意義的農(nóng)業(yè)信息資源。
3目前我國(guó)農(nóng)業(yè)科技檔案的現(xiàn)狀
3.1檔案信息缺乏連續(xù)性及完整性,管理模式單一
目前的農(nóng)業(yè)科技檔案,過于功利,且視野狹窄,僅將獲重要成果的項(xiàng)目申報(bào)材料,項(xiàng)目工作總結(jié),項(xiàng)目驗(yàn)收?qǐng)?bào)告,項(xiàng)目成果鑒定,項(xiàng)目獎(jiǎng)勵(lì)證明等資料歸檔,而對(duì)傾注于大量人力物力,掌握了眾多真實(shí)數(shù)據(jù),但由于種種原因?qū)е率〉捻?xiàng)目資料不予歸檔。不仔細(xì)分析原因,認(rèn)識(shí)不到失敗的項(xiàng)目亦存在重大的研究?jī)r(jià)值,無視前車之鑒、后車之師之理,存喜不存憂,收集檔案的視野缺乏完整性。
農(nóng)業(yè)科研因受自然條件和生態(tài)系統(tǒng)的影響,農(nóng)業(yè)科研檔案的形成周期長(zhǎng),干擾因素多,收集難度大,導(dǎo)致收集的內(nèi)容易缺乏連續(xù)性。
正由于缺乏完整性及連續(xù)性,在利用檔案進(jìn)行分析統(tǒng)計(jì)時(shí),可能出現(xiàn)奇點(diǎn),找不到極值點(diǎn)(即最優(yōu)解)。這將直接影響其價(jià)值信息的分析和利用。
現(xiàn)階段,農(nóng)業(yè)科技檔案載體仍然以紙質(zhì)為主,雖說有少量的資料儲(chǔ)存于計(jì)算機(jī)上,但缺乏數(shù)據(jù)分析及數(shù)據(jù)挖掘缺乏安全屏障。隨著農(nóng)業(yè)由“平面式”向“立體式”發(fā)展,由“農(nóng)場(chǎng)式”向“公園式”發(fā)展,由“自然式”向“設(shè)施式”發(fā)展,農(nóng)業(yè)科研內(nèi)容不斷增多,便于攜帶的紙質(zhì)二維圖和三維圖頗受人們青睞,采摘體驗(yàn)效果圖,設(shè)施布局景觀圖頗受人們追捧,這樣必將導(dǎo)致紙質(zhì)檔案所需存儲(chǔ)空間越來越大,傳統(tǒng)的單純紙質(zhì)檔案的管理顯然跟不上時(shí)代的步伐。
3.2檔案管理服務(wù)缺乏共享機(jī)制
過去的檔案工作是你需要什么,我?guī)湍悴檎沂裁?,其余不管。檔案工作人員決不越雷池半步。這種模式即將被時(shí)代拋棄。
在大數(shù)據(jù)時(shí)代,檔案管理人員應(yīng)扮演信息專家的角色。應(yīng)能根據(jù)用戶需求,依系統(tǒng)論、信息論、控制論、耗散結(jié)構(gòu)輪的思想,利用數(shù)理統(tǒng)計(jì)、數(shù)據(jù)挖掘、排隊(duì)分析等工具,快速尋找出有價(jià)值的信息滿足用戶,同時(shí)還應(yīng)具備三種能力。 “一是具備數(shù)學(xué)知識(shí)為數(shù)據(jù)集構(gòu)模;二是具備過程技能建成數(shù)據(jù)模型分析系統(tǒng);三是發(fā)現(xiàn)見解,從數(shù)據(jù)中講出故事來”。不僅如此,檔案管理人員還應(yīng)熟悉本單位的業(yè)務(wù),能以市場(chǎng)為導(dǎo)向,以效益為準(zhǔn)則,給本單位提出科研建議,讓科研更接地氣,讓科研活動(dòng)發(fā)出勃勃生機(jī)。
4大數(shù)據(jù)背景下農(nóng)業(yè)科技檔案的管理
近年來,有學(xué)者提出了“加快云計(jì)算與大數(shù)據(jù)處理技術(shù)研究與農(nóng)業(yè)應(yīng)用,開發(fā)農(nóng)業(yè)大數(shù)據(jù)庫(kù)管理系統(tǒng)”的建議。亦有學(xué)者提出了農(nóng)業(yè)數(shù)據(jù)挖掘系統(tǒng)的構(gòu)建方案,對(duì)于通過數(shù)據(jù)技術(shù)來進(jìn)一步提升農(nóng)業(yè)信息服務(wù)水平具有一定意義。
這些已說明學(xué)者們已經(jīng)察覺到高科技在農(nóng)業(yè)中的作用,已肯定了大數(shù)據(jù)是農(nóng)業(yè)科研不可或缺的平臺(tái)。認(rèn)識(shí)到只有依靠高科技手段,運(yùn)用大數(shù)據(jù)儲(chǔ)存,運(yùn)用云計(jì)算處理,運(yùn)用數(shù)據(jù)挖掘發(fā)現(xiàn),才能解決農(nóng)業(yè)科研中的農(nóng)業(yè)信息資源的問題。農(nóng)業(yè)科技檔案是農(nóng)業(yè)信息資源,如何在大數(shù)據(jù)背景下進(jìn)行農(nóng)業(yè)科技檔案管理是亟待解決的問題。
4.1提升檔案管理的“價(jià)值鏈”,注重科技檔案價(jià)值綜合評(píng)價(jià)
感知用戶需求,拓展檔案數(shù)據(jù)服務(wù)內(nèi)涵,實(shí)施個(gè)性化農(nóng)業(yè)科技檔案管理。依據(jù)省部級(jí)、地級(jí)、縣級(jí)不同的項(xiàng)目層次,提供不同的特色服務(wù),形成不同的項(xiàng)目檔案管理的“價(jià)值鏈”,即“收集、整理、分類、存貯、統(tǒng)計(jì)、保管、檢索、匯編加工,開發(fā)利用”的綜合體。
用動(dòng)態(tài)生成的觀點(diǎn)審視價(jià)值鏈,檔案管理的每一個(gè)步驟都環(huán)環(huán)相扣,缺一不可。只有做好每一步的工作,才能使整個(gè)價(jià)值鏈熠熠生輝,同時(shí),完善的價(jià)值鏈能提升檔案管理的核心競(jìng)爭(zhēng)力。
利用大數(shù)據(jù),可以發(fā)現(xiàn)用戶需求,統(tǒng)計(jì)需求量最高的項(xiàng)目,從而提供優(yōu)質(zhì)服務(wù),提高檔案利用者的滿意度與忠誠(chéng)度。同時(shí)應(yīng)注重對(duì)科技檔案的價(jià)值評(píng)價(jià)。
對(duì)科技檔案的價(jià)值評(píng)價(jià),應(yīng)考慮技術(shù)因素、作者因素、史科因素和查考因素。同時(shí),又將這些指標(biāo)分為分指標(biāo);不同層次,如下所示。
科技檔案水平技術(shù)因素科學(xué)意義創(chuàng)新程度經(jīng)濟(jì)效益作者因素著名專家合資項(xiàng)目科研單位史科因素科技發(fā)展自然界發(fā)展文物收藏查考因素經(jīng)濟(jì)活動(dòng)科技決策科技干部考核實(shí)物結(jié)構(gòu)查真endprint
只有不同層次的考查才能使科技檔案更具價(jià)值。
4.2建立農(nóng)業(yè)科技檔案數(shù)據(jù)庫(kù),注重?cái)?shù)據(jù)挖掘
農(nóng)業(yè)科技檔案數(shù)據(jù)庫(kù)是收集面向生態(tài)農(nóng)業(yè)、信息農(nóng)業(yè)、主體農(nóng)業(yè)、微農(nóng)業(yè)等方面的數(shù)據(jù),集天下農(nóng)業(yè)數(shù)據(jù)之大成。它能反映不同時(shí)間、不同地域、不同態(tài)勢(shì)的農(nóng)業(yè)信息。數(shù)據(jù)庫(kù)能使原始記錄更詳細(xì)、更全面地反映農(nóng)業(yè)科研活動(dòng)的過程及其現(xiàn)實(shí)狀況,能反映出歷史變化,具備很高的準(zhǔn)確性。
數(shù)據(jù)挖掘在農(nóng)業(yè)科技檔案管理中發(fā)揮著不可替代的作用。在數(shù)據(jù)庫(kù)系統(tǒng)提供有效支持的前提下,數(shù)據(jù)挖掘利用人工智能和模式識(shí)別的思想,通過市場(chǎng)數(shù)據(jù)分析進(jìn)行用戶需求挖掘。及時(shí)調(diào)整糧食作物與經(jīng)濟(jì)作物的種植比例,及時(shí)發(fā)布農(nóng)業(yè)病蟲害的預(yù)防及處理信息。對(duì)農(nóng)業(yè)生產(chǎn)進(jìn)行控制監(jiān)測(cè),盡力減少農(nóng)業(yè)成本,減少自然災(zāi)害給農(nóng)業(yè)帶來的損失。同時(shí)對(duì)農(nóng)產(chǎn)品利潤(rùn)進(jìn)行最大化系統(tǒng)設(shè)計(jì),力爭(zhēng)讓農(nóng)業(yè)科研為農(nóng)業(yè)生產(chǎn)和銷售服務(wù),為農(nóng)民創(chuàng)收出謀劃策,達(dá)到社會(huì)效益與經(jīng)濟(jì)效益雙贏。
4.3利用運(yùn)籌學(xué)來進(jìn)行農(nóng)業(yè)科技檔案信息優(yōu)化,保障檔案安全
運(yùn)籌學(xué)主要是利用統(tǒng)計(jì)學(xué)和數(shù)學(xué)模型等方法,尋找復(fù)雜問題中的最佳解答??衫眠\(yùn)籌學(xué)中組合優(yōu)化問題進(jìn)行檔案信息優(yōu)化(即在最優(yōu)解存在的情況下,從有限個(gè)可行方案中選擇最優(yōu)方案),如利用組合優(yōu)化中的背包問題,進(jìn)行紙質(zhì)檔案材料的收集。
將存放紙質(zhì)檔案的檔案材料柜看作是背包,待裝入的檔案具有不同的體積,以及不同的價(jià)值。成功的是經(jīng)驗(yàn),失敗的是教訓(xùn),都能給人提供借鑒。問題是選擇哪些內(nèi)容的檔案裝入柜中,能使價(jià)值最大,這里需要用到背包問題的數(shù)學(xué)模型。
·假設(shè)我們要從眾多紙質(zhì)檔案中選擇若干卷宗裝滿檔案柜。
·若有n個(gè)不同的卷宗,對(duì)于卷宗j其體積為Wj,價(jià)值為Pj,W是檔案柜承受的最大體積。
·背包問題就是在要在不超過檔案柜承受體積的前提下,使裝入檔案柜的卷宗價(jià)值最大。
其數(shù)學(xué)模型為:
max∑nj=1PjXj
s.t∑nj=1WjXj≤W
Xj=0或1;j=1,2,……n
Xj=1, 卷宗j被選入0,其他
檔案信息優(yōu)化應(yīng)以用戶本位為準(zhǔn)則,即當(dāng)用戶利益與單位利益發(fā)生沖突時(shí),應(yīng)當(dāng)優(yōu)先考慮個(gè)人利益。
在檔案服務(wù)的過程中,可利用計(jì)算機(jī)聽覺和計(jì)算機(jī)視覺技術(shù),如“機(jī)器視覺、人臉識(shí)別、掌紋識(shí)別、專家系統(tǒng)、自動(dòng)規(guī)劃、智能控制、圖像理解”等功能,依農(nóng)業(yè)科技檔案不同的密級(jí)規(guī)定,分層次設(shè)置不同的門檻,保障檔案資料的安全。
綜上所述,大數(shù)據(jù)、云計(jì)算和數(shù)據(jù)挖掘三大科技,為農(nóng)業(yè)科技檔案的收集和管理開辟了新的天地,為檔案管理人員提升自身綜合素質(zhì),提高工作效率指明了方向。用綜合評(píng)價(jià)提升檔案管理的價(jià)值鏈,用數(shù)據(jù)挖掘在數(shù)據(jù)庫(kù)里發(fā)現(xiàn)寶藏,用運(yùn)籌學(xué)將信息優(yōu)化,用人工智能保障信息安全,達(dá)到績(jī)效機(jī)制達(dá)到信息共享。力爭(zhēng)在盡短的時(shí)間內(nèi),讓我國(guó)的農(nóng)業(yè)科技檔案管理屹立于世界科技檔案管理之林。
參考文獻(xiàn)
[1]張淑芳.淺議“大數(shù)據(jù)”時(shí)代下的電子檔案建設(shè)趨勢(shì)[J].檔案管理,2013,(6).
[2]鄧愛華.大數(shù)據(jù)時(shí)代來臨,你準(zhǔn)備好了嗎?[J].科技潮,2012,(9):55.
[3]王敬儒.我國(guó)農(nóng)業(yè)信息化發(fā)展的瓶頸與應(yīng)對(duì)策略思考[J].中國(guó)科學(xué)院院刊,2013,(5):337343.
[4]梁川,王文生,謝能付.農(nóng)業(yè)信息資源上數(shù)據(jù)挖掘的應(yīng)用[J].中國(guó)農(nóng)學(xué)通報(bào),2009,25(11):243247.endprint