王光武, 周純玉, 賀寶華
(大連海洋大學, 沈陽 大連 116023)
關(guān)鍵字:遼寧12316;農(nóng)業(yè)大數(shù)據(jù);采集體系
農(nóng)業(yè)大數(shù)據(jù)是大數(shù)據(jù)理念、技術(shù)和方法在農(nóng)業(yè)領(lǐng)域的實踐。農(nóng)業(yè)大數(shù)據(jù)涉及到耕地、育種、播種、施肥、植保、收獲、儲運、農(nóng)產(chǎn)品加工、銷售、畜牧業(yè)生產(chǎn)等各環(huán)節(jié),是跨行業(yè)、跨專業(yè)的數(shù)據(jù)分析與挖掘。[1]遼寧“12316”金農(nóng)熱線始建于2005年,是國家“十一五”重點信息工程——“三電合一”在遼寧的推廣項目。平臺目的是為農(nóng)業(yè)、農(nóng)村和廣大農(nóng)民提供專業(yè)信息服務(wù)的資訊咨詢平臺。有效滿足了農(nóng)民群眾日趨多元化的信息需求。12316經(jīng)過多年的運營,已經(jīng)記錄了大量的農(nóng)業(yè)數(shù)據(jù),包括農(nóng)戶數(shù)據(jù)、農(nóng)產(chǎn)品價格數(shù)據(jù)等。未來隨著12316的進一步發(fā)展與壯大,將數(shù)據(jù)采集拓展到更多領(lǐng)域,不僅僅收集農(nóng)作物的耕地、播種、育種、施肥、植保、儲運、收獲、農(nóng)產(chǎn)品加工、銷售等農(nóng)業(yè)全生命周期的數(shù)據(jù),還會包含農(nóng)民自身生活方面息息相關(guān)的信息,如生產(chǎn)收入、消費、文化娛樂等數(shù)據(jù)。
12316就此打開了農(nóng)業(yè)大數(shù)據(jù)之門,為農(nóng)業(yè)生產(chǎn)、農(nóng)業(yè)科研、政府決策、涉農(nóng)企業(yè)發(fā)展等提供新方法、新思路。
1.接聽。用戶撥打12316進入本呼叫中心,通過自動語音分配系統(tǒng)分配到終端的話務(wù)員坐席。坐席接聽電話,同時在計算機上彈出用戶信息界面。如果用戶首次撥打則為采集界面,用戶若是二次以上撥打則顯示用戶具體詳細信息界面(比如:用戶地點、主要的種植產(chǎn)品、以前有過什么問題、解決問題的程度等信息)。
2.解答。話務(wù)員可以自主解答用戶提出的問題,當話務(wù)員對用戶提出的問題,無法做出滿意的答復,可通過瀏覽歷史記錄或查詢典型案例庫尋找相關(guān)問題的答案進行回答。
當用戶提出的問題在平臺上無法查到答案時,可以通過坐席平臺進行三方通話申請,以撥通專家電話,讓專家進行解答,同時把答案記錄到軟件平臺經(jīng)典案例系統(tǒng),以便其他日后話務(wù)員進行查詢。
3.記錄。用戶覺得滿意掛機時,結(jié)束通話。話務(wù)人員可同時采集用戶提問,并把案例記錄保存到案例數(shù)據(jù)庫中,方便日后相關(guān)業(yè)務(wù)查詢。
用戶咨詢結(jié)束后,咨詢記錄按不同的形式,采集到各相應(yīng)的數(shù)據(jù)庫中。數(shù)據(jù)庫對不同種類的數(shù)據(jù)進行分類統(tǒng)計,經(jīng)過審核后,數(shù)據(jù)可應(yīng)用在不同領(lǐng)域。
從話務(wù)數(shù)據(jù)類型上分,主要包括:案例數(shù)據(jù)、價格數(shù)據(jù)、供求數(shù)據(jù)、用戶數(shù)據(jù)4種。
從咨詢內(nèi)容上區(qū)分,主要包括:生產(chǎn)技術(shù)咨詢、市場行情資訊、政策法規(guī)咨詢、醫(yī)療健康咨詢、其他類咨詢5種。
從解決的程度上區(qū)分,分為普通案例、典型案例、效果案例、焦點案例4種。
將熱線產(chǎn)生的數(shù)據(jù)進行加工,形成不同的信息產(chǎn)品,應(yīng)用在不同的發(fā)布渠道中。
市場分析預測。主要是將熱線產(chǎn)生的價格信息,進行分析、加工,預測未來的農(nóng)產(chǎn)品價格走勢,對農(nóng)民進行市場性指導。該類信息通過審核后,可發(fā)布在熱線語音信箱、電視、廣播、網(wǎng)絡(luò)、平面媒體及微信平臺之中。
典型案例匯總。主要是將熱線產(chǎn)生的典型案例進行編輯整理,以豐富熱線的問題資源,更好地為后續(xù)農(nóng)民解答相關(guān)問題,同時典型案例還可編輯出版,同時應(yīng)用于熱線語音信箱、電視、廣播、網(wǎng)絡(luò)、平面媒體及微信平臺相應(yīng)的節(jié)目和欄目之中。
供求信息發(fā)布。通過整理核實的供求將通過熱線語音信箱、電視、廣播、網(wǎng)絡(luò)、平面媒體及微信平臺的形式對外發(fā)布,以尋求合作。
用戶信息。經(jīng)過整理核實之后,可配合調(diào)研和熱線宣傳服務(wù)之用。
12316金農(nóng)熱線建設(shè)十幾年來,各方面都取得了很大進步。尤其在平臺信息化建設(shè)方面,如平臺網(wǎng)絡(luò)構(gòu)建、系統(tǒng)優(yōu)化、平臺門戶網(wǎng)站以及擴大服務(wù)區(qū)域等方面,都取得了可觀的成績。隨著信息化技術(shù)的不斷發(fā)展,平臺也暴露出一些限制發(fā)展的問題。尤其是針對以應(yīng)用為驅(qū)動的農(nóng)業(yè)大數(shù)據(jù)方面,整體平臺還未達到農(nóng)業(yè)大數(shù)據(jù)應(yīng)用所需的要求。
為實現(xiàn)12316的大數(shù)據(jù)采集與分析,平臺在數(shù)據(jù)采集內(nèi)容上、采集標準及采集界面上,都需要進行增加與調(diào)整,例如:話務(wù)員正常打開的話務(wù)記錄頁面的設(shè)計。同時,設(shè)計還要考慮到數(shù)據(jù)的延伸問題,即當某一樣本記錄完成之后,根據(jù)具體問題情況可繼續(xù)搜尋周圍的樣本做延伸記錄,進而發(fā)現(xiàn)問題的普遍程度或嚴重程度等。
從近幾年熱線發(fā)展來看,熱線建設(shè)工作雖然得到了相關(guān)涉農(nóng)政府職能部門的大力支持與熱情參與,但是由于信息化工作體制缺少頂層設(shè)計與統(tǒng)籌規(guī)劃,有效建立與梳理機制不健全,不可避免地出現(xiàn)了各自為政、各司其職、建設(shè)分散的問題。導致子系統(tǒng)繁多,資源難以整合與數(shù)據(jù)無法共享的問題出現(xiàn)。所以必須建立高效的工作體系,才能保證國家各項惠農(nóng)政策的有效實施。
各節(jié)點單位在平臺開發(fā)方面,缺乏統(tǒng)一規(guī)劃,各自為政,導致平臺建設(shè)的重復率較高。表現(xiàn)在:對于信息化需求,各節(jié)點單位均單獨采購成型的信息化產(chǎn)品或者自行開發(fā),導致各子節(jié)點所管理的不同業(yè)務(wù)的信息系統(tǒng)越來越多,而各系統(tǒng)開發(fā)語言、運行環(huán)境、數(shù)據(jù)標準都僅適用本單位,這些異構(gòu)系統(tǒng)無法有效的結(jié)合統(tǒng)一起來,形成資源共享,造成重復建設(shè)。
數(shù)據(jù)割據(jù)造成的資源分散,部門間數(shù)據(jù)溝通效率低。不同系統(tǒng)之間,由于編碼、數(shù)據(jù)格式、應(yīng)用環(huán)境不同等原因,導致系統(tǒng)間無法互聯(lián)互通,數(shù)據(jù)資源難以有效共享。尤其是各系統(tǒng)還存在信息隔離、接口不公開等因素,客觀上造成了“信息孤島”的產(chǎn)生[2]。
由于各地區(qū)、各系統(tǒng)無法互聯(lián)互通,難以實現(xiàn)區(qū)域型的跨部門業(yè)務(wù)協(xié)作,面向公眾的互動和服務(wù)能力難以有效提升。借鑒當下統(tǒng)一門戶、統(tǒng)一數(shù)據(jù)的基礎(chǔ)平臺建設(shè)經(jīng)驗,首先建立完整統(tǒng)一的數(shù)據(jù)標準,并加強管理,嚴格要求各子節(jié)點單位遵循標準規(guī)范。通過基礎(chǔ)平臺的建設(shè),將打通各自節(jié)點各類應(yīng)用系統(tǒng),通過其統(tǒng)一數(shù)據(jù)、統(tǒng)一門戶、統(tǒng)一身份認證等子平臺,保證各類數(shù)據(jù)的及時性、準確性和共享性,為農(nóng)民農(nóng)村問題提供更加便捷、高效的服務(wù)。
在具體建設(shè)過程中,將以12316農(nóng)業(yè)綜合信息服務(wù)為切入點,以應(yīng)用驅(qū)動為根本目的,根據(jù)國家“創(chuàng)新、協(xié)調(diào)、綠色、開放、共享”的五大發(fā)展理念,注重創(chuàng)新精神,在體系、技術(shù)、服務(wù)和機制上積極改進與創(chuàng)新,努力推動12316農(nóng)業(yè)信息服務(wù)體系與大數(shù)據(jù)采集體系建設(shè)[3]。
為實現(xiàn)12316大數(shù)據(jù)應(yīng)用的目標,對平臺采集方面的改進原則主要有:一是要在大數(shù)據(jù)基礎(chǔ)之上構(gòu)建,從大數(shù)據(jù)的要求出發(fā);二是要精準設(shè)計,按照標準術(shù)語精準記錄。同時,系統(tǒng)還應(yīng)該實現(xiàn)通過農(nóng)戶咨詢的問題、記錄的數(shù)據(jù)等查詢,能夠?qū)⒆詣雍怂銓υ搯栴}全省的發(fā)生情況、趨勢判斷、預警分析,并以新窗口的方式彈出提示(輔助話務(wù)咨詢,或者給領(lǐng)導者顯示);同步彈出的還有相關(guān)的案例(來自于案例庫中)、知識點(來自于知識庫中)、適用專家列表等。待業(yè)務(wù)結(jié)束后,這些輔助彈出的窗口將自動關(guān)閉或手動關(guān)閉。
根據(jù)對農(nóng)業(yè)大數(shù)據(jù)進行需求分析,對原有采集內(nèi)容進行了改進,設(shè)計出了基于農(nóng)戶需求的12316大數(shù)據(jù)采集表,如表1所示。
表1 農(nóng)戶需求數(shù)據(jù)采集表
?
?
此表可以稱作總表,相關(guān)數(shù)據(jù)關(guān)聯(lián)采集表都是從此表中分離出來的。具體數(shù)據(jù)采集過程,如圖1所示:
圖1 數(shù)據(jù)采集過程
農(nóng)戶電話咨詢某一個問題,話務(wù)員在解答問題過程中要同時將該問題歸類,在大類問題中打開當期關(guān)注度最高、排位靠前的數(shù)據(jù)采集表進行詢問并做好記錄。例如,當農(nóng)戶咨詢病蟲害問題時,如果當期主要關(guān)注農(nóng)資價格問題,那話務(wù)員就可打開農(nóng)資數(shù)據(jù)采集表對該農(nóng)戶農(nóng)藥農(nóng)肥情況、使用數(shù)量及效果、購買價格等信息進行詢問并做好記錄。同時,話務(wù)員需要從中選取重要關(guān)鍵詞單獨登記,便于以后方便查詢分析。
通過上述咨詢中的數(shù)據(jù)采集,可以測算相關(guān)結(jié)果。例如:農(nóng)業(yè)生產(chǎn)中化學品使用程度;不同廠家和品牌的化學品使用效果;化學品施用與災害對應(yīng)情況等。
1.數(shù)據(jù)主頁。為每個農(nóng)戶建立一個數(shù)據(jù)主頁,通過表單式界面用以記錄基礎(chǔ)數(shù)據(jù)(包括收入水平、位置、地址、姓名、聯(lián)系方式等)和相關(guān)數(shù)據(jù)。例如在電話咨詢過程中的玉米數(shù)據(jù)采集,每個農(nóng)戶可能會有以此關(guān)聯(lián)出多個相關(guān)數(shù)據(jù)采集內(nèi)容,玉米是生產(chǎn)數(shù)據(jù)采集,還有收入數(shù)據(jù)采集、消費數(shù)據(jù)采集、生產(chǎn)投入數(shù)據(jù)采集、產(chǎn)地交易數(shù)據(jù)采集、生活習慣數(shù)據(jù)采集等??梢詫⑸鲜鲫P(guān)聯(lián)的內(nèi)容設(shè)計成系統(tǒng)采集表,通過基本數(shù)據(jù)采集時進行相應(yīng)的觸發(fā),以此達到多類數(shù)據(jù)采集的目的。例如收入、消費情況,初步設(shè)計分別如表2、表3所示:
表2 收入情況采集表
表3 消費情況采集表
2.邏輯設(shè)計(以化肥數(shù)據(jù)采集為例)。農(nóng)戶打進電話問玉米價格,根據(jù)農(nóng)戶的問題,在話務(wù)工作界面上選擇對應(yīng)的種類——玉米;在咨詢過程中,以關(guān)心的口吻主動詢問了解種的什么品種,種了多少畝,用了什么肥,效果怎么樣(可分解成A-產(chǎn)量增加多少,B-長勢如何),花了多少錢,村里多少人家在用,購買渠道是哪里等,填入表二;是否接受熱線推薦化肥(品類農(nóng)戶自選),是否需要貸款等,填入表三,如此類推。如果該農(nóng)戶數(shù)據(jù)已經(jīng)被近期采集,則該類數(shù)據(jù)按鈕呈現(xiàn)顏色變化;間隔時間較長的數(shù)據(jù),則用閃爍來表示緊急。
表1:可以在話務(wù)界面設(shè)置一個“數(shù)據(jù)”按鈕,默認為自動打開,打開后呈現(xiàn)為一個分類導航條,以生產(chǎn)為主,分為種植、養(yǎng)殖兩大系列,細分到品種;生活部分另加。
表2:選擇品類后立即彈出的表,是根據(jù)這種品類設(shè)計的關(guān)聯(lián)數(shù)據(jù)采集表。
表3:實際上是表2附加的部分,是指應(yīng)該填入的相關(guān)關(guān)系數(shù)據(jù),如是否需要貸款,農(nóng)戶用的手機、電視品牌,家里是否裝了寬帶等。
3.機制設(shè)計(如何讓農(nóng)戶接受并樂意報告)。農(nóng)戶基礎(chǔ)數(shù)據(jù)庫建立是農(nóng)村信用累積的基礎(chǔ),一是可以給與農(nóng)戶分值獎勵。農(nóng)民打電話獎勵積分,每次按時長賦分,累計分值可兌換手機充值;每采集一次數(shù)據(jù),獎勵積分若干;農(nóng)戶上報數(shù)據(jù),獎勵分值。二是可以設(shè)立農(nóng)村移動手機觀察員,一方面作為農(nóng)業(yè)數(shù)據(jù)提供者,定期將其生產(chǎn)生活數(shù)據(jù)進行上報,另一方面參與每年兩次的問卷調(diào)查,完成情況較好的觀察員每年可獲贈話費等獎勵。
4.相關(guān)數(shù)據(jù)庫。實際上也在整體數(shù)據(jù)庫之中。包含了大量長期收集距離較遠的相關(guān)數(shù)據(jù),如互聯(lián)網(wǎng)上與農(nóng)業(yè)生產(chǎn)相關(guān)的情況——股市、重大政策出臺、期貨、匯率、存款利率、失業(yè)率、GDP、涉農(nóng)信息總量變化、天氣氣象等。
5.圖片與視頻音頻嵌入方式。系統(tǒng)可以實現(xiàn)隨時隨機嵌入各種格式的文件,如音頻與視頻。比如,在農(nóng)戶頁面上可以嵌入其相關(guān)的咨詢錄音;或者打開轉(zhuǎn)發(fā)的視頻,做為佐證和參考(可通過微信,也可以通過致富通)。
1.采集樣本量推算。依托于12316業(yè)務(wù)運行,進行數(shù)據(jù)的采集。分為固定樣本采集和常規(guī)樣本采集。其中,固定樣本以月為周期,每人每天采集20個樣本,按100個座席規(guī)模計算,每月總樣本數(shù)約為6萬個;常規(guī)樣本以年為周期,以采集基本數(shù)據(jù)為主,通過不斷累加增加樣本數(shù)量規(guī)模,每人每天發(fā)展記錄新用戶5人,記錄老用戶20人,按100個座席規(guī)模計算,每年發(fā)展新樣本數(shù)量約為18萬個,記錄舊樣本數(shù)量約為72萬個,全國則分別為540萬個、2160萬個。
2.確定采集時間區(qū)間。根據(jù)數(shù)據(jù)特點不同,有些數(shù)據(jù)是短期采集的,有些數(shù)據(jù)需要長期跟蹤采集,還有一些數(shù)據(jù)是需要固定某一個時間段進行采集,因此應(yīng)制定數(shù)據(jù)的采集時間區(qū)間,根據(jù)需要確定采集的開始和結(jié)束時間[4]。例如采集玉米種植增減情況數(shù)據(jù)就是一個長期的工程,可以不斷地增加樣本量,增強數(shù)據(jù)力量;而比如8月份采集粘蟲的數(shù)據(jù),則限定了時間區(qū)間應(yīng)在8月這一個月。
3.標準術(shù)語編制。依托已有案例庫海量信息,分類整理各種術(shù)語,建立起一套標準體系,在此標準體系基礎(chǔ)上將原案例庫重新改造和命名,形成術(shù)語庫。這樣在隨后的咨詢服務(wù)或采集數(shù)據(jù)時,都可以與案例庫及時關(guān)聯(lián),彈出案例庫中相應(yīng)案例,以幫助回答問題等。
舉例:農(nóng)民問豬不咋吃食,落到文字上的術(shù)語就是豬“厭食”;再如玉米粘蟲害,H7N9禽流感等。
中國自古以來就是一個農(nóng)業(yè)大國。但是從整體農(nóng)業(yè)發(fā)展狀態(tài)來看,并非走在世界前列。充分利用農(nóng)業(yè)信息化手段,是實現(xiàn)農(nóng)業(yè)的現(xiàn)代化的最有效的出路。農(nóng)業(yè)大數(shù)據(jù)為農(nóng)業(yè)現(xiàn)代化提供了強大的推動力,農(nóng)業(yè)信息化為農(nóng)業(yè)大數(shù)據(jù)提供了有利的基礎(chǔ)保障[5]。對農(nóng)業(yè)生產(chǎn)活動產(chǎn)生的大量數(shù)據(jù)進行加工和清洗,得出的結(jié)論反饋與農(nóng)業(yè)生產(chǎn)中,提供科學的指導,使農(nóng)業(yè)生產(chǎn)更為精準有效,推動農(nóng)業(yè)現(xiàn)代化發(fā)展,形成良性循環(huán)。
遼寧12316金農(nóng)熱線的建設(shè),不僅僅只靠技術(shù)力量與日常的信息積累,還需要社會各界人士的廣泛積極參與,農(nóng)業(yè)專家、農(nóng)業(yè)大戶、科研院所、農(nóng)業(yè)院校、大學生村官等等,都是遼寧12316強有力的支撐。通過政府強有力的主導,商業(yè)企業(yè)的大力配合,運行商廣泛的支持,以及媒體的積極幫助,以此形成12316新時代的創(chuàng)新機制。