陸 珊 朱碧琴
(湖南環(huán)境生物職業(yè)技術學院,湖南 衡陽 421001)
油茶作為一種木本油料,主要生長在我國南方,在鼓勵政策的扶持下,我國幾個油茶產區(qū)的發(fā)展均較為迅速。加上農業(yè)科技輔助,集中量產和定產都具有其一定的優(yōu)勢。油茶種植又帶動了周邊產業(yè)的發(fā)展,形成了油茶種植、加工、銷售等產業(yè)鏈條,有效帶動了農村經濟的發(fā)展。規(guī)?;挠筒璁a業(yè)不但形成了輻射周邊的油茶經濟圈,而且可以帶動旅游、環(huán)保等相關產業(yè),打造成具有濃郁鄉(xiāng)土氣息的油茶經濟帶,造福一方。雖然油茶經濟具有若干的優(yōu)勢,但是并不一定適合全國各地,而且盲目地建設新項目,存在較大的風險,需要專業(yè)的團隊進行細致地調研,提出科學建議。為了深入地分析,科學地評判,大數(shù)據(jù)分析是一種實用、對路的好工具。大數(shù)據(jù)分析是建立在海量數(shù)據(jù)基礎上的分析與評判,兼顧了同業(yè)數(shù)據(jù)、周邊數(shù)據(jù)、歷史數(shù)據(jù)、成功案例、失敗教訓等多方面信息,以特定的運算規(guī)則進行深度計算,得出建立在充分數(shù)據(jù)基礎上的可信數(shù)據(jù),是一種廣泛應用的尖端科技成果。將大數(shù)據(jù)分析應用于油茶產業(yè)的經濟發(fā)展規(guī)劃,可以深度挖掘歷史數(shù)據(jù),同時匯總類似產地經驗,并在該基礎上得出方向性的建議。大數(shù)據(jù)分析技術代替了農業(yè)專家的調研職能,有助于農業(yè)經濟發(fā)展。
互聯(lián)網(wǎng)信息包羅萬象,其中關于縣域油茶產業(yè)的相關信息才是大數(shù)據(jù)處理分析的有用信息,需要進行刪選和甄別。該文將大數(shù)據(jù)分為傳統(tǒng)數(shù)據(jù)、感知數(shù)據(jù)和網(wǎng)絡數(shù)據(jù)。。在傳統(tǒng)的規(guī)劃發(fā)展中,傳統(tǒng)數(shù)據(jù)作為數(shù)據(jù)集合的主力軍,其優(yōu)勢為在時間和空間2 個方面非常準確地表現(xiàn)出一定區(qū)域的特點,但是該優(yōu)勢在實際操作中體現(xiàn)得并不充分。對空間布局說,還要講求視覺審美以及空間構造。數(shù)據(jù)缺乏人的行動能力和空間構造能力。那么,對這種比較靈活的規(guī)劃來說,人的影響因素也是必須要考慮的一部分。
考慮到數(shù)據(jù)分析計算中所使用的油茶產業(yè)數(shù)據(jù)的完整度和準確度,在其產量因素的數(shù)據(jù)收集時,主要采用的是2017—2021 年浙江、江西、廣東、湖南等幾個省份的油茶生產數(shù)據(jù)。經過整理發(fā)現(xiàn),從2017—2021 年,這幾個省份的油茶產量占全國總產量的絕大部分,因此對這些地區(qū)和時間段數(shù)據(jù)的分析具有代表性,可以真實地反映出縣域油茶產業(yè)經濟發(fā)展的狀況和趨勢。為了能夠綜合評價油茶產業(yè)經濟的增長潛力,在數(shù)據(jù)對象中增加了影響經濟增長規(guī)模的油茶產量數(shù)據(jù)、種植面積、疏林地、灌木林地等數(shù)據(jù),以便從多個角度統(tǒng)計數(shù)據(jù),對油茶產量影響因素進行定量分析。
充足的林地資源是保障油茶產業(yè)發(fā)展的基礎,因此針對油茶產業(yè)的研究,有針對性地選擇森林資源豐富的省份。根據(jù)《中國林業(yè)統(tǒng)計年鑒》,油茶林地資源情況匯總于表1。
表1 縣域油茶林地資源表(單位:hm2)
在該研究中,影響生產的因素一般分為2 類,其中,基本的影響因素主要有自然資源、地理位置、氣候等對生產場合發(fā)生影響的因素;此外,人文環(huán)境也會對油茶產業(yè)經濟發(fā)展造成影響,是潛在的重要影響因素,例如縣域基礎公共設施、農業(yè)專家的技術支持、地區(qū)平均收入水平等,這些因素都會直接或間接,地作用于油茶產業(yè)的發(fā)展狀況。因此在核定大數(shù)據(jù)處理的信息范圍時,需要充分地采集各方面信息,形成多維度、多角度、豐富的數(shù)據(jù)處理基礎。
完成數(shù)據(jù)采集后,核心功能是對這些數(shù)據(jù)按照設計的算法進行計算。計算功能模塊如圖1 所示。
圖1 計算功能模塊流程圖
數(shù)據(jù)錄入是分析處理的基礎環(huán)節(jié),在上一步確定的數(shù)據(jù)采集范圍內,設置相應的數(shù)據(jù)導入接口,有序調用數(shù)據(jù)。鑒于多地域歷年數(shù)據(jù)存在形式不統(tǒng)一,數(shù)據(jù)庫繁雜的情況,需要在數(shù)據(jù)錄入環(huán)節(jié)設計兩種接口:針對歷史孤立數(shù)據(jù)的文件導入接口;針對網(wǎng)絡標準數(shù)據(jù)的平臺數(shù)據(jù)調用接口。數(shù)據(jù)通過錄入環(huán)節(jié)進入大數(shù)據(jù)分析處理的統(tǒng)一數(shù)據(jù)庫中,實現(xiàn)了數(shù)據(jù)準備,下一步需要對數(shù)據(jù)進行處理。分析過程分為預處理和處理2 個環(huán)節(jié)。其中預處理的目的是在紛雜的海量數(shù)據(jù)中發(fā)現(xiàn)有用的數(shù)據(jù),即去偽存真的過程;處理則是對有用的數(shù)據(jù)按照特定的算法運算,找到其中的規(guī)律性內容。
數(shù)據(jù)預處理采用聚類算法,如公式(1)所示。
式中:為聚類中偏離量;為聚類所有數(shù)據(jù)的均值;為樣本歐氏距離;為該聚類的中心;為樣本數(shù)量。
算法流程如下:對所有數(shù)據(jù)類型分類處理;針對每類計算其平均值;用該平均值替換各聚類中心的數(shù)值;在限定迭代次數(shù)內重復計算,如果該計算結果與聚類中心的值差小于設定閾值,則終止計算并儲存結果,否則繼續(xù)計算。數(shù)據(jù)預處理后,形成了縮減后的數(shù)據(jù)集合。這些數(shù)據(jù)集合從不同的方面體現(xiàn)了油茶產業(yè)經濟發(fā)展的特點與趨勢,作為后續(xù)分析提煉的基礎,因此需要按照設計的格式與順序儲存,以便后續(xù)調用。為保證數(shù)據(jù)集合的有效性,需要對數(shù)據(jù)的空位、唯一性和組合關系進行檢查,保證數(shù)據(jù)正確??瘴粰z查主要是檢查在一組數(shù)據(jù)中心,是否有某一個屬性數(shù)據(jù)的數(shù)值是無效的,如果出現(xiàn)了空位,就會自動填充。唯一性檢查是檢查這組數(shù)據(jù)的屬性是不是唯一的,如果同組數(shù)據(jù)中有不同屬性的數(shù)據(jù),那么會自動清除,并補充一個具有相同屬性的數(shù)據(jù)。組合關系檢查的工作主要在于對空間化的數(shù)據(jù)進行關系檢測,偵測數(shù)據(jù)前的鏈接是不是符合軟件的計算標準。完成數(shù)據(jù)有效性檢查后,即進入核心的數(shù)據(jù)分析處理環(huán)節(jié)。數(shù)據(jù)處理主要依靠面板模型。經過檢驗方式選取最恰當?shù)挠嬎惴绞健?/p>
檢驗方式如公式(2)所示。
式中:P為第種影響因素的影響效果;x為該因素的發(fā)生概率;λ為該因素影響效果的加權因子;n代表該因素的影響頻次;γ代表該因素的影響因子;代表影響因素的總數(shù)量,即有效數(shù)據(jù)集合的總數(shù)。
通過計算每種影響因素所形成的的影響效果,加之影響因子的正向或負向定義,綜合考慮了各參與因素對發(fā)展規(guī)劃的作用與影響,形成具有綜合指導意義的影響效果集合{P},在該集合中代入待規(guī)劃縣的現(xiàn)實數(shù)據(jù),并對各影響因素的結果按照降序排列,即可得到大數(shù)據(jù)計算結果。
上步獲得的計算結果是建立在同業(yè)縣的歷史數(shù)據(jù)基礎上的分析判斷結果,直接用于指導待規(guī)劃縣的未來發(fā)展狀況有失偏頗,需要對數(shù)據(jù)進行動態(tài)修正。建立精細優(yōu)化策略工具箱為大數(shù)據(jù)算法提供參考。精細優(yōu)化工具箱是一個紐帶,它將遇到的問題、中期的分析以及所采取的應對措施連接為一個整體。優(yōu)化策略工具箱有4 種功能:初期數(shù)據(jù)分析、數(shù)據(jù)庫提取、數(shù)值評價與策略優(yōu)化。其中初期數(shù)據(jù)分析是對問題進行數(shù)據(jù)挖掘,分析角度設定為對油茶產量的4 個基本要素,從主要方面到次要方面,從屬性到數(shù)量進行全方位分析,包括設定位置林地的面積、空間形態(tài)以及土質狀態(tài)。針對一個地方的優(yōu)化策略,由于基礎不同,其初期對應的問題不盡相同,因此必須進行優(yōu)化。
在數(shù)據(jù)庫提取的工作過程中,初期的問題分析已經將方案問題屬性傳送過來,根據(jù)當前的數(shù)據(jù)庫儲存量,從數(shù)據(jù)庫中選擇足夠解決問題的相對應數(shù)據(jù),并提取出來,打包送往下一部分處理。前文提及關于縣域油茶的數(shù)據(jù),主要分為傳統(tǒng)數(shù)據(jù)、感知數(shù)據(jù)和網(wǎng)絡數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)主體為各縣統(tǒng)計部門的歷史記錄,以及農業(yè)部門的檔案信息;感知數(shù)據(jù)主體為通過調查、收集整理到的樣本量數(shù)據(jù),是調查取樣和走訪獲取到的相關產業(yè)的運營數(shù)據(jù),需要經過分析整理才能使用;網(wǎng)絡數(shù)據(jù)主要為相關產業(yè)線上銷售的關聯(lián)數(shù)據(jù),以及客戶的評價信息。為了提高分析結果的精準性,需要不斷完善數(shù)據(jù)庫。
在評價環(huán)節(jié)中,針對縣域油茶產業(yè)進行分析。工具箱最終給出的評估內容主要包括林地選址、勞動力規(guī)劃、交通情況、氣候條件以及產品供需關系等。在該環(huán)節(jié)中,通過對比其他省市縣級單位的油茶產業(yè)數(shù)據(jù),查找本縣的實現(xiàn)情況與成功案例之間的差異,并在結果中對差異點逐項進行對比,在該縣開展油茶生產,以及相關配套產業(yè)的開發(fā)中,有多少資源可以聯(lián)合利用,又有什么方面會形成沖突,造成該縣的油茶產業(yè)不利的發(fā)展條件,都在評價環(huán)節(jié)中綜合評判。并且,任何事情不是一成不變的,在歷史時期能夠促進油茶產業(yè)發(fā)展的要素中的數(shù)據(jù)時利好要素,相關的行業(yè)背景、市場飽和度都會對判斷結果產生影響。因此,需要在判斷與評價中,充分利用大數(shù)據(jù)分析的全面性,結合各方面要素,并對該縣的實際情況各項背景信息加權處理,留出適當?shù)脑6?,使評價結果在限定的合理區(qū)間內具有自由度,評價結果才有現(xiàn)實意義。最后,在顯示端給出具體的結果評估文件,正式提出優(yōu)化策略。經過大數(shù)據(jù)采集準備、數(shù)據(jù)計算分析和策略修正,完成了縣域油茶產業(yè)經濟發(fā)展規(guī)劃分析,取得了結合該縣實際情況的油茶產業(yè)經濟發(fā)展規(guī)劃建議,完成了發(fā)展規(guī)劃分析。
為了證明所設計的縣域油茶產業(yè)經濟發(fā)展規(guī)劃分析工具能夠計算出正確的結果,對縣域經濟發(fā)展起到推動作用,通過代入實際數(shù)據(jù)加以驗證。
歷史數(shù)據(jù)集如公式(3)所示。
本縣油茶產業(yè)的對應數(shù)據(jù)集如公式(4)所示。
殘差數(shù)列如公式(5)所示。
則絕對關聯(lián)度如公式(6)所示。
相對誤差序列如公式(7)所示。
式中:() 代表第項數(shù)據(jù)的原始值。
小誤差概率如公式(8)所示。
式中:代表計算過程。
均方差比值如公式(9)所示。
式中:是原始數(shù)列的方差,是殘差數(shù)列的方差。當上述參數(shù)數(shù)值都>0 且<表2 中的數(shù)據(jù)時,則分析工具的結果收斂,具有指導意義。
表2 精度參照表
設置該文的分析工具為實驗組,傳統(tǒng)分析方法為對照組,從表1 中隨機抽取數(shù)據(jù)進行對比計算。
對照組和試驗組的三次精度計算結果見表3。
由表3 可知,試驗組的三次計算結果精度等級都是1,并且其4 項參數(shù)的數(shù)值都比對照組的參數(shù)值更優(yōu)秀。證明所設計的基于大數(shù)據(jù)的縣域油茶產業(yè)經濟發(fā)展規(guī)劃分析工具在計算中形成了收斂的計算結果,與真實情況更為接近,表明該方法所分析的經濟發(fā)展規(guī)劃更符合實際情況,對規(guī)劃的預測是有效的。
表3 試驗結果表
縣級單位作為我國經濟發(fā)展的基層單元,面臨著資源少、特色不明顯、外部競爭激烈等很多難題,因此,在經濟發(fā)展的規(guī)劃中常常受到許多因素制約。通過采用先進的技術手段,對自身條件進行精準地分析,同時借鑒同等級其他縣城的成功經驗或失敗原因,可以少走彎路,更快速地帶領全縣人民脫貧致富。大數(shù)據(jù)分析處理技術作為一種新型的網(wǎng)絡化分析模式,具有強大的運算功能,能夠在海量數(shù)據(jù)中逐一排查并發(fā)現(xiàn)有價值信息,并通過設計合理的計算模型,方便快捷地找到復雜問題的解決途徑,有助于助力地區(qū)經濟的發(fā)展,形成別具一格的經濟發(fā)展路徑。該文從油茶產業(yè)經濟的角度嘗試了大數(shù)據(jù)分析的規(guī)劃指引能力,實現(xiàn)了第一階段的目標。后續(xù)還將深入研究,尋找更為準確的算法模型,并將其應用于地區(qū)發(fā)展的其他領域,指導規(guī)劃發(fā)展決策,為科學策劃提供一種高技術工具。