[摘 要]地物分析在城鄉(xiāng)規(guī)劃、土地利用管理及環(huán)境保護(hù)等領(lǐng)域具有重要意義。然而,傳統(tǒng)的人工方法在處理大規(guī)模遙感影像數(shù)據(jù)時(shí)存在效率低、成本高、精度不足等問(wèn)題。隨著人工智能技術(shù)的快速發(fā)展,其在遙感影像分類中的應(yīng)用為解決這些問(wèn)題提供了新的可能性。文章針對(duì)村鎮(zhèn)地物分析任務(wù),采用了7種經(jīng)典的人工智能模型進(jìn)行訓(xùn)練,并提出了一種集成方法對(duì)多模型結(jié)果進(jìn)行融合。試驗(yàn)結(jié)果表明,該方法具有99.05%的分類準(zhǔn)確率,顯著提高了分類精度,可為村鎮(zhèn)地物分析提供可靠的技術(shù)支持,也為城鄉(xiāng)規(guī)劃和土地管理等領(lǐng)域的決策提供了重要參考依據(jù)。
[關(guān)鍵詞]地物分析;人工智能;城鄉(xiāng)規(guī)劃;圖像分類
[中圖分類號(hào)]TG333 [文獻(xiàn)標(biāo)志碼]A [文章編號(hào)]2095–6487(2024)06–0138–03
Research on Remote Sensing Image Land Feature Classification Based on Artificial Intelligence
FENG Yong,F(xiàn)ENG Ming
[Abstract]Feature analysis is of great significance in areas such as urban and rural planning, land use management, and environmental protection. However, traditional manual methods have problems such as low efficiency, high cost, and insufficient accuracy when processing large-scale remote sensing image data. With the rapid development of artificial intelligence technology, its application in remote sensing image classification provides new possibilities for solving these problems. The article focuses on the task of analyzing rural land features, using 7 classic artificial intelligence models for training, and proposing an integrated method to fuse the results of multiple models. The experimental results show that this method has a classification accuracy of 99.05%, significantly improving the classification accuracy. It can provide reliable technical support for the analysis of rural land features and important reference basis for decision-making in the fields of urban and rural planning and land management.
[Keywords]feature analysis; artificial intelligence; urban and rural planning; image classification
在當(dāng)今社會(huì),隨著城市化進(jìn)程的不斷推進(jìn),對(duì)于村鎮(zhèn)建設(shè)的規(guī)劃與管理日益重要[1]。其中,地物分析作為村鎮(zhèn)建設(shè)中的關(guān)鍵環(huán)節(jié)之一,其對(duì)于提高土地資源利用效率、規(guī)劃城鎮(zhèn)布局、推動(dòng)鄉(xiāng)村振興等方面起著至關(guān)重要的作用。然而,地物識(shí)別在村鎮(zhèn)建設(shè)中的實(shí)現(xiàn)卻面臨著一系列的挑戰(zhàn)與難點(diǎn)。例如,由于村鎮(zhèn)地塊的復(fù)雜性和多樣性,傳統(tǒng)的地物識(shí)別方法通常難以滿足準(zhǔn)確性和效率性的要求。傳統(tǒng)的基于規(guī)則或特征工程的方法在處理不同尺度、光照條件、遮擋等問(wèn)題時(shí)表現(xiàn)欠佳,導(dǎo)致地物識(shí)別的精度難以達(dá)到實(shí)際需求。
為了應(yīng)對(duì)這一挑戰(zhàn),近年來(lái),深度學(xué)習(xí)技術(shù)作為一種強(qiáng)大的人工智能工具被引入到地物識(shí)別領(lǐng)域,并取得了顯著的進(jìn)展。深度學(xué)習(xí)技術(shù)以其優(yōu)秀的特征學(xué)習(xí)能力和模式識(shí)別能力,為地物識(shí)別提供了全新的解決方案。通過(guò)深度學(xué)習(xí)模型,系統(tǒng)可以自動(dòng)地學(xué)習(xí)和提取地物的抽象特征,從而實(shí)現(xiàn)對(duì)于不同地物類型的準(zhǔn)確識(shí)別。這種數(shù)據(jù)驅(qū)動(dòng)的方法不僅提高了地物識(shí)別的精度和魯棒性,同時(shí)也減輕了人工處理的負(fù)擔(dān),極大地提升了地物分析的效率和可行性。文章針對(duì)人工智能模型在村鎮(zhèn)建設(shè)地物分析中的應(yīng)用展開研究。
1 背景
1.1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)是專門用于處理圖像等網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的深度學(xué)習(xí)模型。通過(guò)卷積和池化操作,卷積神經(jīng)網(wǎng)絡(luò)能夠逐步提取輸入數(shù)據(jù)的特征,具備優(yōu)秀的特征學(xué)習(xí)和層級(jí)抽象能力,在計(jì)算機(jī)視覺(jué)任務(wù)中取得了較大成功。在地物識(shí)別領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)直接從原始數(shù)據(jù)中學(xué)習(xí)特征,避免了手工設(shè)計(jì)特征的繁瑣過(guò)程,為村鎮(zhèn)建設(shè)地塊識(shí)別提供了可行的解決方案。
1.2 視覺(jué)自注意力模型
視覺(jué)自注意力模型是一種深度學(xué)習(xí)模型,能夠處理圖像數(shù)據(jù)并捕捉全局上下文和長(zhǎng)距離依賴關(guān)系。與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)不同,其采用自注意力機(jī)制進(jìn)行計(jì)算,具有更好的并行性和可擴(kuò)展性。在地物識(shí)別中,其已顯示出與卷積神經(jīng)網(wǎng)絡(luò)相媲美甚至超越的性能,為村鎮(zhèn)建設(shè)地塊識(shí)別提供了有前景的解決方案。
1.3 卷積–注意力混合模型
近年來(lái),研究者們將卷積神經(jīng)網(wǎng)絡(luò)與視覺(jué)自注意力模型相結(jié)合,形成了卷積–注意力混合模型,以提高圖像處理任務(wù)性能。在這種混合模型中,卷積神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)提取局部特征,而視覺(jué)自注意力模型則捕捉全局信息和長(zhǎng)距離依賴關(guān)系,使模型能更全面地理解圖像內(nèi)容,提高識(shí)別任務(wù)的準(zhǔn)確性和魯棒性。在地物識(shí)別領(lǐng)域,這種混合模型表現(xiàn)良好,有望進(jìn)一步提高地塊識(shí)別的精度和效率。
2 方法
2.1 通用分類網(wǎng)絡(luò)
文章對(duì)現(xiàn)有分類模型進(jìn)行了廣泛的調(diào)研,并最終選定了7種神經(jīng)網(wǎng)絡(luò)模型用于村鎮(zhèn)建設(shè)地物分析任務(wù)。這些模型包括5種卷積神經(jīng)網(wǎng)絡(luò),即ResNet18、DenseNet121、InceptionV3、Xception和EfficientNet,以及一種視覺(jué)自注意力模型(Swin–Small)和一種卷積–注意力混合模型(ConvViT–Small)。
2.2 集成模型
在模型集成領(lǐng)域,常見的算法包括投票、堆疊、袋裝和提升等。投票算法通過(guò)組合多個(gè)模型的預(yù)測(cè)結(jié)果,通過(guò)投票來(lái)確定最終的預(yù)測(cè)結(jié)果;堆疊算法將多個(gè)模型的預(yù)測(cè)結(jié)果作為特征輸入到一個(gè)元模型中,進(jìn)行再次預(yù)測(cè);袋裝算法通過(guò)對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行有放回抽樣來(lái)訓(xùn)練多個(gè)模型,并將它們的預(yù)測(cè)結(jié)果進(jìn)行平均或投票;提升算法則通過(guò)迭代訓(xùn)練多個(gè)弱學(xué)習(xí)器,逐步提高模型性能。
文章采用了投票集成算法中的一種簡(jiǎn)單而有效的算法。具體來(lái)說(shuō),將每個(gè)模型對(duì)于每個(gè)樣本的預(yù)測(cè)概率進(jìn)行平均,得到最終的集成預(yù)測(cè)概率。然后,根據(jù)集成預(yù)測(cè)概率確定最終的分類結(jié)果。相比于單模型,文章所提集成算法具有以下優(yōu)勢(shì):提高整體的穩(wěn)健性和魯棒性及泛化能力,更好地適應(yīng)未見過(guò)的數(shù)據(jù)。
3 試驗(yàn)
3.1 數(shù)據(jù)集
文章使用了UCMercedLand–Use數(shù)據(jù)集,該數(shù)據(jù)集是一個(gè)常用于地物分類和土地利用分類的公開數(shù)據(jù)集之一。該數(shù)據(jù)集由21個(gè)地物類別組成,涵蓋了從城市到農(nóng)村等不同地區(qū)的高分辨率航拍圖像。該數(shù)據(jù)集包括多種不同的地物類型,如棒球場(chǎng)、工業(yè)區(qū)、居民區(qū)、河流、森林等。每個(gè)類別都包含100張尺寸為256×256像素圖像樣本,總共包含了2 100張圖像。將數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,樣本比例為60%∶20%∶20%。
3.2 評(píng)估指標(biāo)
文章采用了準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1分?jǐn)?shù)(F1)、Kappa分?jǐn)?shù)(Kappa)及馬修斯相關(guān)系數(shù)(MCC)等多種評(píng)估指標(biāo)來(lái)全面評(píng)估地物分類模型的性能。這些評(píng)估指標(biāo)能夠幫助文章深入了解模型在不同方面的表現(xiàn),從而更準(zhǔn)確地評(píng)估其在實(shí)際應(yīng)用中的可靠性和有效性。
3.3 超參數(shù)設(shè)置
文章使用了PyTorch Lightning框架進(jìn)行模型訓(xùn)練,其版本為2.1.2,PyTorch版本為1.13.1。并將批大小設(shè)置為32,學(xué)習(xí)率為3×10–4。此外,還實(shí)施了一個(gè)停止策略,即如果模型在驗(yàn)證集合上10個(gè)周期內(nèi)的準(zhǔn)確率沒(méi)有提升,則停止訓(xùn)練。所有試驗(yàn)均在一張英偉達(dá)3090Ti顯卡上完成。
3.4 結(jié)果分析
文章通過(guò)對(duì)7種不同模型進(jìn)行訓(xùn)練和評(píng)估,得到了它們?cè)诘匚锓诸惾蝿?wù)中的性能表現(xiàn)。模型性能評(píng)估見表1。
由表1可知,各個(gè)模型在不同的評(píng)估指標(biāo)上表現(xiàn)出了一定的差異性。例如,DenseNet121和Xception模型在準(zhǔn)確率和精確率上表現(xiàn)較好,而EfficientNetB0和ConvViT–Small模型在召回率和F1分?jǐn)?shù)上表現(xiàn)更優(yōu)。基于視覺(jué)自注意力的模型及卷積–自注意力混合模型相較于卷積模型在各個(gè)指標(biāo)上沒(méi)有明顯提升。這表明不同的模型在地物分類任務(wù)中具有不同的優(yōu)勢(shì)和特點(diǎn)。然而,更值得關(guān)注的是,文章基于這7種模型的集成模型的結(jié)果。由表1可知,集成模型在所有評(píng)估指標(biāo)上都表現(xiàn)出了最佳的性能,均達(dá)到了較高水平。集成模型的準(zhǔn)確率達(dá)到了99.05%,遠(yuǎn)高于單個(gè)模型的表現(xiàn)。這說(shuō)明通過(guò)多模型融合的方法,能夠顯著提升地物分類任務(wù)的性能。
8種不同的地物分類模型混淆矩陣如圖1所示。矩陣的對(duì)角線元素表示模型正確分類的樣本數(shù)量,非對(duì)角線元素則表示模型錯(cuò)誤分類的樣本數(shù)量。從圖1可以看出,集成模型在每個(gè)類別上的分類準(zhǔn)確性明顯優(yōu)于其他7種單模型。
盡管在試驗(yàn)中取得了一定的成果,但仍存在一些缺陷需要進(jìn)一步解決;①訓(xùn)練數(shù)據(jù)和實(shí)際鄉(xiāng)鎮(zhèn)遙感影像數(shù)據(jù)之間存在一定差別。雖然文章盡可能選擇了代表性的真實(shí)遙感影像數(shù)據(jù)集進(jìn)行訓(xùn)練,但由于地域和環(huán)境的不同,模型在實(shí)際應(yīng)用中可能面臨新的挑戰(zhàn)。②基于圖像分類的方法可能存在分類不夠細(xì)致的問(wèn)題。在實(shí)際應(yīng)用中,地物的分類可能需要更細(xì)致的劃分,如像素級(jí)分類。
4 結(jié)束語(yǔ)
通過(guò)在實(shí)際遙感影像數(shù)據(jù)集上進(jìn)行試驗(yàn),文章驗(yàn)證了提出的集成模型相較于單模型具有明顯更高的有效性。這表明多模型融合是一種有效的策略,可顯著提升地物分類任務(wù)的性能。在當(dāng)前社會(huì)發(fā)展和城鄉(xiāng)建設(shè)過(guò)程中,對(duì)地物分類技術(shù)的需求日益增加。文章所提模型不僅能夠提高地物分析的準(zhǔn)確性,還能為村鎮(zhèn)建設(shè)規(guī)劃、資源管理和環(huán)境保護(hù)等方面提供重要支持。文章的成果不僅在地物分類領(lǐng)域取得了顯著進(jìn)展,還對(duì)促進(jìn)村鎮(zhèn)建設(shè)和社會(huì)發(fā)展具有重要意義。
參考文獻(xiàn)
[1] 王陽(yáng),郭開明,蘇練練.關(guān)于國(guó)土空間規(guī)劃中城鄉(xiāng)建設(shè)用地統(tǒng)籌的思考[J].西安建筑科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,55(5):729-738.