左敏, 胡靜珺, 顏文婧, 王瑞東, 張青川, 范大維
1.北京工商大學(xué)農(nóng)產(chǎn)品質(zhì)量安全追溯技術(shù)及應(yīng)用國家工程研究中心,北京 100048
2.北京市房山區(qū)教師進(jìn)修學(xué)校,北京 102401
人類生理嗅覺系統(tǒng)十分復(fù)雜,氣味分子和嗅覺受體(ORs, olfactory receptors)在氣味感知表現(xiàn)中起著關(guān)鍵性作用。氣味分子與嗅覺受體結(jié)合并激活嗅覺受體,將氣味信號傳遞給大腦(Li et al.,2018),最終,人類對氣味信號的感知被轉(zhuǎn)化為相應(yīng)的描述性詞語(Lapid et al.,2011; Debnath et al.,2020;Francia et al.,2021)。受文化、語言和經(jīng)驗的影響,對于同一個氣味分子人們可能會使用不同的感知詞進(jìn)行描述(Majid et al., 2018)。因此,對氣味分子的氣味感知進(jìn)行預(yù)測是一項極具挑戰(zhàn)性的任務(wù)。為解決這個問題,近年來智能信息研究領(lǐng)域嘗試使用機器學(xué)習(xí)(ML, machine learning)方法構(gòu)建氣味感知預(yù)測模型(Keller et al., 2017),并獲得了較好的效果。
目前大多數(shù)的氣味感知預(yù)測模型都是從分子結(jié)構(gòu)出發(fā)預(yù)測氣味感知,該方式強烈依賴于分子表征(Pattanaik et al.,2020)。通常采用的方法是利用計算機表示方法對分子特征進(jìn)行描述,進(jìn)而構(gòu)建機器學(xué)習(xí)模型。Shang et al.(2017)基于氣味分子參數(shù)(MPs, molecular parameters),采用支持向量機(SⅤM, support vector machine)對1 026 個分子的10 種氣味感知實現(xiàn)了正確率為97.08%的預(yù)測。Li et al.(2018)同樣基于MPs,并采用隨機森林算法(RF, random forest)對DREAM(dialogue on reverse engineering assessment and methods)數(shù)據(jù)集進(jìn)行氣味感知回歸預(yù)測,氣味強度預(yù)測的皮爾遜相關(guān)性指標(biāo)達(dá)到了近似0.6。Kasyap et al.(2022)采用圖神經(jīng)網(wǎng)絡(luò)(GNNs, graph neural networks)提取分子結(jié)構(gòu)特征并在DREAM 數(shù)據(jù)集上進(jìn)行氣味感知多分類預(yù)測,模型的AUC指標(biāo)為0.89。
然而,從生理學(xué)機制上看,僅僅考慮分子物化特性無法對氣味感知的形成進(jìn)行解釋,相似的分子結(jié)構(gòu)可能產(chǎn)生不同的感知,而不同的分子結(jié)構(gòu)也可能會產(chǎn)生相同的感知。研究者已經(jīng)對人類嗅覺生理學(xué)機制進(jìn)行揭秘,發(fā)現(xiàn)激活的嗅覺受體是氣味感知產(chǎn)生的關(guān)鍵(Buck,2008)。目前只有少數(shù)研究基于氣味分子-嗅覺受體激活關(guān)系進(jìn)行氣味感知預(yù)測。Kowalewski et al.(2020)發(fā)現(xiàn),在氣味感知預(yù)測任務(wù)上,結(jié)合嗅覺受體激活特征對氣味分子進(jìn)行感知預(yù)測更具優(yōu)勢,可取得更好的效果。
本研究首先創(chuàng)新性地構(gòu)建了嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò),通過引入人類嗅覺受體蛋白之間的復(fù)雜關(guān)系來學(xué)習(xí)氣味分子和嗅覺受體之間的復(fù)雜非線性高維關(guān)系。其次,采用圖卷積網(wǎng)絡(luò),在分子拓?fù)浣Y(jié)構(gòu)和蛋白質(zhì)網(wǎng)絡(luò)結(jié)構(gòu)上提取氣味分子和嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)上的關(guān)鍵特征,在大規(guī)模氣味感知數(shù)據(jù)集DREAM 上實現(xiàn)對氣味感知的精準(zhǔn)預(yù)測。最后,基于預(yù)測的嗅覺受體激活信息,并結(jié)合模型正確決策的解釋性分析,對氣味分子-嗅覺受體活動-氣味感知之間的模式進(jìn)行分析,為人類嗅覺研究提供新的視角。
本研究首先基于人類嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)構(gòu)建嗅覺受體激活預(yù)測模型,通過圖卷積方法分別提取氣味分子和嗅覺受體蛋白的特征。其次,基于嗅覺受體激活預(yù)測模型的模擬結(jié)果,融合分子摩根指紋,基于DREAM 數(shù)據(jù)集實現(xiàn)對氣味感知的回歸預(yù)測。
工作流程如圖1所示。
圖1 氣味感知預(yù)測工作流程圖Fig.1 Olfactory perception prediction workflow diagram
1.2.1 嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)構(gòu)建本研究收集了43 個經(jīng)過生物實驗驗證的確定可以被特定配體激活的人類嗅覺受體(Ⅴassar et al.,1993; Mata‐razzo et al.,2005; Jacquier et al.,2006; Neuhaus et al.,2006; Braun et al.,2007; Fujita et al.,2007;Keller et al.,2007; Menashe et al.,2007; Schmiede‐berg et al.,2007; Cook et al.,2009; Saito et al.,2009; Jaeger et al.,2013; Topin et al.,2014; Shirasu et al.,2014),采用One-Hot編碼表示嗅覺受體蛋白氨基酸序列。嗅覺受體蛋白質(zhì)三級結(jié)構(gòu)信息有兩個不同的來源。經(jīng)過實驗驗證的結(jié)構(gòu)來自于Uniport 蛋白質(zhì)數(shù)據(jù)庫,未知的嗅覺受體蛋白質(zhì)三級結(jié)構(gòu)則采用AlphaFold 蛋白質(zhì)3D 結(jié)構(gòu)預(yù)測模型進(jìn)行預(yù)測。
嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)以嗅覺受體蛋白質(zhì)作為節(jié)點,其氨基酸序列作為節(jié)點特征,嗅覺受體蛋白質(zhì)三級結(jié)構(gòu)的相似關(guān)系作為邊。根據(jù)已獲得的嗅覺受體蛋白質(zhì)三級結(jié)構(gòu),本研究采用TMscore (template modeling score)方法計算蛋白質(zhì)之間的相似度。TM-score 是一種用于評估蛋白質(zhì)結(jié)構(gòu)拓?fù)湎嗨菩缘闹笜?biāo),通過比較兩個蛋白質(zhì)全局結(jié)構(gòu)的相似性來評估它們的匹配程度,其取值范圍介于0 到1 之間。TM-score 低于0.17 被認(rèn)為對應(yīng)于隨機選擇的不相關(guān)蛋白質(zhì)(Zhang et al.,2004),而大于0.5 則表示具有相似的折疊狀態(tài)(Xu et al.,2010)。 TM-score的計算公式為
其中Ltarget是目標(biāo)蛋白質(zhì)的氨基酸序列長度,Lcommom是在模板結(jié)構(gòu)和目標(biāo)結(jié)構(gòu)中均存在的殘基數(shù)量,dt是模板和目標(biāo)結(jié)構(gòu)中第t對殘基之間的距離,d0(Ltarget)是用來歸一化距離的距離尺度。獲得嗅覺受體蛋白質(zhì)三級結(jié)構(gòu)相似度后,可以構(gòu)建嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)。
1.2.2 蛋白質(zhì)圖卷積特征圖卷積(graph convo‐lution)是一種適用于處理具有節(jié)點間關(guān)聯(lián)關(guān)系的圖數(shù)據(jù)的卷積操作方法。在本研究中,嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)表示為Gp=(Vp,Ep),其中節(jié)點集合Vp表示嗅覺受體蛋白氨基酸序列集合,邊集合Ep表示嗅覺受體蛋白質(zhì)三級結(jié)構(gòu)之間的相似度集合。每個節(jié)點的特征向量定義為vp,vp∈Vp,邊的特征向量定義為ep,ep∈Ep。
嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)是通過對嗅覺受體蛋白氨基酸序列和嗅覺受體蛋白質(zhì)三級結(jié)構(gòu)相似度進(jìn)行編碼得到的。嗅覺受體蛋白氨基酸序列被編碼為一個具有20 種氨基酸和331 個序列位置的特征向量,其維度為[20,331],嗅覺受體蛋白質(zhì)三級結(jié)構(gòu)間相似度被編碼為一個維度為1 的特征向量。
蛋白質(zhì)圖卷積特征的構(gòu)建方法如下:
1.3.1 分子摩根指紋在本研究中,任意分子圖表示為Gm=(Vm,Em),其中節(jié)點集合Vm表示原子集合,邊集合Em表示化學(xué)鍵集合。每個原子的特征向量定義為vm,vm∈Vm,化學(xué)鍵的特征向量定義為em,em∈Em。
摩根指紋(Morgan fingerprints)方法是一種用于描述分子結(jié)構(gòu)的化學(xué)指紋方法。它基于分子的拓?fù)浣Y(jié)構(gòu),對于節(jié)點v通過遞歸遍歷分子的鄰居節(jié)點u∈Rv,Rv是與節(jié)點v相連的節(jié)點集合,并將鄰居節(jié)點的特征向量進(jìn)行累積求和。然后,將累積特征向量Fu與連接邊的信息Gu,v進(jìn)行異或操作,并通過哈希函數(shù)進(jìn)行映射,最終得到摩根指紋。摩根指紋計算公式
1.3.2 分子圖卷積指紋分子圖卷積指紋基于分子拓?fù)浣Y(jié)構(gòu)進(jìn)行分子特征提取,分子和化學(xué)鍵的特征基于原子符號、相鄰原子、相鄰氫原子、隱含價、芳香性以及化學(xué)鍵類型等進(jìn)行編碼。具體如表1所示。
表1 分子特征向量構(gòu)成Table 1 Molecular feature vector composition
對分子圖進(jìn)行圖卷積操作
1.4.1 SⅤM支持向量機(SⅤM, support vector machine)是一種常用的監(jiān)督學(xué)習(xí)算法,其基本原理是尋找一個最優(yōu)的超平面,將樣本空間分成兩個不同類別,并最大化樣本與超平面之間的間隔。對每一個樣本數(shù)據(jù),SⅤM決策函數(shù)
其中x是輸入樣本特征向量,WSVM是決策函數(shù)的權(quán)重矩陣,bSVM是偏置項,sign是符號函數(shù)。
1.4.2 ELM極限學(xué)習(xí)機(ELM, extreme learning machine)通過隨機初始化輸入層和輸出層之間的權(quán)重,然后利用解析解的方式直接計算隱藏層的權(quán)重。這使得ELM 能夠快速地訓(xùn)練神經(jīng)網(wǎng)絡(luò),并在很短的時間內(nèi)生成準(zhǔn)確的預(yù)測結(jié)果。對每一個樣本數(shù)據(jù),ELM決策函數(shù)
其中x是輸入樣本特征向量,HELM(x)是基于輸入特征計算得到的隱藏層輸出矩陣,WELM是輸出層到隱藏層的權(quán)重矩陣,bELM是偏置項。
1.4.3 XGBoostXGBoost 是一種基于梯度提升樹的集成學(xué)習(xí)算法。它通過迭代訓(xùn)練多個弱分類器(通常是決策樹),并將它們組合成一個強大的模型。對全部N個樣本數(shù)據(jù),XGBoost的目標(biāo)函數(shù)
其中LossXGB(yn,)是第n個樣本的損失函數(shù),yn是樣本n的標(biāo)簽,是樣本n的預(yù)測值,Ω(Φ)表示模型中的每個子模型的正則化項,Q是決策樹的個數(shù),γ是正則化系數(shù)。
1.4.4 BP 神經(jīng)網(wǎng)絡(luò)BP(back propagation)人工神經(jīng)網(wǎng)絡(luò)模型基于反向傳播算法,通過不斷調(diào)整網(wǎng)絡(luò)中連接權(quán)重和偏置,使網(wǎng)絡(luò)能夠?qū)W習(xí)輸入與輸出之間的高維非線性映射關(guān)系。
BP神經(jīng)網(wǎng)絡(luò)的標(biāo)準(zhǔn)前向傳播公式為
其中P表示訓(xùn)練樣本的個數(shù)。
基于奇異值分解(SⅤD, singular value decom‐position)的主成分分析(PCA, principal component analysis)是一種常用的降維技術(shù)。SⅤD-PCA 的優(yōu)點是可以處理高維數(shù)據(jù),并且對異常值具有較好的魯棒性。
給定一個數(shù)據(jù)矩陣XSP,首先對XSP進(jìn)行標(biāo)準(zhǔn)化處理獲得矩陣,使得每個特征均值為0,方差為1。然后,對標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣進(jìn)行SⅤD分解
其中C和O是由SⅤD計算得到的矩陣,S是由SⅤD得到的正交矩陣。
PCA 的結(jié)果是通過選擇奇異值及其對應(yīng)的左奇異向量來進(jìn)行降維。主成分矩陣可以通過以下公式計算得到
其中Z是降維后的數(shù)據(jù)矩陣。
2.1.1 數(shù)據(jù)庫1:氣味分子-嗅覺受體激活關(guān)系數(shù)據(jù)庫本文基于現(xiàn)有發(fā)表文獻(xiàn)建立氣味分子-嗅覺受體激活關(guān)系數(shù)據(jù)庫,所有數(shù)據(jù)都來自于截至在2023 年7 月之前Web of Science 數(shù)據(jù)庫中收錄的文獻(xiàn)。數(shù)據(jù)庫共收集了43 個人類嗅覺受體,以及它們對選定的170個化合物的254條激活關(guān)系和61條非激活關(guān)系數(shù)據(jù)。
2.1.2 數(shù)據(jù)庫2:氣味分子-氣味感知關(guān)系數(shù)據(jù)庫DREAM 數(shù)據(jù)集使用包括強度、愉悅度和熟悉度在內(nèi)的23 個感知定義氣味感知。數(shù)據(jù)集包括49 名健康參與者(沒有專業(yè)氣味感知訓(xùn)練)對476種氣味分子產(chǎn)生的21 種氣味感知數(shù)據(jù),評分范圍為0~100。本研究選用標(biāo)記為“高濃度”的數(shù)據(jù)共405 條。
嗅覺受體激活預(yù)測XGBoost 模型參數(shù)設(shè)置如表2所示。
表2 XGBoost模型參數(shù)調(diào)節(jié)范圍1)Table 2 Parameter adjustment range of XGBoost model
模型評價指標(biāo)選取準(zhǔn)確率(accuracy)、F1-score、受試者工作特征(ROC, receiver operating character‐istic curve)的曲線下面積(AUC, area under the curve)。
氣味感知預(yù)測模型訓(xùn)練采用5折交叉驗證,即將數(shù)據(jù)劃分為大致相等的5個子數(shù)據(jù)集,依次采用不同數(shù)據(jù)集作為訓(xùn)練集和測試集。取5次訓(xùn)練平均精度的平均值即得到模型精度,這樣得到的模型精度更具有泛化性。
氣味感知預(yù)測BP模型參數(shù)設(shè)置如表3所示。
表3 BP模型參數(shù)調(diào)節(jié)范圍1)Table 3 Parameter adjustment range of BP model
模型評價指標(biāo)選取R2-score、皮爾遜相關(guān)性、均方根誤差(RMSE, root mean square erro)。
本研究使用嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)中100%的相似度、前70%的相似度、前50%相似度網(wǎng)絡(luò)關(guān)系,獲取相關(guān)網(wǎng)絡(luò)性質(zhì)指標(biāo),并使用基于模塊度的社區(qū)發(fā)現(xiàn)算法分析網(wǎng)絡(luò)的模塊性(Blondel et al.,2008)。分析如表4所示。本研究基于相似度排名前50%的數(shù)據(jù)繪制出嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)圖(圖2)。使用相似度排名前50%的網(wǎng)絡(luò)呈現(xiàn)出明顯的3個子模塊,且不存在孤立節(jié)點。屬于同一模塊的嗅覺受體具有相似的蛋白質(zhì)結(jié)構(gòu),比如,圖2中嗅覺受體OR2J3 與OR2J2 同屬于一個社區(qū)模塊,同時,研究也證實它們是人類嗅覺受體中最為相似的嗅覺受體對之一(Crasto et al.,2002)。
表4 嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)概覽Table 4 Network overview of olfactory receptor protein relationship
圖2 嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)(前50%)Fig.2 Olfactory receptor protein relationship network (Top 50%)
分子的表征方式在化學(xué)領(lǐng)域中尚未形成統(tǒng)一的標(biāo)準(zhǔn),不同的表征方法各具優(yōu)勢和局限性。本文對氣味分子和嗅覺受體蛋白分別采用了兩種不同的特征提取方法,并進(jìn)行對比實驗。結(jié)果如表5所示。結(jié)果表明,當(dāng)分別使用圖卷積進(jìn)行分子特征和嗅覺受體蛋白氨基酸序列特征提取時,采用XGBoost 算法實現(xiàn)了最佳的嗅覺受體激活預(yù)測效果,準(zhǔn)確率為77%,F(xiàn)1-score 為0.78,AUC 值為0.77。4 種特征提取方式AUC 比較結(jié)果如圖3所示。
表5 不同分子特征提取方式組合在數(shù)據(jù)庫1上的準(zhǔn)確率、 F1-score和AUCTable 5 Accuracy, F1-score, and AUC of different feature extraction methods for database 1
圖3 不同特征提取方式組合的ROC曲線及AUC值Fig.3 ROC curves and AUC values of different feature extraction methods
基于圖卷積特征提取,本文采用XGBoost、SⅤM 以及ELM 3 種機器學(xué)習(xí)方法進(jìn)行嗅覺受體激活預(yù)測,并進(jìn)行對比實驗,結(jié)果如表6所示。實驗結(jié)果表明,XGBoost 算法在氣味分子-嗅覺受體激活關(guān)系數(shù)據(jù)庫上表現(xiàn)結(jié)果最優(yōu),準(zhǔn)確率為77%,F(xiàn)1-score 為0.78,AUC 為0.77。3 種分類器的嗅覺受體激活預(yù)測模型AUC比較結(jié)果如圖4所示。
表6 不同分類器的嗅覺受體激活預(yù)測模型在數(shù)據(jù)庫1的準(zhǔn)確率、F1-score和AUCTable 6 Accuracy, F1-score and AUC of olfactory receptor activation prediction models for different classifiers on database 1
圖4 不同分類器的嗅覺受體激活預(yù)測模型的ROC曲線和AUC值Fig.4 ROC curves and AUC values of olfactory receptor activation prediction models for different classifiers
本研究在嗅覺受體激活預(yù)測模型的基礎(chǔ)上,對DREAM 數(shù)據(jù)集中的化合物與43 個嗅覺受體的激活關(guān)系進(jìn)行預(yù)測,將獲得的新氣味分子-嗅覺受體激活關(guān)系作為分子特征應(yīng)用于氣味感知預(yù)測模型。在數(shù)據(jù)集和回歸預(yù)測模型相同的情況下,引入氣味分子-嗅覺受體激活關(guān)系進(jìn)行氣味感知預(yù)測結(jié)果明顯優(yōu)于僅基于分子結(jié)構(gòu)進(jìn)行氣味感知預(yù)測。實驗結(jié)果說明在進(jìn)行氣味感知預(yù)測時,考慮嗅覺受體的活動情況是必要的。實驗結(jié)果如表7所示。
表7 不同特征提取方式在DREAM數(shù)據(jù)集上的R2-score、 r和RMSETable 7 R2-score, r and RMSE on the DREAM dataset with different feature extraction methods
在3.3 節(jié)中,對于嗅覺受體激活預(yù)測任務(wù),圖卷積特征提取方法明顯優(yōu)于摩根指紋特征提取。然而,在本節(jié)的氣味感知預(yù)測任務(wù)中,摩根指紋方法表現(xiàn)更優(yōu)。這是由于圖卷積方法和摩根指紋方法對分子特征表達(dá)方式不同造成的。圖卷積方法基于圖結(jié)構(gòu)進(jìn)行特征提取,考慮了原子之間的連接關(guān)系,在捕捉分子的全局信息上具有優(yōu)勢。而摩根指紋根據(jù)分子的物理化學(xué)性質(zhì)進(jìn)行有效編碼,更擅長總結(jié)分子的理化特征(Cereto-Massagué et al.,2015; Duvenaud et al.,2015; Kipf et al.,2016)。
本研究通過嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò),整合了DREAM 數(shù)據(jù)集和氣味分子-嗅覺受體激活關(guān)系信息。采用基于奇異值分解的主成分分析方法對嗅覺受體在特定氣味感知中的貢獻(xiàn)進(jìn)行分析。嗅覺受體對21 種氣味感知的貢獻(xiàn)度歸一化后的結(jié)果如圖5所示。大部分嗅覺受體會對特定氣味感知產(chǎn)生較高的貢獻(xiàn)度(Audouze et al.,2014)。
圖5 嗅覺受體對氣味感知貢獻(xiàn)度Fig.5 Olfactory receptor contribution to olfactory perception
此外,本研究采用密度聚類算法(Campello et al.,2020),對來自DREAM 數(shù)據(jù)集的405 個氣味分子的43 個嗅覺受體激活特征進(jìn)行聚類,將分子分為4個類別,并繪制了氣味分子-嗅覺受體激活-氣味感知模式圖。如圖6所示,產(chǎn)生激活關(guān)系少于20條的嗅覺受體并沒有被繪制,DREAM 數(shù)據(jù)集中氣味感知評分低于5 分的氣味感知描述詞沒有被繪制。
圖6 氣味分子-嗅覺受體激活-氣味感知模式Fig.6 Odor molecule-olfactory receptor activation-olfactory pattern
研究結(jié)果表明,經(jīng)由氣味分子-嗅覺受體激活關(guān)系對分子進(jìn)行分類在氣味感知上出現(xiàn)了明顯的模式上的不同。例如,“腐爛(decayed)”只與第1類分子激活的3個嗅覺受體相連;“花(flower)”只與第4類分子激活的4個嗅覺受體相連等,本研究部分結(jié)果與已得到的生物實驗結(jié)果驗證一致(Chaput et al.,2012; El Mountassir et al.,2016; Keller et al.,2016)。本研究同時嘗試了使用SMⅠLES分子表達(dá)式和摩根指紋對分子進(jìn)行聚類,所獲得的結(jié)果難以提取出明顯的氣味分子-嗅覺受體激活-氣味感知模式。
本研究旨在提出一種基于數(shù)據(jù)驅(qū)動方法的氣味感知預(yù)測和分析的新解決方案。首先,構(gòu)建了嗅覺受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò),采用圖卷積方法以獲得更全面有效的嗅覺受體蛋白特征。在嗅覺受體激活關(guān)系數(shù)據(jù)的基礎(chǔ)上,構(gòu)建了嗅覺受體激活預(yù)測模型。其次,面向DREAM 數(shù)據(jù)集并引入其嗅覺受體激活數(shù)據(jù),以提供必要的生理信息補充,實現(xiàn)對氣味分子感知的精準(zhǔn)預(yù)測。最后,對模型形成的正確決策機制進(jìn)行解釋分析,并總結(jié)了氣味分子-嗅覺受體激活-氣味感知模式。研究結(jié)果表明,綜合考慮氣味分子特征和氣味分子-嗅覺受體激活關(guān)系構(gòu)建預(yù)測模型,能夠獲得更好的預(yù)測結(jié)果,并獲得對人類氣味感知模式的有效總結(jié)。
盡管研究結(jié)果仍需要進(jìn)一步驗證,但本研究為進(jìn)一步探索和理解氣味感知機制提供了有價值的參考和啟示。未來的工作將面向更多的氣味感知數(shù)據(jù)集進(jìn)一步優(yōu)化模型,基于數(shù)據(jù)驅(qū)動技術(shù)進(jìn)一步學(xué)習(xí)氣味分子與嗅覺受體激活的對接模型,為氣味感知的預(yù)測提供更多有用的信息,進(jìn)一步推進(jìn)人類嗅覺機理研究。