亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的冠狀病毒刺突蛋白拉曼特征峰的理論研究

        2022-09-05 03:26:30溫家星周民杰黃景林何智兵趙松楠趙宗清
        光譜學(xué)與光譜分析 2022年9期
        關(guān)鍵詞:鍵角拉曼酰胺

        倪 爽, 溫家星, 周民杰, 黃景林, 樂 瑋, 陳 果,何智兵, 李 波, 趙松楠, 趙宗清, 杜 凱

        中國工程物理研究院激光聚變研究中心, 四川 綿陽 621900

        引 言

        新冠疫情對(duì)全球的經(jīng)濟(jì)造成了巨大破壞。 為了有效控制新冠疫情, 快速檢測新冠病毒(嚴(yán)重急性呼吸綜合癥冠狀病毒2, severe acute respiratory syndrome coronavirus 2, SARS-CoV-2)是一個(gè)急需解決的問題。 新冠病毒的刺突蛋白是病毒攻擊人體的鑰匙, 且在病毒表面大量分布, 因此成為拉曼光譜技術(shù)檢測新冠病毒的檢測點(diǎn)[1-3]。 要實(shí)現(xiàn)刺突蛋白的拉曼技術(shù)檢測, 關(guān)鍵之一在于構(gòu)建刺突蛋白的拉曼特征峰。 鑒于純刺突蛋白的拉曼譜圖較難獲得且成本較高, 需要從理論上快速構(gòu)建刺突蛋白拉曼特征峰。 此外, 人類已知可以感染的七種冠狀病毒刺突蛋白的結(jié)構(gòu)[4-9]相近[圖1(a)], 是否可以通過拉曼技術(shù)區(qū)分他們對(duì)于新冠病毒的準(zhǔn)確檢測是一個(gè)十分重要的問題。 基于理論構(gòu)建的刺突蛋白拉曼特征峰, 可以分析七種冠狀病毒刺突蛋白拉曼特征峰的不同, 為實(shí)驗(yàn)提供指導(dǎo)。

        (1)

        式(1)中:εi為局域模頻率,βij為局域模之間的相互作用, 激子模型哈密頓量可以寫成矩陣形式

        (2)

        式(2)中:n為局域模的數(shù)量, 對(duì)角化H矩陣可以獲得激子的頻率及其對(duì)應(yīng)特征矢量(局域模展開為簡正模的線性展開系數(shù))。 對(duì)于蛋白酰胺Ⅰ峰而言, 其局域模近似為組成蛋白骨架的每個(gè)酰胺單元的酰胺Ⅰ振動(dòng)模。

        本文關(guān)注的重點(diǎn)是定性分析七種冠狀病毒刺突蛋白拉曼特征峰的差異而非絕對(duì)值且在激子模型中H矩陣對(duì)角元的值遠(yuǎn)大于非對(duì)角元的值。 因此, 本文采用簡化的激子模型, 僅考慮結(jié)構(gòu)變化對(duì)H矩陣對(duì)角元的校正而將非對(duì)角元舍去。

        為了校正對(duì)角元, 需要對(duì)七種刺突蛋白結(jié)構(gòu)中的每個(gè)酰胺單元計(jì)算拉曼譜圖, 每個(gè)刺突蛋白有數(shù)千個(gè)酰胺單元, 逐個(gè)計(jì)算拉曼譜圖費(fèi)時(shí)且不利于統(tǒng)一誤差。 江俊[15-16]等近期提出了基于機(jī)器學(xué)習(xí)構(gòu)建分子結(jié)構(gòu)和拉曼性質(zhì)(頻率、 強(qiáng)度)之間映射關(guān)系的策略。 其先通過分子動(dòng)力學(xué)構(gòu)建分子的動(dòng)力學(xué)結(jié)構(gòu), 然后計(jì)算結(jié)構(gòu)的拉曼頻率以及強(qiáng)度, 最后使用機(jī)器學(xué)習(xí)擬合結(jié)構(gòu)和性質(zhì)的映射關(guān)系。 本文基于此策略, 構(gòu)建酰胺單元結(jié)構(gòu)和拉曼峰頻率以及強(qiáng)度之間的模型。

        文獻(xiàn)中多數(shù)研究集中在酰胺Ⅰ峰, 對(duì)酰胺Ⅲ拉曼峰研究較少。 本文基于深度學(xué)習(xí)技術(shù), 從理論上構(gòu)建蛋白酰胺單元結(jié)構(gòu)和酰胺Ⅰ、 Ⅲ拉曼特征峰的映射關(guān)系, 然后統(tǒng)計(jì)七種冠狀病毒刺突蛋白的結(jié)構(gòu)差異, 帶入模型中獲得拉曼特征峰。 最后通過洛倫茲線型展開譜線獲得譜圖, 并比較譜圖的差異。

        1 模型的構(gòu)建和計(jì)算方法

        使用N-甲基乙酰胺(NMA)分子來模擬蛋白的酰胺單元[圖1(b, c)], 構(gòu)建酰胺Ⅰ、 Ⅲ峰的深度學(xué)習(xí)模型。 首先, 通過VASP軟件, 采用分子動(dòng)力學(xué)的方法構(gòu)建10 000個(gè)NMA分子隨時(shí)間演化的結(jié)構(gòu), 未考慮H2O的影響。 然后通過Gaussian09軟件計(jì)算這些結(jié)構(gòu)對(duì)應(yīng)的拉曼譜峰, 最后通過深度學(xué)習(xí)技術(shù)構(gòu)建NMA分子結(jié)構(gòu)特征和酰胺Ⅰ、 Ⅲ峰頻率以及強(qiáng)度的映射關(guān)系。 VASP計(jì)算采用GGA-PBE泛函, 周期性的邊界條件為14.6×14.6×14.6 ?3, 平面波的截?cái)嗄茉O(shè)置為400 eV, 能量收斂標(biāo)準(zhǔn)為1×10-5eV, 分子動(dòng)力學(xué)模擬選擇正則系綜(NVT), 時(shí)間步長1 fs, 溫度為300 K, 總共模擬10 000步。 Gaussian09計(jì)算拉曼譜峰基于B3LYP雜化泛函水平, 基組使用6-311++G(d, p)。

        深度學(xué)習(xí)模型由1個(gè)輸入層, 3個(gè)隱藏層以及1個(gè)輸出層組成, 對(duì)于每一個(gè)隱藏層, 使用線性修正單元(Rectified Linear Unit)激活函數(shù)。 對(duì)于NMA分子, 選用10個(gè)結(jié)構(gòu)特征來描述(4個(gè)鍵長, 4個(gè)鍵角, 2個(gè)二面角, 如圖2)。 為了增強(qiáng)模型的魯棒性, 對(duì)輸入特征以及輸出結(jié)果進(jìn)行了歸一化處理。

        圖2 用來預(yù)測NMA分子拉曼位移以及強(qiáng)度的描述符

        2 結(jié)果與討論

        2.1 酰胺Ⅰ、 Ⅲ峰模型

        基于分子動(dòng)力學(xué)構(gòu)建了10 000個(gè)NMA分子結(jié)構(gòu), 計(jì)算了其均方根誤差, 為1.06 ?(圖3), 這說明通過動(dòng)力學(xué)演化得到的NMA分子結(jié)構(gòu)變化較大且相關(guān)性較小。

        圖3 NMA分子結(jié)構(gòu)的均方根誤差

        圖4 NMA描述符間的皮爾遜相關(guān)系數(shù)

        圖5 酰胺Ⅰ峰的拉曼位移(a)、 強(qiáng)度 (b)以及酰胺Ⅲ峰的拉曼位移(c)、 強(qiáng)度(d)通過深度學(xué)習(xí)模型和DFT計(jì)算的結(jié)果比較

        2.2 七種冠狀病毒刺突蛋白骨架的結(jié)構(gòu)特征

        基于實(shí)驗(yàn)上的冠狀病毒刺突蛋白結(jié)構(gòu)[4-9](PDB code: 6u7h, 5i08, 5szs, 6ohw, 5x59, 5x58, 6vsb), 統(tǒng)計(jì)其骨架特征鍵長、 鍵角、 二面角的分布。

        圖6 七種冠狀病毒刺突蛋白骨架的鍵長特征統(tǒng)計(jì)分布圖

        從鍵角[圖7(a—d)]的分布可以看出: 鍵角的分布較為廣泛且均勻, 說明鍵角變化的力常數(shù)較小, 七種冠狀病毒的鍵角變化相差不大, 鍵角對(duì)酰胺特征峰的影響較小。

        圖7 七種冠狀病毒刺突蛋白骨架的鍵角和二面角特征統(tǒng)計(jì)分布圖

        從二面角的分布[圖7(e,f)]中可以看出, 七種冠狀病毒刺突蛋白的二面角均在180°(3.14弧度)附近, 這是由于酰胺平面共軛導(dǎo)致的。

        2.3 七種冠狀病毒刺突蛋白的拉曼特征峰比較

        根據(jù)前面獲得的酰胺Ⅰ、 Ⅲ峰的模型(酰胺單元的10個(gè)特征和酰胺Ⅰ、 Ⅲ振動(dòng)峰的頻率以及強(qiáng)度的映射關(guān)系), 從七種冠狀病毒刺突蛋白的實(shí)驗(yàn)結(jié)構(gòu)中計(jì)算出每個(gè)酰胺單元的10個(gè)特征, 帶入到模型中獲得每個(gè)酰胺單元的酰胺Ⅰ、 Ⅲ拉曼峰(振動(dòng)頻率和強(qiáng)度), 最后通過洛倫茲線型將每個(gè)酰胺單元的Ⅰ、 Ⅲ拉曼峰展開獲得七種冠狀病毒刺突蛋白的酰胺Ⅰ、 Ⅲ譜帶(圖8)。 從圖中可以看出, 七種冠狀病毒刺突蛋白的酰胺Ⅰ、 Ⅲ譜帶根據(jù)最高峰頻率可以各分成三個(gè)組。 對(duì)于酰胺Ⅰ峰, SARS-CoV-2, SARS-CoV, MERS-CoV刺突蛋白頻率相近, 其頻率值在1 636~1 637 cm-1區(qū)間; HCoV-HKU1, HCoV-NL63刺突蛋白頻率相近, 其頻率值在1 657~1 658 cm-1區(qū)間; HCoV-229E, HCoV-OC43刺突蛋白頻率相近, 其頻率值在1 673~1 674 cm-1區(qū)間。 對(duì)于酰胺Ⅲ峰, SARS-CoV-2, SARS-CoV, MERS-CoV刺突蛋白頻率相近, 其頻率值在1 263~1 265 cm-1; HCoV-229E, HCoV-HKU1, HCoV-NL63刺突蛋白頻率相近, 其頻率值在1 272~1 275 cm-1; HCoV-OC43刺突蛋白單獨(dú)一個(gè)頻率, 其頻率值為1 285 cm-1。

        圖8 七種冠狀病毒刺突蛋白的酰胺Ⅰ、 Ⅲ拉曼特征峰比較

        根據(jù)上面的分析, 可以根據(jù)酰胺Ⅰ、 Ⅲ峰的頻率劃分七種冠狀病毒, 如圖9所示, 七種冠狀病毒分為四組: SARS-CoV-2, SARS-CoV, MERS-CoV在同一個(gè)組; HCoV-HKU1, HCoV-NL63為一組; HCoV-229E一組; HCoV-OC43一組。 不同組之間其刺突蛋白特征峰的數(shù)值差異較大, 可以區(qū)分開來。 同組中的刺突蛋白特征峰的數(shù)值差異較小, 較難區(qū)分。

        圖9 通過酰胺Ⅰ、 Ⅲ特征峰頻率區(qū)分七種冠狀病毒

        3 結(jié) 論

        基于深度學(xué)習(xí)的技術(shù)構(gòu)建了刺突蛋白酰胺Ⅰ、 Ⅲ特征拉曼峰模型, 結(jié)合實(shí)驗(yàn)上的冠狀病毒刺突蛋白結(jié)構(gòu), 獲得了七種冠狀病毒刺突蛋白的酰胺Ⅰ、 Ⅲ拉曼特征峰, 通過比較七種冠狀病毒刺突蛋白的拉曼特征峰, 可以把七種冠狀病毒分為四組: SARS-CoV-2, SARS-CoV, MERS-CoV一組; HCoV-HKU1, HCoV-NL63一組; HCoV-229E一組; HCoV-OC43一組。 不同組的冠狀病毒特征峰差異較大, 可以區(qū)分開來; 同一組的冠狀病毒特征峰差異較小, 較難區(qū)分。

        猜你喜歡
        鍵角拉曼酰胺
        淺議鍵角大小比較
        賊都找不到的地方
        分子中鍵角大小的比較
        高溫下季戊四醇結(jié)構(gòu)和導(dǎo)熱率的分子動(dòng)力學(xué)研究
        雙酰胺類殺蟲劑Broflanilide
        三氟咪啶酰胺的合成工藝研究
        分子中鍵角的大小比較
        基于單光子探測技術(shù)的拉曼光譜測量
        電子測試(2018年18期)2018-11-14 02:30:36
        基于相干反斯托克斯拉曼散射的二維溫度場掃描測量
        國外二硝酰胺銨的發(fā)展現(xiàn)狀
        亚洲av成人无码久久精品| 亚洲精品在线视频一区二区| 天天综合网网欲色| 50岁熟妇大白屁股真爽| 久久精品无码一区二区三区蜜费| 日本经典中文字幕人妻| 国产婷婷成人久久av免费| 欧美黑寡妇特a级做爰| 乌克兰少妇xxxx做受6| 26uuu欧美日本在线播放| 久久精品国产9久久综合| 又大又粗欧美黑人aaaaa片| 天天躁日日躁狠狠躁人妻 | 亚洲电影一区二区三区| 国产精品日本中文在线| 丰满人妻一区二区三区视频| 日韩亚洲欧美中文在线| 樱花AV在线无码| 日本加勒比一道本东京热| 全免费a级毛片免费看无码| 亚洲旡码a∨一区二区三区| 日本视频一区二区三区免费观看 | 中文字幕第七页| 少妇一区二区三区乱码 | 國产一二三内射在线看片| 男女上床视频免费网站| 亚洲第一网站免费视频| 亚洲日产精品一二三四区| 亚洲色AV性色在线观看| 蜜桃av在线播放视频| 五月丁香六月综合缴清无码| 玖玖资源站无码专区| 国产精品国产三级国产一地| 免费人成视频网站网址| 国产农村乱子伦精品视频| 亚州毛色毛片免费观看| 亚洲国产综合精品中久| 精品999日本久久久影院| 男人j进女人p免费视频| av人妻在线一区二区三区| 午夜精品射精入后重之免费观看|