亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于N-gram相似度增強蛋白質肽段組裝的方法

        2025-07-20 00:00:00邵赟倪申環(huán)楊程琿龐明威孔韌常珊
        電腦知識與技術 2025年18期
        關鍵詞:容錯性

        摘要:蛋白質肽段組裝是確定蛋白質全長序列的重要步驟之一。然而,由于測序數據的不完整性及測序錯誤,傳統(tǒng)de Bruijn圖方法ALPS在肽段組裝中存在覆蓋率低和準確率不足的問題。因此,文章提出了一種基于N-gram相似度增強肽段組裝的方法。利用N-gram算法改進了ALPS方法的組裝路徑選擇,通過計算肽段子串之間的相似性,對de Bruijn圖中斷裂子串處進行容錯性補充,從而提升了肽段組裝序列的覆蓋率與BLAST比對的得分。驗證結果表明,該方法的組裝效果優(yōu)于ALPS,Huamn-H與Mouse-H數據集上的序列覆蓋率分別由77%提升至95%和60%提升至82%,BLAST比對的得分分別從702提升至845和從556提升至742。在Human-L與Mouse-L數據集上,兩種方法效果相當。文章的主要貢獻如下:1) 提出利用N-gram算法改進ALPS組裝方法;2) 在4個數據集上進行實驗驗證,該方法有效提升了肽段組裝的覆蓋率與BLAST比對的得分。

        關鍵詞:N-gram相似度算法; de Bruijn圖;容錯性;肽段組裝;BLAST比對

        中圖分類號:Q811.4" " "文獻標識碼:A

        文章編號:1009-3044(2025)18-0001-06

        開放科學(資源服務) 標識碼(OSID) :

        0 引言

        蛋白質序列是確定蛋白質結構與功能的基礎。在自下而上的蛋白質組學研究中,質譜技術已成為主要的分析手段。然而,質譜測序技術產生了大量的碎片化肽段,無法直接得到完整的蛋白質序列信息。因此,蛋白質肽段組裝是重建蛋白質全長序列的核心步驟之一,在蛋白質組學研究中具有重要意義,并且已廣泛應用于藥物研發(fā)、病毒研究以及蛋白質變異分析等領域。由于氨基酸突變、質譜噪聲與實驗環(huán)境的影響,肽段序列組裝面臨著諸多挑戰(zhàn)。

        傳統(tǒng)的蛋白質肽段組裝方法主要依賴高質量質譜數據庫以及已知的蛋白質序列或者基因組,通過參考比對策略推斷出目標蛋白質的全長序列[1]。這類方法在分析已知蛋白時表現良好。然而,對于新型病毒或突變的蛋白質,由于其部分序列未包含在已知數據庫中,傳統(tǒng)方法難以識別匹配新序列,無法有效解析未知蛋白。此外,傳統(tǒng)組裝方法計算復雜度高,限制了其在新型蛋白質研究中的應用。

        隨著質譜技術的不斷發(fā)展以及配套算法的迭代,肽段從頭組裝逐漸成為蛋白質鑒定的主流技術。不同于傳統(tǒng)數據庫比對方法,從頭組裝不依賴已知序列數據庫,而是通過分析原始肽段數據之間的重疊關系與出現頻率直接拼接序列。然而,從頭組裝方法同樣面臨諸多困難。第一,質譜測序錯誤導致肽段錯誤拼接的風險增加;第二,測序過程中肽段丟失導致組裝序列覆蓋率顯著下降。

        近年來,基于de Bruijn圖的ALPS算法被廣泛應用到蛋白質肽段組裝領域。ALSP算法通過肽段間的k-mer(即肽段子串) 重疊關系簡化了組裝路徑的搜索過程,極大地提升了從頭組裝的效率與準確性[2]。盡管該算法在性能與效果上優(yōu)于傳統(tǒng)組裝方法,但其核心仍然是肽段間的連續(xù)重疊關系。在實際應用中,質譜測序錯誤會導致圖中路徑出現錯誤分支,而測序中肽段的缺失會直接破壞重疊結構的連續(xù)性,導致組裝結果出現局部最優(yōu)。

        針對上述挑戰(zhàn),本文提出了一種基于N-gram算法的路徑優(yōu)化策略,旨在修復de Bruijn圖的斷裂節(jié)點,從而提升肽段組裝的性能。N-gram相似度算法通過計算劃分子串之間的相似度[3],能夠識別因測序錯誤或者突變導致的非重疊區(qū)域,并通過概率對肽段子串(節(jié)點) 篩選替換。整體流程圖如圖1所示。結合容錯機制對蛋白質序列進行擴展組裝,顯著提升了組裝序列的覆蓋度與BLAST比對的得分。此研究主要的貢獻如下。

        1) 提出了一種基于N-gram相似度增強蛋白質肽段組裝的方法,解決de Bruijn圖斷裂節(jié)點問題,該方法有效擴展了蛋白質組裝序列,為確定蛋白質全長序列提供了新思路。

        2) 在多個實際數據集中驗證了該方法的有效性,實驗結果顯示在肽段組裝的覆蓋率與BLAST比對的得分均優(yōu)于傳統(tǒng)組裝方法。

        1 相關研究

        近年來,蛋白質肽段組裝方法主要依賴于兩種基于圖論的策略:基于de Bruijn圖組裝方法和基于Overlap-Layout-Consensus(OLC) 圖組裝方法。表1對比了這兩種方法的適用場景以及局限性,并在下面介紹了相關算法。

        基于OLC圖的組裝方法包括三個核心步驟:1) 計算reads(即原始肽段) 之間的序列相似性,找到其中具有重疊區(qū)域的肽段對;2) 以reads構建重疊圖布局,原始reads作為圖的節(jié)點,邊表示reads之間的重疊關系;3) 尋找共識序列,通過尋找重疊圖的路徑,合并重疊reads,最終輸出肽段組裝序列。該方法更適合長reads的組裝,算法Meta-SPS[4]和MuCS[5]方法采用OLC框架的策略實現,通過穩(wěn)健的重疊群進行延伸和校正。

        基于de Bruijn圖的組裝方法則需將reads劃分為k-mers并構建de Bruijn圖,通過尋找歐拉路徑推斷出組裝序列。這種方法更適合短reads組裝,相關的算法有ISEA[6]和ALPS[7]。ISEA在de Bruijn圖中擴展種子時,通過引入基于雙端信息和插入片段分布的精細評分函數解決重復區(qū)域的問題,減少錯誤肽段對組裝序列的影響。ALPS則對de Bruijn圖的節(jié)點賦予置信度評分,以貪婪算法尋找最優(yōu)路徑,這種策略表現出更高的容錯性與計算效率。

        在蛋白質組學研究中,質譜技術因其成本低、高靈敏度和高分辨率等優(yōu)點,是目前普遍使用的測序技術。質譜技術會產生大量短肽段,更適合de Bruijn圖方法進行肽段組裝。其中,ALPS被廣泛應用于蛋白質鑒定。因此本研究以de Bruijn圖算法作為肽段組裝的核心算法。

        2 方法描述

        2.1 de Bruijn圖構建

        de Bruijn圖是蛋白質序列組裝的重要工具。基于de Bruijn圖的組裝流程主要包括三個主要步驟:數據預處理、de Bruijn圖構建和最優(yōu)路徑選擇。具體而言,蛋白質經過酶解后,通過質譜儀生成相關的肽段質譜,由數據庫搜索或者從頭測序的方法識別得到肽段序列[8]。

        首先,在數據預處理階段,對置信度過低的肽段序列以及序列中非氨基酸部分進行剔除。以預處理后的肽段數據作為de Bruijn圖構建的輸入數據。首先,將每一個肽段劃分為以k為長度的子串[9],也稱為k-mer。每一個k-mer的前k-1個氨基酸和后k-1個氨基酸作為圖的節(jié)點,也稱為(k-1)-mer節(jié)點。并以每一個k-mer作為圖的有向邊,同時為每一個節(jié)點設置權重,最終形成de Bruijn圖,如圖2所示。

        節(jié)點權重是圖路徑選擇的核心參數,權重設置為肽段置信度的加權幾何平均值,置信度加權幾何平均值(公式1) 從原始肽段置信度出發(fā)綜合評估(k-1)-mer的整體可信度。其次,節(jié)點(k-1)-mer設置了位置權重系數(公式2) ,位置權重系數使得序列組裝更加關注序列內部氨基酸以及重疊關系。以節(jié)點(k-1)-mer={ai,ai+1,...,ai+k-2}為例,公式(1) (2) 如下所示:

        [ωk-1-m?r=k-1-merlogI×j=ii+k-2confajwaj1j=ii+k-2waj] (1)

        [waj=1," j=i or j=i+k-25," i+1≤j≤i+k-3] (2)

        式中,[I]是肽段的強度,反映該肽段的豐度信息;[aj]表示節(jié)點中第j個氨基酸;[confaj]表示第j位氨基酸的置信度;[w(aj)]為位置權重系數,強調節(jié)點內部氨基酸的可靠性。節(jié)點權重通過公式(1) 計算每個(k-1)-mer的累積權重。相比于傳統(tǒng)ALPS方法直接采用算術平均置信度的線性模型,本研究設置了對數變換放大權重差異,使不同肽段的權重差異更加明顯,從而提升圖路徑選擇的準確性。

        傳統(tǒng)基于de Bruijn圖的肽段組裝方法ALPS采用最大權重種子優(yōu)先策略,通過使用貪婪算法不斷向后和向前迭代新種子以完成蛋白質肽段組裝。但由于肽段數據集中部分重疊肽缺失以及測序錯誤的情況,該方法無法獲得更長的和完整的蛋白質序列。

        2.2 N-gram相似度計算

        本文采用N-gram相似度容錯機制改進傳統(tǒng)de Bruijn圖的蛋白質肽段組裝策略。N-gram相似度計算采用了N-gram統(tǒng)計語言[3]的思想,是一種常用于文本分析和集合匹配的算法,用于衡量兩個字符串之間的相似程度。其核心思想是將文本序列分割為固定長度N的連續(xù)子序列。例如,“Hello”的2-gram為{“He”, “el”, “l(fā)l”, “l(fā)o”},并以子序列共同出現頻率計算兩個序列之間的相似程度。

        根據de Bruijn肽段組裝方法的特點,將斷裂節(jié)點對應的(k-1)-mer序列(如ACDEF,k=6) 劃分為3-gram集合{“ACD”, “CDE”, “DEF”},因圖節(jié)點的序列長度為5,N取3在計算內存與容錯匹配之間達成平衡。同時對候選節(jié)點劃分為3-gram集合(如候選節(jié)點ACDEG) ,其集合為{“ACD”, “CDE”, “DEG”},通過公式(3) 計算斷裂節(jié)點與候選節(jié)點之間的相似度:

        [SimA,B=GA∩GBmaxGA,GB] (3)

        式中,[GA]表示斷裂節(jié)點序列的3-gram集合;[GB]表示候選節(jié)點的3-gram集合。[GA∩GB]表示GA與GB的公共3-gram元素數量,[maxGA,GB]表示兩個集合元素的最大值。質譜測序中常見的單氨基酸錯誤,因此斷裂節(jié)點與候選節(jié)點序列只允許容錯一位氨基酸以達成節(jié)點延伸。由于N設置為3,即相似度計算的分母為3,容錯性機制要求斷裂節(jié)點集合與候選節(jié)點至少2個相同子序列,此時理論相似度閾值為[2∕3≈0.66]。實際設定閾值下限為0.6,當候選節(jié)點與斷裂節(jié)點相似度大于0.6時,選擇其中權重最大的節(jié)點作為新的初始種子。

        2.3 組裝過程與優(yōu)化策略

        在傳統(tǒng)的de Bruijn圖的組裝過程[7]中,使用貪心算法不斷迭代最大權重種子以達成蛋白質序列的組裝。受到外部環(huán)境的影響,組裝的蛋白質序列長度有限。因此本文引入N-gram相似度容錯機制來修復圖節(jié)點斷裂(如圖3所示) 而帶來的序列長度不足[10]。具體實施步驟分為四個核心階段。

        1) 初始種子選擇策略。計算de Bruijn圖中所有(k-1)-mer節(jié)點的權重,選擇最大權重的節(jié)點作為初始種子,并記錄種子序列。對應圖3中“權重最大的(k-1)-mer序列作為種子”。

        2) 迭代擴展階段。對應圖3中,首先判斷種子是否存在后綴種子(節(jié)點) ,如果存在,在初始種子序列后拼接新氨基酸,拼接后刪除已使用的節(jié)點,避免重復計算。同時以后綴種子作為新初始種子,逐步迭代,直至初始種子不存在后綴節(jié)點,即圖節(jié)點斷裂。

        3) N-gram錯誤糾正。如圖3中所示,當判斷種子的后綴為“False”,則拼接過程中遇到圖斷裂節(jié)點,計算斷裂節(jié)點與候選節(jié)點之間的N-gram相似度。若存在候選節(jié)點與斷裂節(jié)點的相似度大于設定閾值0.6,則從滿足條件的候選節(jié)點中選擇其中權重最大的節(jié)點替換原有的節(jié)點,繼續(xù)序列迭代擴展。

        4) 組裝終止判斷。若不存在候選節(jié)點與斷裂節(jié)點間相似度大于設定閾值,則種子結束向后拼接。以記錄初始種子節(jié)點以同樣的原理向前拼接,最終完成蛋白質肽段的組裝。

        相比于傳統(tǒng)貪心算法,本研究引入N-gram相似度算法允許單個氨基酸差異的模糊匹配,能夠有效緩解因重疊肽段缺失以及測序錯誤導致的斷裂問題,提高肽段組裝的完整性。

        3 實驗設計與結果分析

        3.1 數據集

        本文選取人類抗體與小鼠抗體蛋白質肽段數據集作為實驗測試數據。數據集來自Tran等人的團隊實驗[7]用于評估ALPS組裝算法。數據集可從數據庫MassIVE下載,編號為MSV000079801。本研究使用兩種質譜測序方法:數據庫測序與從頭測序[11]。數據庫測序依賴現有的現有數據庫進行比對,從而識別對應肽段,這種方法能夠提供高置信度的肽段鑒定。從頭測序則不依賴數據庫,根據質譜中質荷比與豐度預測相應的氨基酸。兩種不同測序方法生成的肽段數據集,以更加全面評估肽段組裝算法在不同實際應用場景的適用性與魯棒性。

        人類抗體數據集是由質譜數據庫搜索測序所得,DS1-H(人類重鏈數據集) 包含14 743條肽段,DS1-L(人類輕鏈數據集) 包含13 177條肽段。老鼠抗體數據集由從頭測序所得,DS2-H(老鼠重鏈數據集) 包含14 767條肽段,DS2-L(老鼠輕鏈數據集) 包含13 750條肽段。表2展示了兩個數據集的詳細信息。

        3.2 實驗環(huán)境與數據處理

        實驗在64位Linux操作系統(tǒng)下進行,采用python語言編寫。硬件環(huán)境:CPU型號為Gen Intel(R) Core(TM) i9-12900K;GPU為NVIDIA GeForce RTX 3080Ti。軟件工具:VSCode;從頭測序工具采用DeepNovo[12]工具。

        實驗數據質量直接影響蛋白質肽段組裝結果。受到實驗中噪聲以及檢測方式的影響,原始數據存在低置信度肽段、強度丟失與序列存在非氨基酸字符等問題。在組裝評估之前需對測序得到的蛋白質肽段數據進行如下預處理。

        1) 置信度過濾

        de Bruijn圖節(jié)點權重計算涉及肽段置信度。為確保組裝結果的可靠性,對原始肽段數據進行置信度過濾。

        首先進行置信度匹配處理。對測序過程中肽段氨基酸個數與相應置信度個數不匹配的肽段進行處理。當置信度的數量多于肽段氨基酸數量時,對多余的置信度數值進行剔除;當肽段氨基酸數量大于對應置信度數量時,使用均值插值法[13]補充缺失的置信度。其次對低置信度肽段過濾。當肽段中所有氨基酸置信度低于0.3時,我們認為此肽段是不可信的,直接剔除。

        2) 肽段強度處理

        由于質譜儀檢測靈敏度不足以及實驗噪聲的影響,無論是質譜數據庫測序或是使用深度學習的從頭測序,總會出現肽段強度數值丟失的狀況[14]。為確保組裝實驗的完整性,對所有缺失的肽段強度值均以固定值100進行補充。因為與實驗中常見的肽段強度范圍(100 000以上) 相比,固定值100僅為強度下限的0.1%,可視為背景噪聲水平,對節(jié)點的權重計算影響也很小,并且在數據集中缺失強度的肽段很少,這種處理不會顯著影響組裝結果。

        3) 肽段序列處理

        測序得到的肽段序列有一部分帶有修飾信息[15],如EGKHN(+0.98)HHT,表示氨基酸N存在質量偏移修飾。在組裝肽段序列過程中,對肽段中非氨基酸部分使用正則表達式進行合理剔除,只保留肽段氨基酸序列,以確保數據的規(guī)范性與一致性。

        3.3 評價指標

        本文使用線上NCBI中的BLAST系統(tǒng)用于蛋白質序列比對[16]。以其中序列覆蓋度(Query Cover) 、精確度(Per. Identity) 和BLAST比對的得分(Total Score) 作為組裝結果的評估指標[17]。評價指標的具體說明如下。

        1) Query Cover反映出組裝序列中參與比對的部分占整個目標序列總長度的百分比。Query Cover值越大,說明肽段組裝結果覆蓋目標序列的范圍更廣。如公式(4) 所示:

        [Query Cover=LbLq×100%] (4)

        式中:[Lb]代表組裝結果實際比對區(qū)域的總長度,[Lq]代表目標序列的總長度。

        2) Per. Identity反映出組裝序列與目標序列完全匹配的氨基酸占實際比對區(qū)域長度的百分比。Per. Identity越高,說明組裝結果更準確,錯誤率低。如公式(5) 所示:

        [Per. Identity=MLb×100%] (5)

        式中:[M]表示比對區(qū)域內與目標序列完全匹配的氨基酸個數,[Lb]代表組裝結果實際比對區(qū)域的總長度。

        3) Total Score反映出組裝結果與目標序列的整體相似度,是所有高得分片段(HSP) 的得分總和。得分計算基于BLOSUM62計分矩陣和間隙(gap) 懲罰,BLOSUM62計分矩陣是一種基于進化信息的氨基酸替換矩陣,用于評估兩個氨基酸之間的相似性得分。在序列比對中,引入間隙懲罰來避免過多插入間隙,以保持序列的連貫性。如公式(6) 所示:

        [Total Score=i=1nSi] (6)

        式中:[Si]為第i個HSP的得分,[n]為比對過程中檢測到的HSP數量。

        3.4 實驗結果與分析

        為了驗證本文提出的基于N-gram相似度增強蛋白質序列組裝算法的有效性,我們引入基于de Bruijn圖的算法ALPS在相同的數據集上進行驗證,通過Total Score、Query Cover和Per. Identity這三個評估指標進行比較,實驗結果如表3所示。

        1) 結果分析

        從表3可以得出,改進的組裝方法N-gram+de Bruijn在Query Cover與Total Score方面優(yōu)于ALPS。特別是當目標蛋白質序列較長的情況,改進方法的組裝效果更加的顯著。

        在DS1-H數據集上,Query Cover從77%提升至95%,提升了18個百分點;Total Score從702提升至845,提升了143;但Per. Identity略微下降,從99.71%降至95.41%。

        在DS2-H數據集上,Query Cover從60%提升至82%,提升了22個百分點;Total Score從556提升至742,提升了186;但Per. Identity從92.78%下降至92.27%。

        盡管該方法在這兩個數據集精度有所下降,這是由于引入N-gram機制在優(yōu)化覆蓋率的同時會引入部分錯配肽段,但整體上該方法有效提升了組裝結果的覆蓋率與BLAST比對的得分。在DS1-L和DS2-L(目標序列長度不超過219) 的數據集上,實驗結果表明,兩種方法的蛋白質組裝效果基本一致,說明在較短的序列上,N-gram機制影響較小。

        2) 圖示分析

        為了更加直觀地展示本文方法的肽段組裝的性能,將N-gram+de Bruijn方法與ALPS方法在DS1-H的組裝結果進行可視化展示。結果如圖4所示。

        圖4(a) 與圖4(b) 分別展示了ALPS與N-gram+de Bruijn在DS1-H數據集上的組裝效果。從圖4(a) 與圖4(b) 可以得出,相比于ALPS組裝結果,本文方法組裝的蛋白質序列幾乎覆蓋目標蛋白質序列,斷裂點明顯減少。圖4(c) 進一步展示了組裝細節(jié),其中紅色表示正確匹配的氨基酸,藍色表示錯配區(qū)域。相比于ALPS,該方法在組裝結果上存在更多錯配氨基酸。

        N-gram+de Bruijn方法與ALPS方法在DS2-H數據集上的組裝可視化結果如圖5所示。

        圖5(a) 與圖5(b) 分別展示了ALPS與N-gram+de Bruijn在DS2-H數據集上的組裝效果。從圖5(a) 與圖5(b) 可以得出,相比于ALPS組裝結果,本文方法組裝結果覆蓋率明顯提升,在原有的基礎上向前進行了擴展延伸。圖5(c) 進一步展示了組裝細節(jié),同樣隨著覆蓋率提升,錯配氨基酸有所增加,組裝精度輕微下降。

        本文方法在DS1-L與DS2-L數據集上的肽段組裝效果與ALPS相當,組裝序列基本覆蓋整個目標序列,組裝效果如圖6所示。

        整體來看,本文提出的方法有效減少了斷裂點的產生,并提高了肽段組裝的連貫性和完整性。在全長蛋白質序列組裝領域,該方法展示了較高的準確性與魯棒性,為了蛋白質鑒定分析提供了參考。

        4 結束語

        本文設計了一種基于N-gram相似度算法增強蛋白質肽段組裝的方法,通過引入N-gram相似度容錯策略有效修復了因測序錯誤或者重疊肽缺失造成的de Bruijn節(jié)點斷裂的狀況。試驗結果表明,該方法顯著提升了蛋白質肽段組裝的覆蓋率與BLAST比對的得分,但Per. Identity有所下降。這表明仍然需要優(yōu)化錯配區(qū)域的處理策略,進一步提高序列的準確性。未來肽段組裝可以使用深度學習模型或者錯誤校正機制,在保持序列覆蓋度的同時保證準確性不下降。該方法為蛋白質組學研究中的蛋白質鑒定提供了有力的支持,并為后續(xù)研究提供了重要參考。

        參考文獻:

        [1] BESLIC D,TSCHEUSCHNER G,RENARD B,et al.Current state,existing challenges,and promising progress for de novo sequencing and assembly of monoclonal antibodies[J]. bioRxiv, 2022: 2022.07. 21.500409.

        [2] 陸翼,葛成,徐晴,等.序列組裝在蛋白質測序技術中的方法[J].現代計算機, 2023, 29 (4): 18-24,48.

        [3] 尹寶生,安鵬飛.通過N-gram增強局部上下文視野感知的中文生成式摘要[J].中文信息學報,2022,36(8):135-143,153.

        [4] GUTHALS A,CLAUSER K R,BANDEIRA N.Shotgun protein sequencing with meta-contig assembly[J].Molecular amp; Cellular Proteomics,2012,11(10):1084-1096.

        [5] MAI Z B,ZHOU Z H,HE Q Y,et al.Highly robust de novo full-length protein sequencing[J].Analytical Chemistry,2022,94(8):3467-3475.

        [6] LI M,LIAO Z,HE Y,et al.ISEA:iterative seed-extension algorithm for de novo assembly using paired-end information and insert size distribution[J].IEEE/ACM Trans Comput Biol Bioinform,2017,14(4):916-925.

        [7] TRAN N H,RAHMAN M Z,HE L,et al.Complete de novo assembly of monoclonal antibody sequences[J].Scientific Reports,2016,6:31730.

        [8] COX J.Prediction of peptide mass spectral libraries with machine learning[J].Nature Biotechnology,2023,41(1):33-43.

        [9] 翟海霞,蔡文達,劉小燕,等.利用HiFi讀數和k-mer分布特征的序列組裝方法[J].小型微型計算機系統(tǒng),2024,45(6):1376-1383.

        [10] LU Z L,LI R P,LU K,et al.Semantics-empowered communications:a tutorial-cum-survey[J].IEEE Communications Surveys amp; Tutorials,2024,26(1):41-79.

        [11] NG C C A,ZHOU Y,YAO Z P.Algorithms for de-novo sequencing of peptides by tandem mass spectrometry:a review[J].Analytica Chimica Acta,2023,1268:341330.

        [12] TRAN N H,ZHANG X,XIN L,et al.De novo peptide sequencing by deep learning[J].Proceedings of the National Academy of Sciences of the United States of America,2017,114(31):8247-8252.

        [13] KONG W J,HUI H W H,PENG H,et al.Dealing with missing values in proteomics data[J].Proteomics,2022,22(23/24):e2200092.

        [14] VITORINO R,GUEDES S,TRINDADE F,et al.De novo sequencing of proteins by mass spectrometry[J].Expert Review of Proteomics,2020,17(7/8):595-607.

        [15] FOREMAN R E,GEORGE A L,REIMANN F,et al.Peptidomics:a review of clinical applications and methodologies[J].Journal of Proteome Research,2021,20(8):3782-3797.

        [16] ZARU R,ORCHARD S,CONSORTIUM U.UniProt tools:BLAST,align,peptide search,and ID mapping[J].Current Protocols,2023,3(3):e697.

        [17] SAMAL K C,SAHOO J P,BEHERA L,et al.Understanding the BLAST (basic local alignment search tool) program and a step-by-step guide for its use in life science research[J].Bhartiya Krishi Anusandhan Patrika, 2021, 36(1): 55-61.

        【通聯(lián)編輯:李雅琪】

        猜你喜歡
        容錯性
        基于白名單技術的物聯(lián)網安全策略研究
        初中數學“容錯性”教學的實踐
        初中數學“容錯性”教學的實踐
        漢字容錯性在視覺設計中的應用初探
        藝術科技(2019年4期)2019-07-23 09:53:06
        大擺臂分流器在行李處理系統(tǒng)中的應用設計
        科技資訊(2019年7期)2019-06-17 01:24:12
        基于一致性哈希的高可用多級緩存系統(tǒng)設計
        移動端界面設計中“容錯性”思考
        機場信息系統(tǒng)對外部數據源的容錯策略研究
        中國新通信(2016年7期)2016-05-11 06:50:02
        基于認知心理學的交互式產品的容錯性設計研究
        基于免疫算法的高容錯性廣域保護研究
        電測與儀表(2015年2期)2015-04-09 11:28:56
        久久亚洲综合亚洲综合| 波多野结衣aⅴ在线| 极品 在线 视频 大陆 国产| 亚洲视频精品一区二区三区| 就爱射视频在线视频在线| 亚洲国产精品无码久久| 夜夜揉揉日日人人| 亚洲 国产 韩国 欧美 在线| 一区二区高清免费日本| 日韩人妻ol丝袜av一二区| av人摸人人人澡人人超碰小说 | 麻豆国产VA免费精品高清在线 | av在线播放免费网站| 亚洲乱码日产精品一二三| 国产精品揄拍100视频| 国产女主播强伦视频网站| 日本av天堂一区二区三区| 免费人妻精品一区二区三区| 午夜精品久久久| 免费观看在线一区二区| 亚洲蜜臀av一区二区三区| 久久精品国产精品国产精品污| 另类一区二区三区| 午夜婷婷国产麻豆精品| 精品久久久久久亚洲综合网| 福利视频一二三在线观看| 久久久久久久久中文字幕| 成人性生交大全免费看| 人妻 色综合网站| 国产av成人精品播放| 蜜桃av一区二区三区| 老太婆性杂交视频| 日日碰狠狠躁久久躁96avv| 韩国三级大全久久网站| 久久精品国产av麻豆五月丁| 色噜噜狠狠狠综合曰曰曰| 伊人精品无码AV一区二区三区| 少妇人妻在线伊人春色| 亚洲av成人无码一二三在线观看| 国模无码视频一区| 一本大道久久精品一本大道久久 |