質譜指紋圖譜專家共識 | 蛋白/多肽指紋圖譜在腫瘤中的臨床應用專家共識(2024版)
摘要:隨著精準醫學的發展,蛋白/多肽指紋圖譜在腫瘤診斷、治療選擇和預后評估中的價值日漸突出。本專家共識旨在全面梳理蛋白/多肽指紋圖譜的檢測分析方法和在腫瘤臨床領域中應用的潛力,圍繞蛋白/多肽指紋圖譜的定義、臨床意義、檢測技術、數據分析方法,以及在腫瘤診斷、治療決策和復發監測中的應用,結合最新研究進展,提出一系列關于蛋白/多肽指紋圖譜檢測和應用的共識推薦,旨在提升醫療企業從業人員和臨床醫技人員對其的認知水平,促進蛋白/多肽指紋圖譜相關檢測產品的研發、轉化和在臨床腫瘤診療全流程中的應用,從而為患者提供更為精準的治療方案。
在現代腫瘤精準檢測領域,蛋白/多肽指紋圖譜在腫瘤的診斷、治療決策和預后評估中扮演著越來越關鍵的角色。為了推動蛋白/多肽指紋圖譜在腫瘤臨床管理中的應用,提高醫療企業從業人員和臨床醫技人員對其重要性的認識,同時為蛋白/多肽指紋圖譜相關檢測產品的研發、轉化和臨床應用提供指導性建議,確保檢測結果的準確度和可靠性,基于最新的研究成果,本領域內的專家學者共同編寫了本專家共識,系統性地介紹了蛋白/多肽指紋圖譜的基本概念、檢測分析技術及其在腫瘤診斷、治療決策、療效和預后評估中的作用,以促進該領域的標準化發展,最終實現個性化診療策略的優化,為患者的精準診療提供決策依據。根據相關領域的研究進展,本專家共識將及時進行修訂,以滿足腫瘤臨床應用的需要。
1. 蛋白/多肽指紋圖譜概述
多肽通常指由2~100個氨基酸組成的小分子蛋白(相對分子質量200~10 000)[1],主要由基因表達和蛋白代謝產生,如細胞因子、生長因子、激素和神經肽等,包含基因表達信息、結構蛋白和分泌蛋白信息及酶譜水平和活性信息等,處于中心法則下游,與表型關系更加密切[2]。目前研究顯示,多肽廣泛參與生物體內的生理和病理過程。在腫瘤的發生和發展過程中,多肽也發揮關鍵作用,通過調控轉錄、轉錄后、蛋白-蛋白互作、酶活性、信號傳遞和細胞間通訊等多種機制影響腫瘤進展[3]。基于多肽包含豐富的生物學信息、具有組織與疾病特異性和在腫瘤發生與發展全流程中的重要作用,腫瘤相關多肽引起研究者的廣泛興趣[1,4]。特異性的腫瘤相關多肽可在腫瘤組織高壓和血管高通透性的作用下由產生的部位快速穿過屏障進入體液中,用于腫瘤檢測[1,5]。然而許多單一多肽或者蛋白質標志物用于疾病檢測的準確度有限,尤其是面對分子機制復雜和異質性極強的腫瘤時,其應用受到限制。多肽組學是研究生物體內多肽組成、結構和功能的學科[1]。通過臨床大隊列的多肽組學研究可以篩選疾病相關差異多肽,進一步利用生物信息學方法整合多個疾病相關多肽或蛋白信息,形成蛋白/多肽指紋圖譜模型用于疾病的檢測和預測,可顯著提高檢測結果的準確度和檢測人群的適用范圍[6-7],因此可通過收集體液樣本進行蛋白/多肽指紋圖譜檢測分析,用于腫瘤精準檢測。相較于目前常見的其他液體活檢技術,如循環腫瘤DNA(circulating tumor DNA,ctDNA)、循環腫瘤細胞(circulating tumor cell,CTC)、外泌體和微小RNA(microRNA,miRNA),蛋白/多肽指紋圖譜在敏感度、早期檢測準確度和應對腫瘤異質性等方面具有一定優勢(表1)。指導意見1:多肽包含豐富的疾病相關信息,可用于腫瘤檢測?;诙嚯慕M學數據篩選,整合多個腫瘤相關多肽的蛋白/多肽指紋圖譜較單一多肽,可為腫瘤檢測提供更精準的結果。
2. 蛋白/多肽指紋圖譜檢測分析技術
2.1 臨床樣本的選擇通常用于蛋白/多肽指紋圖譜檢測的樣本包括體液、組織、原代細胞和培養液等,各種樣本均有優勢和不足。體液樣本相對易獲取,利于連續取樣,同時一些體液樣本具有自我平衡屬性,檢測結果的重復性大幅提高。而組織和原代細胞樣本來源于特定組織區域,其蛋白/多肽指紋圖譜和組織本身關系更強。然而在腫瘤管理過程中,內鏡學、影像學和組織病理學等臨床參考標準檢測技術在準確度上具有明顯優勢,對于發揮輔助角色的分子檢測技術,重點關注受檢者依從性和樣本易獲取性等。因此本專家共識重點闡述各體液樣本在蛋白/多肽指紋圖譜檢測分析中的特色。目前蛋白/多肽指紋圖譜檢測分析常用的體液包括血液、尿液、腦脊液和唾液等(表2)[8-15]。
血液樣本主要包括血漿和血清,兩者間多肽組存在差異[16]。嚴重溶血、嚴重脂血或嚴重黃疸樣本均建議重新采集。獲取血漿樣本的采血管中抗凝劑種類包括肝素、乙二胺四乙酸(ethylene diamine tetra acetic acid,EDTA)和檸檬酸鈉等,其中EDTA最常用,因為其可增強多肽穩定性[17]。采用真空血清采血管采集血液樣本后,至血清分離的時間間隔不宜>6 h。如果條件限制,需要延遲分離,則建議采樣后全血樣本2~8℃保存,12 h內完成血清分離。血漿和血清轉移時應盡可能避免吸入細胞或細胞碎片,分離前不可冷凍全血樣本,以免溶血。血漿或血清分離后應在低溫下保存和轉運,如果不能立即開展后續處理,可將樣本置于≤-70℃,期間避免反復凍融[18],以免對多肽組檢測造成不利影響。采用血液樣本的優勢在于采樣微創,各臨床機構和健康管理中心經驗豐富,樣本可及性高。且血液樣本中蛋白/多肽豐度較高,達到60~80 mg/mL,其中包含很多來自疾病組織分泌和轉運的蛋白/多肽,適用于多數疾病檢測,臨床轉化前景好[5]。然而血液樣本中蛋白/多肽濃度變化范圍較寬,>10個數量級[5]。這對多肽分離富集和檢測技術提出了嚴峻挑戰。
表1 蛋白/多肽指紋圖譜和其他液體活檢技術用于腫瘤檢測的優勢和不足
注ctDNA:循環腫瘤DNA;CTC:循環腫瘤細胞;miRNA:微小RNA(microRNA)
表2 蛋白/多肽指紋圖譜檢測常見體液樣本的特征分析
注NA:缺失值
尿液由腎臟生成,是經輸尿管和膀胱排出的含有大量代謝終產物的液體。尿液中多肽約70%來自泌尿系統,尤其是腎和膀胱,因此可基于尿液蛋白/多肽指紋圖譜檢測泌尿系統疾病[19-20]。另外約30%的尿液多肽來自血液腎小球濾過,因此尿液蛋白/多肽指紋圖譜同樣可用于其他疾病的檢測[21-22]。通常尿液在排出前已在膀胱中儲存數小時,已完成內源性多肽水解過程[23],為了減少檢測結果的變異情況,建議采用晨尿的中段尿。尿液多肽在常溫下保存≤6 h時組成和濃度相對穩定,≤-20℃可保存數年,期間避免反復凍融[24]。盡管飲食、鍛煉和飲水等可影響尿液多肽組,但相對而言,尿液是一種較為穩定的樣本[5]。同時尿液采樣非侵入性,可重復采集,尿液中蛋白含量較低,且相對分子質量<10 000的多肽高度富集[25],這可能與小分子多肽更易通過腎小球濾過屏障有關[26],這種特性降低了后續多肽分離富集和檢測的難度,也降低了高豐度蛋白對潛在蛋白/多肽指紋圖譜檢測信號的干擾程度[27]。因此尿液是多種疾病相關蛋白/多肽指紋圖譜檢測相對理想的樣本之一,尤其是泌尿系統腫瘤。
腦脊液是充滿在各腦室、蛛網膜下腔和脊髓中央管內的無色透明液體,維持顱內壓穩定。腦脊液多肽主要來源于中樞神經系統分泌和血液中穿過血-腦脊液屏障的小分子[10-11],被認為是神經系統疾病標志物的重要來源。基于腦脊液蛋白/多肽指紋圖譜可用于神經退行性疾病、創傷性腦損傷、精神性疾病和腦腫瘤等的檢測[28-30]。然而腦脊液采樣存在侵入性,不易獲取,使得基于腦脊液蛋白/多肽指紋圖譜的檢測技術在臨床應用中受到一定限制。
唾液是由分布在口腔內的主要唾液腺(腮腺、頜下腺和舌下腺)和其他腺體分泌的一種液體,采樣具有非侵入性的優勢,基于唾液的蛋白/多肽指紋圖譜可進行口腔疾病的檢測,如口腔癌[31]。然而由于蛋白進入唾液中后即發生降解,且在唾液采集后降解過程依舊存在,使得唾液多肽組檢測結果的重復性大大降低。其他變量因素如年齡、性別和飲食等也會影響唾液多肽組[32]。這些因素加大了唾液蛋白/多肽指紋圖譜臨床應用的挑戰。
其他體液樣本,包括淚液和漿膜腔積液等,也有關于蛋白/多肽指紋圖譜的研究報道。淚液樣本收集具有非侵襲性的優勢,淚液多肽組在同一個體不同時間相對穩定,然而個體間差異較大,增加了分析的復雜性[33]。重要的是淚液樣本目前主要評估眼部疾病,如干眼癥和瞼板腺功能障礙等,在腫瘤中的研究相對較少[34-35]。漿膜腔積液,包括胸腔積液和腹腔積液等,與靶組織較近,關系密切,其中含有腫瘤細胞和微環境分泌的可溶性因子,通常與腫瘤晚期關系更加密切[36]。然而采樣具有侵入性,早期檢測的價值不足[37],重要的是腫瘤中漿膜腔積液蛋白/多肽指紋圖譜研究相對較少,所報道的癌種較少,提供的證據和信息有限,因此仍需更多關于其蛋白/多肽指紋圖譜的研究以支持其產業化發展和臨床應用。
指導意見2:樣本的選擇與檢測疾病類型和樣本可及性有關。血液和尿液臨床應用前景相對較好。各類樣本采集后,應盡快分離檢測組分,并低溫保存,避免反復凍融,以增加結果的準確度和可重復性。
2.2 多肽的提取
檢測組分中多肽組檢測前,需對多肽進行有效提取。而多肽易被蛋白酶/肽酶降解,導致蛋白/多肽指紋圖譜中疾病相關信息減弱甚至喪失,因此體外樣本預處理時間應盡可能縮短[38]。在檢測組分保存前和多肽提取前,加入特異性和(或)廣譜性蛋白酶/肽酶抑制劑至樣本中,可抑制蛋白酶/肽酶活性,降低多肽水解程度[39]。然而有些蛋白酶/肽酶抑制劑就是多肽,或者是多肽類似物,加入后豐度相對較高,不僅增加了樣本中多肽的變異性,而且對內源性多肽分析起到抑制作用[2],因此需慎重考慮。除了加入蛋白酶/肽酶抑制劑外,收樣后快速冷凍是另一種方法,目的也是降低蛋白酶/肽酶對多肽的降解,同時減少凍融次數,并在冰上進行多肽提取[18,31]。
另外生物樣本中多肽豐度相對較低,例如血清中小分子多肽占比<1%,其他22種大分子蛋白如清蛋白、α-1抗胰蛋白酶、α-2巨球蛋白、轉鐵蛋白和γ-球蛋白等占比達99%以上[40],在質譜檢測過程中易覆蓋低豐度多肽信號。理想的多肽提取方法應盡可能捕獲和富集更多多肽,尤其是疾病相關多肽,并去除高豐度干擾蛋白和其他小分子干擾物質。
目前一些方法已用于去除高豐度干擾蛋白和其他小分子干擾物質進而富集多肽,如超濾離心、選擇性沉淀、固相萃取、磁珠法和免疫沉淀法等,對多肽的富集效率達到100~1000倍[41]。
超濾離心是最常用的多肽提取方法,運用超濾膜分離低相對分子質量多肽和高相對分子質量蛋白[42]。這種方法快速且易操作,然而可能導致直徑大于濾膜孔徑的多肽丟失,且難以去除直徑小于濾膜孔徑的其他小分子干擾物質,比如代謝分子和脂質,而這些小分子會降低質譜檢測時多肽的電離效率,同時有些多肽易和濾膜結合,導致多肽的丟失[43]。
選擇性沉淀法運用到多種樣本中的多肽提取,具有快速、高效、經濟和重復性好的特點[44]。選擇性沉淀大分子高豐度蛋白,而低分子多肽和其他小分子干擾物質保留在溶液中。常用沉淀試劑包括有機溶劑(乙腈、丙酮和甲醇)、酸(三氟乙酸)或硫酸銨等[41],溶劑/酸和蛋白的作用很快,且能有效終止蛋白酶/肽酶活性。盡管沉淀法比較通用,但針對不同類型樣本需選擇合適的沉淀試劑,以提高多肽的提取效率[45],同時操作需小心,盡可能減少大分子蛋白聚集時捕獲小分子多肽,導致檢測結果的一致性下降[46]。另外沉淀法雖然能高效去除高豐度蛋白,但脂質和代謝分子仍在上清中存在,會干擾質譜檢測時多肽的電離效率,有必要進一步處理。采用水不相溶的有機溶劑乙酸乙酯或乙醚等可有效地回收生物樣本中多肽并去除其他小分子干擾物質[43,47],然而該方法重復性不足,目前只能作為實驗室技術手段。
固相萃取利用選擇性吸附與選擇性洗脫的液相色譜法分離原理,可從復雜生物樣本中提取多肽,并去除大分子蛋白干擾,以及不需要的小分子干擾物質和鹽等[48],效果依賴于多肽和吸附劑的互作,也可用于沉淀法獲得的樣本中脂質和疏水性小分子物質的去除,提高多肽純度[49]。這種方法顯示出極佳的多肽提取效率和干擾物質清除效率,然而有些相具有過度選擇性,不利于廣譜的多肽組學研究,且很多時候發現僅對某個亞類多肽具有很好的富集效果。
磁珠法可用于復雜生物樣本中的多肽富集和研究[50-51],分離富集多肽的效果理想,包括弱陽離子交換磁珠(weak cation exchange magnetic beads,MB-WCX, 參考http://www.posuichina.com/Product/1894201745.html)、金屬螯合磁珠(如銅離子螯合納米磁珠, 參考http://www.posuichina.com/Product/8910524421.html)和疏水磁珠(如疏水C8磁珠,參考http://www.posuichina.com/Product/0548721933.html)等,其中MB-WCX在平均出峰量、平均峰面積和平均峰強度等方面均占優勢。然而磁珠法多肽富集試劑價格較高,且以科研型試劑為主,大規模的臨床應用前景受限。
免疫沉淀法利用特異性抗體與多肽結合,特異性高,能有效檢測低豐度多肽[52-53],目前臨床應用已有>50年的歷史。該方法依賴于高特異性的抗體的開發,然而當前合適的高特異性的抗體有限[54],無法有效地對樣本中的多肽進行全面分析。近年來,我國學者通過精確調控電化學蝕刻條件開發了具有納米級孔道的多孔硅顆粒材料,能有效捕獲富集小分子多肽而去除大分子高豐度蛋白,同時基于孔道排阻效應抑制蛋白酶/肽酶和小分子多肽的酶解接觸,對多肽起到保護作用[55-56]。另外基于多肽不同的理化性質,研究者通過對多孔硅顆粒材料進行表面化學修飾,實現對血清中低豐度多肽廣譜性和靶向性的捕獲富集[57-58],且預處理步驟簡單,有效地降低多肽的損失和臨床應用時間消耗?;谠摷夹g,建立了產業化的多孔硅顆粒材料生產體系和質量控制體系,開發了多款多肽提取試劑盒,并獲得了國家藥品監督管理局(National Medical Products Administration,NMPA)備案證,解決了多肽組學檢測敏感度、穩定性和重復性問題,為蛋白/多肽指紋圖譜相關檢測產品研發、轉化和臨床應用奠定了基礎。
指導意見3:生物樣本中低豐度多肽高敏感度、高穩定性和高重復性的捕獲富集是蛋白/多肽指紋圖譜相關檢測產品開發和臨床應用的基礎。基于多孔硅顆粒材料開發的多肽提取方法和試劑盒極具臨床應用前景。
2.3 蛋白/多肽指紋圖譜
檢測技術基于多肽組學數據分析和篩選疾病相關多肽,能為特定疾病的診斷、治療決策以及療效和預后評估提供理想的方法[5]。多肽組學的檢測常采用非靶向技術,以分析具有某特定疾病患者和不具有某特定疾病患者樣本中所有多肽的差異[4,59]。與靶向檢測技術比較,非靶向的多肽組學技術可同時分析眾多多肽特征峰水平。這對于揭示復雜且異質性強的疾病極為關鍵。基于多個多肽特征峰的蛋白/多肽指紋圖譜能顯著增加檢測的準確度[6-7]。質譜技術兼具高敏感度、高特異度和多指標聯檢的優勢,目前已廣泛用于多肽組學研究[60-61],是分析和發現疾病相關多肽的主要工具。該技術可根據不同多肽分子的質荷比(mass to charge ratio,m/z)微小差異高效檢測復雜樣本的蛋白/多肽指紋圖譜[62-65]。
目前用于多肽組檢測的質譜技術有多種,主要包括液相色譜串聯質譜(liquid chromatography-tandem mass spectrometry,LC-MS/MS)、毛細管電泳質譜(capillary electrophoresis mass spectrometry,CE-MS)、表面增強激光解析電離飛行時間質譜(surface enhanced laser desorption ionization time of flight mass spectrometry,SELDI-TOF MS)和基質輔助激光解析離子化飛行時間質譜(matrix assisted laser desorption ionization time of flight mass spectrometry,MALDI-TOF MS)等[66]。
LC-MS/MS用于蛋白/多肽組檢測,敏感度和準確度高,可檢測上千種多肽,提供大量生物學信息[67-68],提升對復雜生物樣本的分析能力。然而LC-MS/MS對檢測組分前處理要求較高,有些脂質和代謝物相對分子質量和多肽類似,若沒有被有效去除,會干擾LC-MS/MS對蛋白/多肽組的檢測性能[48]。同時由于液相分離過程耗時長和通量低,臨床應用時大批量樣本檢測受限。最關鍵的是LC-MS/MS自動化難度較大,操作繁瑣,通常更適用于研發,無法將組學檢測直接用于臨床檢驗。截至2024年6月30日共有53款LC-MS/MS獲得NMPA醫療器械注冊證,基于LC-MS/MS技術獲證的試劑盒也主要集中在維生素檢測、治療藥物監測、激素類檢測、兒茶酚胺類檢測、膽汁酸檢測和新生兒篩查等方面,均是基于定量方式檢測單一或幾個小分子應用于臨床。
CE-MS常用于尿液蛋白/多肽組檢測,可對低相對分子質量的多肽進行有效和高重復性的分析[69-70]。相對LC而言,CE的優勢在于穩健性、可重復性和對高pH環境的抗干擾能力較高,增加了結果的可比性[71-72]。另外整個分析過程中緩沖液組成保持不變,這為待分析物電離提供了一致的環境[73-74]。然而CE-MS相對耗時,不適合大樣本高通量檢測,臨床應用前景受到一定限制。
SELDI-TOF MS用于蛋白/多肽組檢測已有許多報道,然而所使用的芯片有效表面積較小,對于小分子多肽富集不完全,不能完整地反映低豐度多肽所含有的生物學信息[75]。此外由于技術可重復性較差,易受多種因素影響,對于相同疾病的研究,不同實驗室獲得的結果較難達到一致,限制其臨床應用的價值[76]。
MALDI-TOF MS是目前國產替代最成熟的質譜平臺,是極具臨床應用前景的質譜平臺。與其他檢測技術平臺比較,MALDI-TOF MS用于蛋白/多肽組檢測具有樣本前處理要求低、樣本量需求低、通量大、檢測效率高、抗干擾能力強、自動化難度低和操作便捷等優勢[77-79]。這使得MALDI-TOF MS可以全面識別生物樣本中的多肽組學信息以發現疾病相關多肽特征峰。在過去十余年,基于該技術平臺已發現多種腫瘤相關多肽[80-81]。MALDI-TOF MS成像可用于表征多肽組成以提供分子空間分布分析。該分析可與常規組織學數據相結合,分析感興趣的組織學區域中數百個靶點的分布[82-83]。這為探索惡性疾病相關分子的空間分布異質性提供了最佳手段,比如多種腫瘤[84-85],可以區分不同亞型和不同級別腫瘤,從而為治療決策提供信息。截至2024年6月30日共有44款MALDI-TOF MS獲得NMPA注冊證?;贛ALDI-TOF MS技術獲證的試劑盒應用領域包括微生物檢測和基因檢測等,其中微生物檢測是基于質譜數據與數據庫比對鑒定獲得結果,這與基于蛋白/多肽指紋圖譜的人工智能模型預測或者數據庫比對來檢測疾病的邏輯一致。在液體活檢領域目前已有用于人體血清樣本中蛋白/多肽指紋圖譜采集的MALDI-TOF MS獲得了NMPA注冊證,可進行人體血清蛋白/多肽指紋圖譜的檢測。
指導意見4:質譜技術是蛋白/多肽指紋圖譜檢測的重要平臺,其臨床應用需重點考慮樣本前處理要求、檢測成本、檢測效率、結果可重復性和操作便捷性等因素,其中MALDI-TOF MS在蛋白/多肽指紋圖譜檢測技術的轉化和臨床應用上具有一定的優勢。
2.4 蛋白/多肽指紋圖譜的檢測數據分析
通常蛋白質組學中,質譜檢測的MS/MS光譜采用生物信息學軟件進行分析,包括PEAKS、ProteinPilot或MaxQuant等。這些軟件利用不同的算法識別蛋白片段,然后在數據庫中檢索,識別所屬的蛋白和鑒定序列。然而常規蛋白質組學研究通常采用特定的蛋白酶消化后進行質譜檢測,比如采用胰蛋白酶,其N端或C端氨基酸位點比較一致。而多肽的N端和C端氨基酸序列受多種蛋白酶/肽酶消化的影響,比較復雜,基于傳統的蛋白質組學數據庫分析難以獲得高準確度的結果。這對蛋白/多肽指紋圖譜的檢測數據分析帶來了極大挑戰。一種方法是檢索SATPdb和SwePep等多肽組學數據庫進行數據分析。這些數據庫包含了最新研究發現的治療性或內源性多肽[86-87]。另外多肽的翻譯后修飾(post-translational modifications,PTMs)對于多肽和受體的互作和拮抗蛋白酶/肽酶的消化至關重要,常見的PTMs包括C端的酰胺化和N端的乙?;?,另外還有甲硫氨酸氧化以及精氨酸和谷氨酰胺脫酰胺。這些修飾給蛋白/多肽指紋圖譜的檢測數據分析帶來了新的挑戰。PERKS軟件可對多肽及其PTMs進行有效分析[49]。在蛋白/多肽指紋圖譜的檢測數據分析過程中,需要重要考慮的一個因素是過濾搜索結果,此時應用到錯誤發現率閾值,因為實驗發現的和理論光譜數都達到數千個,考慮到各種切割模式和PTMs修飾,錯誤匹配的可能性較大。為了降低這種可能性,通常采用和多肽氨基酸組成一致但序列翻轉或打亂的誘餌進行檢索,評估在數據庫中檢索時假陽性結果出現的可能分值[88]。
生物體內部分多肽具有生物活性,如細胞因子、生長因子和激素等。PeptideRanker和PeptideLocator可用于分析多肽序列是否具有生物活性[89-90]。比如PeptideRanker分值>0.5提示具有潛在生物活性。一些常見的多肽激素類物質在此軟件中預測分值較高,然而仍有部分假陰性和假陽性結果,需慎重對待。
多肽組學檢測為疾病相關蛋白/多肽指紋圖譜的構建提供了基礎。許多單一多肽用于疾病檢測的準確度有限,尤其是面對分子機制和特征復雜、異質性極強的疾病時,限制了其應用。通過人工智能整合多個多肽特征峰的蛋白/多肽指紋圖譜可增加結果的穩定性、準確度和降低變異系數[91-93],同時特異度也顯著提高[92]。蛋白/多肽指紋圖譜模型需依據《人工智能醫療器械注冊審查指導原則》構建[94]。
首先應建立明確的訓練集、驗證集和測試集隊列,每個隊列中總樣本量和各分組樣本量的計算可參考原國家食品藥品監督管理總局發布的《醫療器械臨床試驗設計指導原則》給出的方法進行計算[95],從而滿足抽樣誤差的要求,在條件允許的情況下盡量提高樣本量。隊列內分組比例可參考全國流行病學統計數據,對于各分組比例未獲得全國流行病學統計數據的疾病,隊列設計可依據各機構掌握的先驗數據設計分組的比例,隊列內和隊列間無樣本重復;
其次由于不同地區和不同臨床機構在人群組成、流行病學特征和樣本采集操作等方面可能存在差異,為保證隊列樣本的代表性,各隊列樣本應來源不同省市有代表性的臨床中心,以提高算法模型的泛化能力,降低偏倚;
再者,建議對各隊列中各樣本采集、預處理、標注和存儲等環節建立規范流程和詳細記錄,形成體系化管理,保障樣本的穩定性。對于體外診斷產品的開發,需根據臨床信息,如病理結果、鏡檢結果、影像結果和其他標志物結果等,來標注陰陽性分類和亞型分類等。同時,可根據產品預期使用人群、地區和流行病學特征,對其他生理異?;虿∽冞M行標注,作為算法訓練的標簽。樣本收集和臨床信息獲取應獲得倫理批準或者豁免。樣本的采集和保存,以及信息的傳輸和使用應符合《中華人民共和國網絡安全法》、《科技部人類遺傳資源管理辦法》和原國家食品藥品監督管理總局《醫療器械網絡安全注冊技術審查指導原則》等法律法規的要求[96-98];
隨后,收到的樣本應建立質量控制標準,剔除不合格樣本。多肽組的檢測需制定標準操作程序(standard operating procedure,SOP),按照SOP獲取各樣本多肽組學數據,并針對多肽組學數據建立質量控制標準,剔除不合格數據,篩選滿足質量要求的數據,特別是對于質控樣本的多肽檢測信號的變異控制,建議批間變異系數≤15%;
最后由于多肽和疾病的關系復雜,疾病精準檢測的蛋白/多肽指紋圖譜構建離不開數據的標準化處理和人工智能技術的應用[99-100]。多肽組學數據預處理及歸一化后,采用機器學習的方法建立包含多個多肽特征峰的集成模型。機器學習算法包括邏輯回歸、隨機森林(random forest,RF)和支持向量機(support vector machine,SVM)等[101-103]。基于標準化數據處理和機器學習算法建立的模型,需通過測試集驗證后完成模型定型,并建立判別診斷軟件。包含定型模型的診斷軟件需進一步通過建模后新采集的外部獨立測試隊列數據進行模型性能測試,并獲取模型性能評估結果。診斷軟件應用前需進一步在與預期臨床應用場景相吻合的人群隊列中開展前瞻性臨床研究(圖1)。
指導意見5:疾病相關蛋白/多肽指紋圖譜模型構建需依據《人工智能醫療器械注冊審查指導原則》[94],基于多家代表性臨床中心大樣本建立符合統計學和流行病學的訓練集、驗證集和測試集。樣本采集和信息收集應在符合法律法規的基礎上建立體系化管理體系。樣本和多肽組學數據需建立質量控制標準明確是否符合要求。多肽組的檢測應采用統一的操作標準進行,對多肽組學數據應進行標準化處理并結合人工智能算法進行疾病相關多肽篩選和精準檢測模型構建。模型性能需通過獨立測試隊列和前瞻性隊列進行評估。
3. 蛋白/多肽指紋圖譜檢測的腫瘤臨床應用
3.1 蛋白/多肽指紋圖譜檢測用于腫瘤診斷
腫瘤診斷包括早篩和輔助診斷。目前已有基于多肽的產品在腫瘤診斷中的應用,如用于小細胞肺癌檢測的胃泌素釋放肽前體(pro-gastrin releasing peptide,Pro-GRP)[104]和用于甲狀腺髓樣癌檢測的降鈣素等[105]。2009年獲得美國食品藥品管理局(Food and Drug Administration,FDA)批準用于評估有盆腔包塊的患者罹患卵巢癌風險的OVA1TM測試,包括糖類抗原125(carbohydrate antigen 125,CA125)、甲狀腺素運載蛋白、載脂蛋白A1、β2-微球蛋白和轉鐵蛋白,其中甲狀腺素運載蛋白和載脂蛋白A1是多肽分子,特異性高,是主要定性標志物[106-108]。這些應用初步顯示了多肽在臨床腫瘤診斷中的價值[109]。目前在多種腫瘤中,研究者廣泛開展了蛋白/多肽指紋圖譜檢測產品的研發和驗證工作(表3)[56,110-114]。
肺癌是我國發病率和死亡率均位居第1位的惡性腫瘤[115]。早期篩查和精準檢測有助于降低肺癌發病率、死亡率和醫療負擔[116-117]。通過MALDI-TOF MS檢測非小細胞肺癌血清多肽組,發現11個差異多肽,基于遺傳算法(genetic algorithm,GA)建立的模型包含2個多肽特征峰,敏感度和特異度分別高達92.9%和91.7%[118]。另外也有學者通過MALDI-TOF MS檢測血清多肽組,基于K-近鄰算法(K-nearest neighbor,KNN)建立包含5個差異性多肽的非小細胞肺癌診斷模型,測試集敏感度和特異度分別高達80.7%和91.2%[119]。近期,研究者基于ClinMS-PlatⅠ血清多肽指紋圖譜檢測技術,納入了12家大型臨床中心的11 345例肺癌隊列樣本進行肺癌的血清蛋白/多肽指紋圖譜檢測,對于肺部結節患者同時結合CT影像特征數據,進行人工智能分析,建立模型。模型經測試集評估敏感度和特異度分別高達90.4%和97.6%,其中原位癌檢出率85.7%,Ⅰ期肺癌檢出率高達90.8%,針對臨床難判結節相對集中的5~15 mm肺結節的檢測準確度高達93.2%,展現出優異的性能[56]。目前該項研究成果已實現定型和產品化,可以優化肺癌的低劑量螺旋CT檢測中的假陽性和漏檢問題[120],為肺癌和肺結節的臨床檢測提供診療參考。
圖1 蛋白/多肽指紋圖譜檢測技術建立流程圖
表3 蛋自/多肽指紋圖譜在腫瘤診斷中的主要研究及其階段
注MALDI-TOF MS:基質輔助激光解析離子化飛行時間質譜;LDT:實驗室自建項目;CE-MS:毛細管電泳質譜;NA:缺失值(not available)
消化系統腫瘤在我國發病率較高,其中結直腸癌、肝癌、胃癌、食管癌和胰腺癌五大癌種均位居前十,且是除肺癌外死亡率最高的五大癌種[115],早篩早診對于消化系統五癌防控意義重大[121-125]。目前指南和專家共識推薦的消化系統五癌篩查和早診技術以內鏡學和影像學為主[122-124,126-127],存在侵入性或輻射危害,依從性低,資源有限,臨床急需新的液體活檢技術對消化系統五癌高危人群進行富集,減少不必要的內鏡學或影像學檢查,提高高危人群依從性,降低醫療負擔。有學者基于多肽組學數據和人工神經網絡(artificial neural network,ANN)構建了包含4個多肽特征峰的結直腸癌檢測模型,敏感度和特異度分別高達91%和93%[128]。另一個基于5個多肽特征峰建立的模型診斷結直腸癌的敏感度和特異度分別高達82%和93%[129]。基于MALDI-TOF MS平臺檢測多肽組,采用邏輯回歸建立的包含5個多肽的診斷模型診斷結直腸癌敏感度和特異度分別高達95.6%和87.9%[130]?;谀蛞憾嚯慕M學數據建立的包含31個多肽特征峰的模型對肝細胞癌和非肝細胞癌人群(包括肝硬化、非肝硬化肝疾病和健康人群)判別的敏感度和特異度分別為79.5%和85.1%[110]?;诙嚯慕M學數據和徑向基函數神經網絡(radial basis function neural network,RBFNN)建立的包含6個多肽特征峰的模型用于識別肝細胞癌骨轉移和未轉移患者的敏感度和特異度分別為85.3%和85.7%,受試者工作特征曲線(receiver operating characteristic,ROC)曲線下面積為0.911[81]?;诙嚯慕M學數據,通過GA、有監督神經網絡(supervised neural network,SNN)和快速分類(quick classifier,QC)算法構建的蛋白/多肽指紋圖譜診斷模型,診斷胃癌的平均敏感度和特異度分別為79.3%和86.5%[111]。采用QC算法構建的包含5個多肽特征峰的食管鱗狀細胞癌診斷模型的敏感度和特異度分別高達98.5%和97.2%[112]。采用經多肽組學數據分析發現的m/z為3 884和5 959的2個多肽建立的模型用于識別胰腺癌,敏感度和特異度分別高達86.3%和97.6%。在常規腫瘤標志物CA19-9和癌胚抗原(carcinoembryonic antigen,CEA)檢測過程中,加入m/z為3 884的多肽,可有效提升結果的準確度[131]。這些研究表明,蛋白/多肽指紋圖譜在消化系統五癌篩查和輔助診斷中的巨大潛力,然而尚需開展多中心大樣本的研究驗證其性能。
近期,研究者基于ClinMS-PlatⅠ血清多肽指紋圖譜檢測技術,納入12家不同中心的11 097例結直腸癌隊列臨床樣本進行結直腸癌的血清蛋白/多肽指紋圖譜的建模、測試和驗證。經驗證,結直腸癌血清多肽指紋圖譜模型的敏感度和特異度分別高達85.8%和89.6%,其中早期結直腸癌檢出率高達85.6%,顯示早診的特性,有助于降低結直腸癌發病率、死亡率和醫療負擔[56]。目前該項研究成果已實現定型和產品化。另外在泌尿系統腫瘤中,基于尿液多肽組學數據和KNN算法篩選的5個多肽特征峰建立的模型對膀胱癌診斷的敏感度高達93.4%,其中早期檢出率90.0%,在健康人群和血尿癥患者中的特異度分別為97.8%和73.3%[132]。有研究分析721例膀胱癌患者尿液多肽組,基于SVM建立了包含116個多肽的蛋白/多肽指紋圖譜模型,用于膀胱癌檢測,經大樣本驗證后顯示,對于膀胱癌的敏感度和特異度分別為91.1%和67.6%[113]。在生殖系統腫瘤中,基于多肽組學數據來源的蛋白/多肽指紋圖譜可有效區分Ⅰ期卵巢癌患者和非卵巢癌人群[133]。序列為VSFELFADK和FEDENFILK的2個多肽在卵巢癌患者血漿中水平增加,檢測卵巢癌的特異度均為100%,敏感度分別為75%和78.6%[134]?;谘逯?個差異多肽[谷氨酸-酪氨酸(Glu-Trp)、羥脯氨酸-亮氨酸(Hyp-Leu)和苯丙氨酸-苯丙氨酸(Phe-Phe)]檢測早期上皮性卵巢癌的敏感度和特異度分別為63.6%和84.5%,雖然與腫瘤標志物CA125(敏感度81.8%,特異度63.8%)性能相似,但與CA125聯合后敏感度和特異度分別高達80.4%和94.4%[135]。在前列腺癌中,分析823例前列腺特異性抗原(prostate specific antigen,PSA)<15 ng/mL患者的尿液多肽組,基于SVM建立了包含19個差異多肽的蛋白/多肽指紋圖譜模型。在280例前列腺癌外部驗證隊列中發現,該模型對高級別前列腺癌以及低級別前列腺癌和(或)非泌尿系統疾病的敏感度和特異度分別為89.6%和59.1%[114]。在乳腺癌中,基于SVM篩選的3個差異性多肽特征峰建立的診斷模型的敏感度和特異度分別高達91.9%和91.7%,而傳統乳腺癌標志物CA15-3對同一人群的敏感度和特異度僅為41.7%和43.2%[136]。
除了在單癌種篩查和輔助診斷中的研究外,在多癌種檢測中,蛋白/多肽指紋圖譜檢測也顯示出優異性能。基于MALDI-TOF MS檢測和無監督聚類分析的研究發現,血清中651個多肽可有效區分前列腺癌、乳腺癌、膀胱癌和對照人群,并且在3種腫瘤中血清蛋白/多肽指紋圖譜特征不同[137]。近期,研究者基于ClinMS-PlatⅠ血清多肽指紋圖譜檢測技術,納入14家臨床中心11 921例樣本,建立了包括結直腸癌、肝癌、胃癌、食管癌和胰腺癌消化系統五大癌種的檢測模型,模型的敏感度和特異度分別高達82.3%和89.7%,早期檢出率也高達81.3%,同時癌種溯源綜合準確度達到83.1%[56]。
指導意見6:蛋白/多肽指紋圖譜檢測為腫瘤檢測提供了一種高效、便捷、精準且具有廣泛應用潛力的方法。初步實現了對肺部腫瘤和結直腸腫瘤的早期檢測、肺結節的良惡性鑒別和消化系統五大癌種(結直腸癌、肝癌、胃癌、食管癌和胰腺癌)的聯合檢測。其他基于蛋白/多肽指紋圖譜檢測的產品處于基礎研究層面,尚未成熟。
3.2 蛋白/多肽指紋圖譜檢測用于腫瘤精準治療決策
指導蛋白/多肽指紋圖譜檢測同樣可用于腫瘤精準治療決策指導(表4)[138-146]。2007年,Taguchi等[138]使用MALDI-TOF MS檢測非小細胞肺癌患者的血清樣本獲得多肽組學數據,基于其中8個差異多肽建立模型,可有效預測非小細胞肺癌患者使用表皮生長因子受體酪氨酸激酶抑制劑(epithelial growth factor receptor tyrosine-kinase inhibitors,EGFR-TKIs)后的臨床預后情況。隨后這個模型被應用于商品化檢測項目VeriStrat。該項目的效果已在非小細胞肺癌的多項個體化治療研究中得到驗證[139-140],并通過FDA審核,被納入2016年的美國國立綜合癌癥網絡指南建議[141-143]。一個基于血漿多肽組學數據和RF算法建立的包含3個多肽的模型有效區分局部進展期直腸癌患者術前新輔助放化療的敏感性,敏感度達到77.8%,特異度為91.7%,總體準確度為85.7%[144]。我國研究者通過分析晚期肺鱗癌患者接受紫杉醇聯合鉑類化療前血液樣本多肽組,基于5個差異多肽特征峰建立了晚期肺鱗癌患者接受紫杉醇聯合鉑類化療方案的敏感性預測模型,敏感度為90.0%,特異度為80.0%[145]。轉移性黑色素瘤預后較差,免疫治療作為一線或二線可選的治療方案能有效改善患者無進展生存期和總生存期,然而僅30%的患者對免疫治療有反應,傳統采用免疫組織化學檢測程序性死亡配體1(programmed cell death-ligand 1,PD-L1)難以有效篩選出對免疫治療響應人群。有研究采用MALDI-TOF MS分析免疫治療前轉移性黑色素瘤患者血清樣本多肽組發現,基于其中209個多肽特征峰的蛋白/多肽指紋圖譜能有效預測患者對免疫治療的敏感性,并經過5組共170例轉移性黑色素瘤患者驗證,HR=0.15(95%CI:0.06~0.40)[146]。
表4 蛋白/多肽指紋圖譜在腫瘤精準治療決策指導中的主要研究及其階段
注EGFR-TKIs:表皮生長因子受體酪氨酸激酶抑制劑;MALDI-TOF MS:基質輔助激光解析離子化飛行時間質譜;NCCN:美國國立綜合癌癥網絡;
指導意見7:蛋白/多肽指紋圖譜檢測已成功應用于評估EGFR野生型非小細胞肺癌患者使用EGFR-TKIs的預后情況,輔助臨床做出治療決策。一些蛋白/多肽指紋圖譜檢測與直腸癌和黑色素瘤等的治療敏感性有關,但仍需更多臨床試驗進一步驗證。
3.3 蛋白/多肽指紋圖譜檢測用于腫瘤患者療效和預后評估
腫瘤治療后,需對其療效和預后進行監測,評估治療效果和及時發現復發情況。有研究通過硅納米材料試劑盒捕獲多肽結合MALDI-TOF MS建立模型檢測蛋白/多肽指紋圖譜可以預測轉移性結直腸患者對標準一線化療方案的治療反應,并發現間-alpha-胰蛋白酶抑制劑重鏈H4(interalpha-trypsin inhibitor heavy chain 4,ITIH4)及其肽段與結直腸癌對5-FU的耐藥性相關[147]。另有研究發現,多肽Pro-GRP不僅可用于小細胞肺癌的診斷,同樣可在其復發監測中發揮作用,敏感度和特異度分別為70%和91%[148]。有學者分析636例膀胱癌患者尿液多肽組,基于SVM建立了包含106個多肽的蛋白/多肽指紋圖譜模型。該模型對膀胱癌復發預測的敏感度和特異度分別高達87%和57%[113];隨后經有隨訪結果的331例患者驗證,顯示出良好的預后評估價值(HR=3.15,95%CI:1.73~5.70)[149]。采用MALDI-TOF MS檢測揭示乳腺癌血清多肽組的研究發現,纖維蛋白原α鏈(fibrinogen alpha chain,FGA) 605-629、ITIH 347-356和載脂蛋白A2(apolipoprotein A2,APOA2) 43-52共3個多肽組合模型可用于乳腺癌的診斷和評估預后情況[150]。
指導意見8:蛋白/多肽指紋圖譜檢測在腫瘤患者療效和預后評估中的應用潛力有待挖掘,目前處于基礎研究階段,仍需大量的臨床數據支持,以擴展至更多癌種。
4. 小結與展望
腫瘤是全球人類死亡的主要原因之一,對其進行精準檢測是提高療效和降低發病率、死亡率與醫療負擔的有效方式。目前,蛋白/多肽指紋圖譜研究正處于蓬勃發展階段,蛋白/多肽指紋圖譜的檢測分析方法和臨床應用正日益受到重視,并在醫學領域展現出巨大的潛力,多款多肽檢測產品的臨床應用顯示了良好的價值。我國研究者近年來也基于蛋白/多肽指紋圖譜推出了多款腫瘤檢測產品,包括單癌種和多癌種。
未來期望更多的研究關注以下方面以拓展蛋白/多肽指紋圖譜在臨床腫瘤防控中的應用:
(1)深入揭示腫瘤中多肽的表達機制,研究不同多肽在腫瘤的發生、發展以及對治療的敏感性與耐藥性的影響和機制,為后續蛋白/多肽指紋圖譜檢測產品的開發提供更加扎實的理論依據;
(2)技術層面,開發新型多肽捕獲富集和保護技術和檢測技術,提升檢測結果的穩定性、可重復性和準確度,建立符合臨床要求的檢測流程,為臨床應用奠定基礎;
(3)利用機器學習和深度學習算法對多肽組學數據進行分析,從海量的多肽組學數據中識別出具有診斷或預后意義的多肽特征峰,將多種多肽特征峰組合建立蛋白/多肽指紋圖譜模型,以及與其他生物標志物結合,或組學數據整合,構建更可靠的模型;
(4)開展多中心大樣本的臨床研究,綜合評估模型性能,并在預期應用場景中開展前瞻性研究,以及真實世界評估對人群腫瘤發病率與死亡率的影響和經濟效益情況。本專家共識全面梳理了蛋白/多肽指紋圖譜的檢測分析技術、臨床應用及其在腫瘤管理中的潛力,提出了一系列具有前瞻性和實踐指導意義的共識推薦。未來,期待本專家共識進一步落地和實踐,助力蛋白/多肽指紋圖譜檢測產品的研發、轉化和臨床應用,為居民的健康保駕護航。
專家組成員(按姓名漢語拼音字母排序):陳湖光(浙江大學醫學院附屬第一醫院)、陳益定(浙江大學醫學院附屬第二醫院)、丁小文(浙江省腫瘤醫院)、范鈺(江蘇大學附屬人民醫院)、高越(杭州市第一人民醫院)、韓明勇(深圳大學附屬華南醫院)、何正富(浙江大學醫學院附屬邵逸夫醫院)、胡集祎(上海市質子重離子醫院)、黃凌(廣東省人民醫院)、姜武(中山大學腫瘤防治中心)、梁文華(廣州醫科大學附屬第一醫院)、梁霄(浙江大學醫學院附屬邵逸夫醫院)、劉建(浙江省中醫藥大學附屬第二醫院)、沈虹(浙江大學醫學院附屬第二醫院)、宋章法(浙江大學醫學院附屬邵逸夫醫院)、談潔(湖南大學化學化工學院)、唐勇(廣西醫科大學附屬腫瘤醫院)、王彩琴(湖南省腫瘤醫院)、鄔建敏(浙江大學化學系)、熊斌(武漢大學中南醫院)、余捷凱(浙江大學醫學院附屬第二醫院)、袁瑛(浙江大學醫學院附屬第二醫院)、翟曉慧(中山大學附屬第六醫院)、張大(鄭州大學第一附屬醫院)、張燕(中山大學附屬第六醫院)
參考文獻
[1] Li L, Wu J, Lyon CJ, et al. Clinical peptidomics:advances in instrumentation, analyses, and applications[J]. BME Front, 2023, 4:0019.
[2] Maes E, Oeyen E, Boonen K, et al. The challenges of peptidomics in complementing proteomics in a clinical context[J]. Mass Spectrom Rev, 2019, 38(3):253-264.
[3] Cabrera-Quio LE, Herberg S, Pauli A. Decoding sORF translation-from small proteins to gene regulation[J].RNA Biol, 2016, 13(11):1051-1059.
[4] Figueiredo D, Cruz RGB, Normando AGC, et al. Peptidomics strategies to evaluate cancer diagnosis, prognosis,and treatment[J]. Methods Mol Biol, 2024, 2758:401-423.
[5] Latosinska A, Frantzi M, Siwy J. Peptides as"better biomarkers"? Value, challenges, and potential solutions to facilitate implementation[J]. Mass Spectrom Rev, 2024,43(6):1195-1236.
[6] Mavrogeorgis E, Mischak H, Latosinska A, et al. Reproducibility evaluation of urinary peptide detection using CE-MS[J]. Molecules, 2021, 26(23):7260.
[7] Dakna M, Harris K, Kalousis A, et al. Addressing the challenge of defining valid proteomic biomarkers and classifiers[J]. BMC Bioinformatics, 2010, 11:594.
[8] Anderson NL, Anderson NG. The human plasma proteome:history, character, and diagnostic prospects[J]. Mol Cell Proteomics, 2002, 1(11):845-867.
[9] Thomas S, Hao L, Ricke WA, et al. Biomarker discovery in mass spectrometry-based urinary proteomics[J]. Proteomics Clin Appl, 2016, 10(4):358-370.
[10] Begcevic I, Brinc D, Drabovich AP, et al. Identification of brain-enriched proteins in the cerebrospinal fluid proteome by LC-MS/MS profiling and mining of the Human Protein Atlas[J]. Clin Proteomics, 2016, 13:11.
[11] Vitorino R. Digging deep into peptidomics applied to body fluids[J]. Proteomics, 2018, 18(2):1700401.
[12] Decramer S, Gonzalez de Peredo A, Breuil B, et al. Urine in clinical proteomics[J]. Mol Cell Proteomics, 2008,7(10):1850-1862.
[13] Magalh?es P, Pontillo C, Pejchinovski M, et al. Comparison of urine and plasma peptidome indicates selectivity in renal pep
- 上一篇:蛋白質組學基礎知識 2025/1/11
- 下一篇:不同檢測中心的納米粒子表面蛋白冠檢測差異性分析——重復性分析 2025/1/6