文獻解讀 | 攝入淀粉反而利于減肥!上交醫學院近20分腸道微生物+代謝組學Nature子刊文章,揭示維持健康體重新方案
之前為大家介紹了二代蛋白質組學(NGP)的優越性(詳情請見:顛覆傳統 | 三黍生物Astral DIA蛋白質組學產品重磅發布)。最新Orbitrap Astral儀器更高靈敏度、覆蓋度、精確度的“三高”屬性成為蛋白質組學新風向。Astral的出現也使蛋白質組學進入百元低價時代,我們該如何抓住機會趕上這趟車?
三黍生物新一代Astral系列檢測服務已全面上線,技術細節及研究經驗分享群開放中,對領先蛋白組技術感興趣的老師們可掃碼進群交流:

更多實測數據和產品信息,歡迎后臺咨詢~
由于目前使用Astral質譜儀進行蛋白質組學分析的文獻還較少,很多小伙伴表示了興趣,卻不太清楚如何將這一新技術用于自己的課題。今天就從一篇結合衰老、蛋白質組學時鐘等前沿熱點的一區文獻來為大家介紹如何將深度蛋白質組學技術用于疾病研究。
背景
隨著年齡增長,人類大腦會逐漸衰老,患神經退行性疾病的可能性也會增加,而了解衰老期人類體液中蛋白質組的變化可能會為神經退行性疾病的治療提供新的治療方案。為此,篩選生物體年齡相關的標志物對了解衰老的機制及確定干預措施來逆轉或延遲衰老都是非常重要的。
2024年6月24日,發表在Aging Cell(IF 8.0)上的題為“An interpretable machine learning-based cerebrospinal fluid proteomics clock for predicting age reveals novel insights into brain aging”的文章,由于腦脊液樣本很容液通過腰椎穿刺獲得,且可以更真實地反應大腦衰老的情況,作者在本研究通過對人類腦脊液(CSF)的蛋白質組學數據深入挖掘,利用機器學習的方法,開發出一個可以預測中樞神經年齡的模型。
腦脊液
蛋白質組學、機器學習
圖1 技術路線
作者檢測了437個臨床癡呆癥評級(CDR)為0即認知正常的不同年齡和種族的隊列樣本,該隊列的腦脊液樣本利用蛋白質組學技術共鑒定到7008種蛋白質。作者對蛋白質組學數據使用機器學習算法預測,得到一個1157種蛋白質模型來預測年齡(圖2)。圖2a顯示了經訓練的模型對年齡的預測(y軸)與驗證隊列中88名個體的實際年齡(x軸)。該模型的預測顯示,與CSF提取時的實際年齡高度一致,Pearson相關性為0.85,平均估計誤差為3.94年。
然后,在阿爾茨海默病(ADNI)的另外735名參與者的CSF蛋白質組上驗證了訓練后的模型。該模型在該隊列中繼續表現良好,Pearson與實際年齡的相關性為0.79,MAE為4.30(圖2b)。
最后作者創建了一個由44名確認為淀粉樣蛋白-β陰性和認知正常的個體組成的亞群,在這個亞群上驗證了我CSF衰老模型,并獲得了與整個隊列相似的結果,Pearson相關性為0.81,MAE為4.85(圖2c)。
這一驗證證實了該模型從CSF蛋白質組學預測年齡的能力。
圖2 通過CSF蛋白質組學彈性網絡模型預測年齡與時間順序年齡
為了了解隊列中CSF蛋白如何隨年齡變化,作者使用p<0.0001作為顯著性閾值,對數據中所有蛋白質的含量進行了Spearman與年齡的相關性分析。結果,在7008個可能的蛋白質特征中,2117個蛋白質特征(30%)與年齡顯著相關(圖3a)。其中,機器學習模型使用了340種與年齡相關的蛋白質(圖3b)。圖3c顯示了與年齡顯著相關的前10個蛋白質。
圖3 蛋白質通過斯皮爾曼相關性隨年齡而顯著變化
為了研究CSF中的哪些蛋白質可以預測衰老,作者從彈性網絡中提取特征,并根據模型權重對其進行排序,這表明每種蛋白質對最終預測的影響有多大。正值表示較高的蛋白質濃度預示著年齡的增長,而負值表示較高的濃度預示著更年輕的狀態。在7008種總蛋白質中,1157種被該模型用于預測衰老,589種蛋白質具有正值,而568種蛋白質具有負值。表1總結了從模型中提取的前10個蛋白質。
預測年齡增加的蛋白質主要有神經元損傷的生物標志物丙氨酸氨基轉移酶1(ALT)、神經絲重肽(NFH),神經炎癥標志物白細胞介素-7(IL-7)、粘附G蛋白耦合受體G1(GPR56),抗白蛋白酶(SLPI),肺表面活性劑相關蛋白D(SP-D)等。
預測年齡減小的蛋白質主要有抗炎和新陳代謝調節蛋白的丟失,比如補體C1q腫瘤壞死因子相關蛋白3(C1QT3),轉錄后修飾蛋白的丟失,比如GGPPS等。
表1 通過腦脊液蛋白質組學模型用于預測年齡的蛋白質
為了進一步了解CSF中年齡預測性蛋白質變化的生物學影響,作者對模型所用蛋白質的進行了通路富集。在該分析中使用了所有1157個蛋白質特征,并使用整個7008個可能的蛋白質集作為背景。Metascape總共發現了七種非冗余途徑,在這些途徑中,模型中的蛋白質顯著富集(p<0.01)。表2中提供了富集途徑和每種途徑中富集的蛋白質的列表。主要有糖蛋白激素、補體系統、A類受體清除、非整合蛋白膜結合的細胞外基質蛋白及其配體之間的蛋白質相互作用、TP53調節死亡受體和配體的轉錄、線粒體脂肪酸不飽和脂肪酸的β氧化。
表2 模型蛋白的通路富集
除了完整的1157蛋白質模型外,作者還開始使用盡可能少的蛋白質構建模型,同時保持準確性。通過對模型的不斷訓練,繪制了每個模型的Pearson相關性圖(圖4a)。模型準確度在109種蛋白質附近急劇下降,109種蛋白質模型(Pearson 0.84,p=1.13E-24)(圖4b)在ADRC測試數據上的表現幾乎與完整1157種蛋白質模型一樣好(Pearson0.85,p=2.79E-25)(圖2)。
為了在另一個隊列中驗證109蛋白模型,在整個ADNI隊列(Pearson 0.75,p=6.49E-132)(圖4c)和經驗證為淀粉樣蛋白β陰性和認知正常的ADNI參與者子集(Pearson0.83,p=4.48E-12)(圖4d)上運行預訓練模型。然后從模型中提取頂部蛋白質特征(圖4e),并將全部109個蛋白質特征用于通路分析。值得注意的是,來自全模型富集的所有途徑的代表都存在于109蛋白模型富集的途徑中。這些蛋白質可能含有足夠的年齡預測信息。
圖4 最小預測模型

圖5 CSF衰老模型在具有淀粉樣蛋白斑塊的認知正常(CDR = 0)組預測能力良好
綜上所述,本研究提出了一種新的基于CSF蛋白質組學的模型,它可以預測生物衰老,并為中樞神經系統的衰老生物學提供了新的見解。這些發現和工具可能為干預衰老和年齡相關疾病提供潛在的治療靶點。
三黍生物全面上線新一代Astral系列檢測服務!
相關研究文獻解讀,本公眾號持續更新中……
如果您有蛋白組學檢測分析需要,歡迎聯系我們了解實測數據和更多產品信息!
更多推薦:
文獻解讀 | 中藥文章提分思路大公開!福州市第二醫院IF 6.7代謝+網絡藥理,多組學+簡單實驗方法立馬學會

排版:野凌
審核:三黍生物企宣部