蛋白质组学(Proteomics)是系统性研究一个生物样本(细胞、组织、血液、体液等)中全部蛋白质的种类、丰度、修饰状态、相互作用和功能的学科。它相当于基因组学在蛋白层面的延伸。可以帮助我们回答下面几个问题:
样本里有哪些蛋白?
每种蛋白的丰度是多少?
这些蛋白有没有发生翻译后修饰(磷酸化、乙酰化、泛素化等)?
它们相互作用形成了哪些通路或复合物?
在疾病、药物处理或不同条件下,它们如何变化?
蛋白质组学的核心研究内容包括蛋白质鉴定、蛋白质定量、蛋白翻译后修饰研究、蛋白质相互作用网络、亚细胞定位与空间分布。常见技术路线为样本制备→分离→质谱分析→数据分析→生物学解释。
一、蛋白质鉴定
蛋白质鉴定是蛋白质组学的基础目标,即明确样本中存在哪些蛋白。它一般依赖质谱技术(MassSpectrometry,MS),通过对肽段的精确测序并与数据库比对,推断出对应的蛋白。
1.蛋白质鉴定的基本原理
蛋白质鉴定主要遵循“自下而上(bottom-up)”思路:
①提取蛋白 → 样本裂解、定量
②酶解成肽段 →最常用胰蛋白酶,产生可预测的切割位点
③分离肽段 → 液相色谱(LC)将复杂混合物分离成相对简单的组分
④质谱分析 → MS/MS 测定肽段的质量和碎片离子
⑤数据库搜索 →将实验得到的肽段谱图与理论肽谱比对
⑥蛋白推断 → 将所有鉴定到的肽段归并,推断样本中有哪些蛋白
2.常用质谱策略
①DDA(Data-Dependent Acquisition)
也叫“依赖数据采集”
MS先扫描母离子,再选择强度高的前体离子进行碎裂
优点:谱图质量高,容易鉴定
缺点:偏向高丰度蛋白,可能漏掉低丰度信号
②DlA(Data-Independent Acquisition)
将全质量范围分成固定窗口,对每个窗口内的所有离子统一碎裂
优点:覆盖率高、重现性好,适合大规模定量
缺点:数据解析复杂,需要谱库
3.数据库与搜索引擎
①数据库:UniProt、SwissProt、NCBIRefSeg、定制蛋白数据库
②搜索引擎:Mascot、Sequest、MaxQuant、Proteome Discoverer、MSFragger
③典型输出指标:
Peptide-spectrum match(PSM):谱图匹配度
FDR(False Discovery Rate):假阳性控制,一般控制在1%以下
Protein score:综合肽段数量与匹配质量
4.结果质量控制
①多肽覆盖率(Sequencecoverage):匹配肽段覆盖蛋白序列的百分比
②冗余去除:同源蛋白/共享肽段需要合并处理
③定量校正:确保后续定量分析的可靠性
二、蛋白质定量
1.蛋白质定量的两大策略
①无标记定量(Label-Free Quantification,LFQ)
直接分析不同样本的质谱信号,不需要任何化学或同位素标签。
常用方法
谱图计数法(Spectral Counting):通过一个蛋白被鉴定到的肽段数量近似代表丰度。
峰面积法(MS1 Intensity):提取母离子峰面积,直接用强度定量(MaxQuant,Skyline常用)
优点:简单、成本低、适合大样本量
缺点:技术变异较大,需要严格归一化和批次效应校正
②基于标签的定量(Isotope/lsobaric Labeling)给不同样本加上质量标签,混合后统一分析,通过标签区分样本来源
SILAC(Stable lsotope Labeling by Amino acids in Cell culture):细胞培养时掺入轻/重同位素标记氨基酸,代谢标记,适合体外细胞实验,定量精确
TMT/iTRAQ:化学标签标记肽段N端&侧链,质谱碎裂后释放Reporter离子,可一次比较多组样本(TMT可16-plex),高通量
15N或180代谢标记:用稳定同位素标记整个蛋白或肽段,适合某些特殊生物体(如细菌),但成本高
2.数据处理与归一化
无论哪种策略,数据都需要”归一化(Normalization)“来消除技术偏差:
①总强度归一化(Total ion current)
②中位数归一化
③变异稳定变换(VST)
④批次校正(Batch effect correction):ComBat、limma、MSstats等
3.差异分析与统计学
①显著性检验:常用 t-test、ANOVA、moderated t-test
②多重检验校正:Benjamini-Hochberg控制FDR
③可视化:火山图、热图、箱线图展示差异蛋白
三、蛋白翻译后修饰研究(PTM)
1.概念与意义
蛋白翻译后修饰是指蛋白质在翻译完成后被酶催化发生的共价化学修饰,包括加成、切割、化学基团转移等。
它们赋予蛋白新的功能、活性或定位信号,实现动态调控。常见功能包括以下几种
①调控活性:如磷酸化激活/抑制酶活性
②改变定位:如脂修饰把蛋白锚定到膜
③调控降解:如泛素化标记蛋白进入蛋白酶体
④调节相互作用:改变复合物组装/解离
⑤调控信号通路:是信号转导网络的关键节点
2.常见PTMs类型
①磷酸化(Phosphoryla)
典型氨基酸位点:Ser,Thr,Tyr
功能特点:信号转导、酶活调控;可逆,动态快
②乙酰化(Acetylation)
典型氨基酸位点:Lys,N-terminal
功能特点:调控转录因子活性、染色质结构
③甲基化(Methylation)
典型氨基酸位点:Lys,Arg
功能特点:表观遗传调控、蛋白-蛋白互作
④泛素化(Ubiquitination)
典型氨基酸位点:Lys
功能特点:蛋白降解信号、调控稳定性
⑤SUMO化(SUMOylation)
典型氨基酸位点:Lys
功能特点:转录调控、DNA修复、应激应答
⑥糖基化(Glycosylation)
典型氨基酸位点:Asn(N-糖),Ser/Thr(O-糖)
功能特点:蛋白折叠、分泌、细胞识别
⑦脂修饰(脂肪酰化、异戊二烯化等)
典型氨基酸位点:Cys、Gly
功能特点:膜锚定、信号复合物定位
⑧羟基化、硝基化、ADP核糖化
典型氨基酸位点:特定位点
功能特点:多用于缺氧感应、DNA修复、免疫调控
3.PTM研究技术路线
①样本制备&富集
免疫沉淀富集:用特异性抗体捕获修饰肽段(如pSer/pTyr抗体)
化学富集:TiO₂/IMAC捕获磷酸化肽,Lectin捕获糖肽,抗K-ε-GG残基富集泛素化位点
切割策略:Trypsin+LysC提高覆盖率,必要时用多种酶
②质谱分析
DDA或DIA模式获取高质量MS/MS碎片
ETD、HCD、CID等多种碎裂方式结合,保护修饰位点信息
高分辨率质谱(Orbitrap、Q-TOF)提高定位精度
③数据分析
搜索引擎:MaxQuant、Proteome Discoverer、MSFragger、pFind
位点定位概率:如PTM score、Ascore,控制假阳性
定量分析:TMT、LFQ或PRM定量比较不同条件下修饰水平
通路分析:Kinase-substrate enrichment analysis(KSEA)、Motif分析找激酶/酶类调控网络
四、蛋白质相互作用网络(PPI)
1.概念和意义
①蛋白质相互作用网络的研究内容包括:
样本中有哪些蛋白质互相结合形成复合物
哪些蛋白在同一通路/信号链条中协同作用
哪些“枢纽”蛋白(hub protein)是调控的关键节点
②研究意义:
揭示信号通路和分子调控机制
挖掘疾病相关靶点
预测蛋白功能(未知功能蛋白可通过邻近蛋白推断)
构建系统生物学模型
2.研究策略
①实验学方法
共免疫沉淀(Co-IP)+质谱(MS)
经典方法,用抗体捕获bait蛋白及其结合伙伴,再MS鉴定
优点:特异性高
缺点:难捕获瞬时相互作用
亲和纯化-质谱(AP-MS)
使用带标签(Flag,HA,Myc,BioTag等)的诱饵蛋白,在生理条件下捕获复合物
常用于绘制大规模PPI图谱
生物素标记方法
BioID/TurboID/APEX:将生物素化酶融合到目标蛋白,在活细胞中标记近邻蛋白,再富集鉴定
优点:捕获瞬时、弱相互作用和邻近蛋白,适合膜蛋白
化学交联质谱(XL-MS)
用交联试剂固定蛋白间的空间邻近关系,再消化MS鉴定交联肽
可提供蛋白互作的空间距离信息
双杂交(Yeast Two-Hybrid)
用于验证二元相互作用,适合高通量筛选
Pull-down/GST-pulldown
体外验证两蛋白是否直接结合
②计算学方法
公共数据库:STRING,BioGRID,IntAct,DIP
网络推断:利用共表达、共定位、同源信息预测互作
多组学整合:结合转录组、磷酸化组等识别条件特异的互作
3.数据分析与网络构建
①节点(Node):蛋白
②边(Edge):互作关系
③网络特征分析
④度(degree):每个蛋白的互作数量
⑤中介中心性(betweenness):蛋白作为桥梁的重要程度
⑥模块化分析(module detection):识别功能模块/复合物
⑦可视化工具:Cytoscape、Gephi、STRING Web、R的igraph包
4.应用举例
①疾病机制研究:找出疾病相关网络模块
②药物靶点预测:找“hub”蛋白或关键通路作为干预点
③信号通路重建:结合磷酸化组学,重建激酶-底物网络
④动态互作谱:比较不同时间点、不同组织或不同处理条件下的互作网络变化
5.难点与前沿
①弱相互作用、瞬时复合物捕获难
②膜蛋白、低丰度蛋白互作研究难度大
③数据噪声高,需要严格的对照和统计学过滤
④新趋势:单细胞互作组学、空间互作网络、AI驱动的互作预测
五、亚细胞定位与空间分布
1.研究意义
蛋白质的功能往往依赖于它所在的位置,例如线粒体蛋白多参与能量代谢、凋亡;细胞核蛋白多调控转录、DNA修复;膜蛋白是信号转导和物质转运的核心
异常定位往往与疾病相关,比如肿瘤中B-catenin异常入核激活Wnt信号;神经退行疾病中蛋白错误聚集(a-syn、Tau)
因此,研究蛋白的空间分布可以帮助:精准推断功能、发现潜在病理机制、确认药物作用位点
2.实验策略
①亚细胞分馏+蛋白质组学
方法:通过差速离心、梯度离心、密度梯度分离等,将细胞分成细胞核、胞质、线粒体、溶酶体、膜组分等
后续分析:每个分馏做质谱,构建“亚细胞定位蛋白质组图谱”
代表性项目:HyperLOPIT(LOPIT=Localization of Organelle Proteins by lsotope Tagging)
②邻近标记技术(Proximity Labeling)
BiolD, TurbolD, APEX
将标记酶融合到靶蛋白,活细胞中标记附近蛋白(空间解析度高)
可以捕获动态重定位或膜/细胞器蛋白
③成像质谱(lmaging Mass Spectrometry)
MALDI-MSI、DESI-MSI
直接在组织切片上测定肽段或代谢物的空间分布
可以生成空间分辨率达到10-20μm的蛋白质分布图
④免疫荧光与显微成像
IF,ICC,免疫组化,验证特定蛋白的定位
结合共聚焦显微镜、超分辨显微镜、活细胞成像
⑤空间多组学整合
将空间蛋白组与空间转录组、单细胞转录组、代谢组叠加分析
识别组织微环境中“细胞-细胞互作热点”和“病变区域特征
3.数据分析与可视化
①定量分析:计算蛋白在不同分馏的相对丰度,判定其主要定位
②多维聚类:根据分布模式将蛋白归类到不同细胞器
③网络分析:整合互作组学,重建细胞器特异互作网络
④可视化工具:Cytoscape、pRoloc(R包)、ImageJ、Qupath、MSI专用软件
4.应用场景
①动态定位研究:如信号激活后转位、应激条件下蛋白重分布
②膜蛋白药物靶点筛选:找特定组织/细胞膜蛋白
③肿瘤微环境研究:解析肿瘤区、免疫浸润区的蛋白分布差异
④神经退行性疾病:追踪蛋白聚集/扩散路径
5.难点与前沿
①难点
分辨率限制:传统分馏容易交叉污染
动态变化难捕捉:需要时间序列实验
数据量庞大,需要多维统计和机器学习分类
②新趋势:
超高分辨空间质谱(10μm甚至单细胞级别)
空间多组学联合(蛋白+RNA+代谢)
AI图像分析,自动识别亚细胞定位模式
科研服务外包 想了解更多请关注:https://www.do-gene.com



