生物信息学

        随着蛋白质组学系统生物学研究的深入,数据产出的规模也越来越大,科研人员对样本生物功能的解读要求也越来越高,各类组学数据之间的对接也越来越复杂,生物信息学分析已经成为蛋白质组学研究过程中不可或缺的重要部分,iTRAQ数据分析即是生物信息学在蛋白质定量定性研究中的重要体现。
        生物信息学在蛋白质组学中的应用主要分为两类,定性分析定量分析。所谓的定性分析就是对肽段和蛋白的物化性质、生物功能等多方面的信息挖掘。最基础的应用领域就是蛋白质的鉴定,将质谱鉴定的肽段谱图数据和理论或基于实验数据的蛋白质酶解肽段数据库匹配,通过一定的匹配算法和假阳性率卡值,最终确定质谱谱图结果对应的蛋白质。
        通过肽段水平的生物信息学统计分析,发现有限肽段容易被质谱鉴定并且是所属蛋白质独有的肽段,即:PROTEOTYPIC PEPTIDES,人们利用这些肽段的特点,结合MRM等定量技术可以获得蛋白质高准确性的定量信息。各种模型算法在组学领域的应用,质谱结果中的肽段谱图计数和肽段信号强度也被用在绝对定量研究中,产生了非标记定量方法。
        此外,对于磷酸化、糖基化等蛋白翻译后修饰研究,也可以通过生信统计分析找到磷酸化位点附近氨基酸序列的特征模型(MOTIF),这些信息反过来可以协助我们寻找修改该位点的酶及其作用区域序列特征,从而预测可能发生翻译后修饰的蛋白。
        蛋白质水平上,生信分析设计蛋白质理化性质和生物功能解读。常用的生物注释分析包括GO分析(gene ontology),蛋白质功能区域(inter Pro,PFAM),生物通路分析(KEGG)以及蛋白间网络分析(IPA和STRING),其中我们为客户提供的iTRAQ数据分析结果,就涵盖了生信分析的一部分内容,包括
 

● 差异基因列表
● 上下调基因表
● 差异基因数目比较表
● 上下调基因数目比较表
● 鉴定蛋白理化性质表
● K-均值聚类类别表
● 时间序列的相关系数表
● GO功能表(仅限于UNIPROT来源的库)


样品间相关系数热图
◆ 层次聚类热图
◆ 主成分分析图
◆ K-均值聚类图
◆ GO功能富集图
◆ 差异基因的KEGG通路图
◆ STRING网络图
◆ 染色体定位图(若有染色体定位信息)



Copyright  © 2015-2021  基云(上海)生物技术有限公司
沪ICP备14042399号  |  技术热线:400-921-9969  |  tech@keecloud.com