蛋白基因组学(Proteogenomics)利用蛋白质组学数据,尤其是高精度的串联质谱数据, 结合基因组和转录组数据对基因组进行注释。蛋白质组数据不仅可以对已注释的基因进行验证和校正,进而发现新基因,实现对基因组序列的重新注释,还能系统发现蛋白质特有的翻译后事件(如翻译后修饰和信号肽等)。随着基于串联质谱技术的蛋白质组学的快速发展,蛋白基因组学已成为功能基因组学研究不可或缺的重要工具。
生物研究对模式蓝藻Synechococcus sp. PCC 7002的蛋白基因组学进行了系统研究。蓝藻也称蓝细菌, 是一类产氧的光合自养生物,分布广泛, 对整个生物圈意义重大。是目前研究光合作用的模式生物之一。
研究综合采用了基于蛋白和肽段的分离技术以及高分辨质谱分析技术,通过深入的生物信息学分析,鉴定了超过92%的预测的编码基因, 校正了38个预测的编码基因并且发现了118个新基因。尤为重要的是,利用蛋白质组数据,实现了蛋白质翻译后修饰的系统全局发现,大规模鉴定了23种不同的翻译后修饰,其中绝大多数修饰是首次在蓝藻中发现。
进一步研究发现,参与蓝藻光合作用的大多数蛋白具有复杂的翻译后修饰系统,在不同的生长和处理条件下会发生动态变化,提示这些翻译后修饰在光合作用系统中起着重要的调控作用。
以上研究结果为蓝藻基因组的深入解读及其功能分析奠定了基础,也为深入研究蓝藻光合作用的分子机制提供了新的研究方向和研究思路。在以上工作的基础上,该研究建立了完整的蛋白质基因组学研究和分析流程,可适用于各种已经测序的原核生物, 并成为其中一项标准的注释流程,成为解读基因组及其功能分析的重要工具。
|