尽管Oncomine将于2022年1月17日终止服务,但是生信分析是大势所趋。在芒果分享的百篇生信论文中,用到Oncomine的文章达到50%以上。鉴于此,芒果结合百篇生信论文实例展示使用方法,从网站思路,到数据展示,到方法写作和结果描述,全景式展示Oncomine平台的使用,也就汇总成生信漫谈01:Oncomine教程。
Oncomine平台已经无法使用,但是生信分析还要继续。芒果个人判断,GEPIA或许是综合分析TCGA数据最好的平台,而且还在不断优化。因此,结合生信论文百篇,芒果将继续推出生信漫谈02:GEPIA教程。当然,GEPIA平台也存在些许不足。
①数据来源限于TCGA和GTEx,而Oncomine主要源于GEO,也包含TCGA,因此Oncomine的数据来源更广泛。但是相比于UALCAN和TIMER等数据库,GEPIA的数据还包括正常数据库GTEx数据。相比而言,GEPIA的分析结果更可靠。归纳如下:
Oncomine:GEO、TCGA和已发表文献等来源的RNA和DNA-seq数据;
GEPIA:TCGA+GTEx;
UALCAN:TCGA(转录数据),CPTAC(蛋白数据),CBTTC(儿童脑肿瘤);
TIMER:TCGA。
②Oncomine数据可以自主下载再处理,而GEPIA只能分析数据,无法下载TCGA和GTEx的原始数据。要下载TCGA数据,只能去TCGA官网下载处理。
③GEPIA在差异分析时,p-value没有具体数值,也就是无法区分p值在0.05,0.01和0.001等的区间,fold-change和gene rank也没有。
④生存分析相对简单,临床信息太少,这个可以通过KM plotter数据来弥补。
⑤GEPIA是公益数据路,不收取费用,但是不支持个人上传数据进行个性化分析。
GEPIA是一种新开发的交互式网站,使用标准流程(上图)处理分析来自TCGA和GTEx项目的9,736个肿瘤和 8,587个正常样本的RNA 测序表达数据。GEPIA提供可定制的功能,例如肿瘤/正常差异表达分析、根据肿瘤类型或病理分期进行分析、患者生存分析、相似基因检测、相关性分析和降维分析。该工具由北京大学张实验室的Zefang Tang、Chenwei Li 和Boxi Kang开发。GEPIA使用的RNA-Seq数据集基于UCSC Xena 项目 (),由标准流程计算。
文献引用
Tang, Z. et al. (2017) GEPIA: a web server for cancer and normal gene expression profiling and interactive analyses. Nucleic Acids Res.
GEPIA网址(建议收藏保存)
style="white-space: normal;">
GEPIA由张泽民教授团队负责维护和更新,而张泽民是单细胞测序领域的核心人物之一(见下图),背后是我们国家财政的支持。因此,我们可以信心满满地预见其相当长时间内不会像Oncomine那样遗憾离场。

BIOPIC PI(左起:孙育杰、白凡、高歌、黄岩谊、张泽民、邓伍兰、魏文胜、谢晓亮、汤富酬、葛颢、苏晓东、邢栋、高毅勤、赵新生)
其次,不像Oncomine那样麻烦,GEPIA无需edu后缀的邮箱注册,门槛相当低,任何人都可以免费使用;操作非常简单,通过点点点就可以进行综合全面的分析;非常适合生信分析入门。
GEPIA数据库的主要功能
单基因分析,差异分析,与肿瘤分期的相关性,生存分析和相似基因。
肿瘤类型分析,包括筛选与肿瘤关系、影响生存最密切的基因。
多基因分析,包括基因表达的相关性和降维分析等。
免疫细胞类型分析,用于探究肿瘤的免疫浸润分析(GEPIA2021新增)。
关于具体的使用方法,芒果结合百篇生信论文实例,从网站思路,到数据展示,到方法写作和结果描述,全景式展示GEPIA的使用,敬请期待和支持。