ABSOLUTE是评估肿瘤纯度的常用软件之一,它可以利用肿瘤样本的CNV和SNV等信息,对肿瘤纯度进行估计,该软件采用R语言进行编写。
软件官网如下
http://archive.broadinstitute.org/cancer/cga/absolute
首先需要到官网注册一个账号,登录之后才可以下载到源代码的压缩包。下载好之后,在R里面安装其依赖包和对应的源代码包就可以了,安装过程如下
install.packages("numDeriv")install.packages("ABSOLUTE_1.0.6.tar.gz")
安装好之后,可以先测试一下。测试数据我是从以下链接下载的
http://software.broadinstitute.org/cancer/software/genepattern/modules/docs/absolute/2#exampledata
在这个网站上还推荐了各种参数的设置,可以参考运行代码如下
RunAbsolute( seg.dat.fn = "SNP6_blood_normal.seg.txt", min.ploidy = 0.5, max.ploidy = 8, max.sigma.h = 0.2, platform = "SNP_6.0", copy_num_type = "total", sigma.p = 0, results.dir = "test", primary.disease = "BLCA", sample.name = "cancer", max.as.seg.count = 1500, max.non.clonal = 1, max.neg.genome = 0.005)
sample.name
指定样本名称;results.dir
参数指定输出结果的目录,该目录包含以下文件
├── cancer.ABSOLUTE_plot.pdf├── cancer.ABSOLUTE.RData└── tmp
我们只需要看PDF文件就可以了。不提供肿瘤细胞体细胞突变数据时,该文件包含下面三种类型的图片
1. 肿瘤纯度和倍性的散点图
横坐标肿瘤倍性,纵坐标肿瘤纯度,每个点代表一个软件评估的结果。
2. 不同模型排序柱状图
SCNAs
代表体细胞CNV数据,karyotype
是根据预先筛选的TCGA肿瘤数据建立的模型,combined
代表综合前面两种模型。ABSOLUTE会根据这三种模型分别对肿瘤纯度评估的结果进行排序。
3. 肿瘤纯度评估结果
上述截图只是其中一个结果的截图,ABSOLUTE一次会给出多个评估结果。这多个结果会按照综合模型的打分进行排序,通常情况下,直接看第一个结果就可以了。
由于肿瘤样本的复杂性,建议同时提供体细胞突变的数据,这样可以综合利用CNV和SNV的信息去评估肿瘤纯度,比单纯利用CNV数据效果更好。
作者:庐州月光
链接:https://www.jianshu.com/p/5c51ddc15141
共同学习,写下你的评论
评论加载中...
作者其他优质文章