整个可视化界面有多个动态的spreadsheets组成,任何数据都可以形成一个spreadsheet。所有的spreadsheets横向排列在一起,使得每一行是相同的一个样本,便于查看样本间的趋势。样本会被排序,顺序是先按照最左边的spreadsheet上的值排序,然后依次向右逐步推进。
移动排序
我们可以通过拖动spreadsheet来改变spreadsheets间的顺序,从而改变样本排列的顺序。
放大功能
框选部分范围(部分样本或部分变量),将会放大选中的部分。点击页面顶部的Clear Zoom
则取消放大。如果只想取消单个spreadsheet的放大显示,则点击spreadsheet中出现的红色x即可。
Tooltips
Tootip位于页面顶部,用来显示当前鼠标所指的数据的信息。
如果想要freeze住当前鼠标指定的数据的信息,可以使用'Alt+click',unfreeze则点击右边的x即可。
Gene Signatures
即我们可以人为的创造多个gene expression的weighted sum作为一个spreadsheet。其具体做法如下所示:
注意事项:
+
和-
两边必须加空格- 必须选择Gene Expression
UCSC Xena官方基于TCGA Pan-Cancer计算了一些signatures:
- gene programs
- HRD score, genome-wide DNA damage footprint
- Immune Signature Scores (Denise Wolf et al)
- Stemness score (DNA methylation based)
- Stemness score (RNA based)
这些可以在Genomic型数据中(Show Adanced)中找到。
数据展示
样本的排序:
- 对于copy number数据,其使用整个gene regions上的值的平均值来排序。
- 对于mutation数据,使用其最早发生变异的position来进行排序。
对于以上两类数据,我们可以放大其部分,这样,排序的依据将依照这放大的部分进行。
整个spreadsheet的图示部分可以分为3个区域,即:
- gene/chromosome展示区
- 表达量展示区
- 图例区
1. gene/chromosome展示区
在输入数据时,使用gene名或probes来选择gene
绘制这个gene的transcript。其中CDS区域(coding DNA Sequence,编码序列)使用较高的black bar表示,UTR区域(untranslated Regions,位于mRNA两端的非编码序列)使用较矮的black bar表示,内含子区域(intron region,可变剪切切除的区域)单纯使用轴表示。
如果mutation数据,则可以选择是否显示内含子区域,注意,此时下面的变异点的可视化也会随之变化。
可以输入整个chromosome(chr1)、chromosome的arms(chr19q)或者chromosomes的定位(chr1:1-2000000)来得到gene区域的表示
这里所有的gene都会表示出来,也无法隐藏gene的intron region
因为许多gene其所占的在染色体上的区域会有重叠,所以这里使用了多行来表示。
2. 表达量展示区
这个区域主要是以heatmap的形式显式的。唯一的区别在于mutation的数据,其在对应的的发生图片的位点上使用不同颜色的点来表示。
还要注意,exon RNAseq数据和Rnaseq数据有所不同,exon数据单个gene会有多个值,分别代表每个exon的表达。
3. 图例区
在最下面,比如越红表示值越大,不同的mutation type使用不同的类型表示...
功能菜单
在spreadsheet的右上角,有一个下拉菜单,有许多其他功能,这些功能会在其他章节中分别介绍。