UCSC Xena Visual-Spreadsheet介绍


整个可视化界面有多个动态的spreadsheets组成,任何数据都可以形成一个spreadsheet。所有的spreadsheets横向排列在一起,使得每一行是相同的一个样本,便于查看样本间的趋势。样本会被排序,顺序是先按照最左边的spreadsheet上的值排序,然后依次向右逐步推进。

移动排序

我们可以通过拖动spreadsheet来改变spreadsheets间的顺序,从而改变样本排列的顺序。


放大功能

框选部分范围(部分样本或部分变量),将会放大选中的部分。点击页面顶部的Clear Zoom则取消放大。如果只想取消单个spreadsheet的放大显示,则点击spreadsheet中出现的红色x即可。


Tooltips

Tootip位于页面顶部,用来显示当前鼠标所指的数据的信息。


如果想要freeze住当前鼠标指定的数据的信息,可以使用'Alt+click',unfreeze则点击右边的x即可。


Gene Signatures

即我们可以人为的创造多个gene expression的weighted sum作为一个spreadsheet。其具体做法如下所示:


注意事项:

  • +-两边必须加空格
  • 必须选择Gene Expression

UCSC Xena官方基于TCGA Pan-Cancer计算了一些signatures:

这些可以在Genomic型数据中(Show Adanced)中找到。

数据展示

样本的排序:

  • 对于copy number数据,其使用整个gene regions上的值的平均值来排序。
  • 对于mutation数据,使用其最早发生变异的position来进行排序。

对于以上两类数据,我们可以放大其部分,这样,排序的依据将依照这放大的部分进行。

整个spreadsheet的图示部分可以分为3个区域,即:

  • gene/chromosome展示区
  • 表达量展示区
  • 图例区


1. gene/chromosome展示区

  • 在输入数据时,使用gene名或probes来选择gene

    绘制这个gene的transcript。其中CDS区域(coding DNA Sequence,编码序列)使用较高的black bar表示,UTR区域(untranslated Regions,位于mRNA两端的非编码序列)使用较矮的black bar表示,内含子区域(intron region,可变剪切切除的区域)单纯使用轴表示。


    如果mutation数据,则可以选择是否显示内含子区域,注意,此时下面的变异点的可视化也会随之变化。


  • 可以输入整个chromosome(chr1)、chromosome的arms(chr19q)或者chromosomes的定位(chr1:1-2000000)来得到gene区域的表示

    这里所有的gene都会表示出来,也无法隐藏gene的intron region

    因为许多gene其所占的在染色体上的区域会有重叠,所以这里使用了多行来表示。


2. 表达量展示区

这个区域主要是以heatmap的形式显式的。唯一的区别在于mutation的数据,其在对应的的发生图片的位点上使用不同颜色的点来表示。

还要注意,exon RNAseq数据和Rnaseq数据有所不同,exon数据单个gene会有多个值,分别代表每个exon的表达。


3. 图例区

在最下面,比如越红表示值越大,不同的mutation type使用不同的类型表示...

功能菜单

在spreadsheet的右上角,有一个下拉菜单,有许多其他功能,这些功能会在其他章节中分别介绍。


文章作者: Luyiyun
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Luyiyun !
评论
评论
  目录