UCSC Xena 搜索-高亮-过滤-分组


依靠上方的搜索框,可以完成一系列数据筛选工作,甚至可以创建自己的分组。


我们可以在上面输入supported search terms,符合这些terms的样本将被高亮并使用black bar标记,然后就可以通过右侧的filter button下的不同的选择实现不同的功能:

  • Filter:将那些没有被高亮的样本移除。

  • Zoom:方法这些被高亮的样本。

  • New column:创建一个新的spreadsheet,其中被高亮的样本为True,不符合的样本为False,然后这个spreadsheet就可以用于接下来的分析(比如K-M plot等等)。

    可以选择spreadsheet下拉菜单中的display,将true和false改成其他的名称。

支持的search terms

  1. 分类features:某个分类变量的level,比如Stage变量的'IIA'或'Stage IIA'。

  2. 连续features:必须使用"ABC..."来进行,"A:>2"来选择大于2的样本,还有=、>=、<=、<、>、!=等。

  3. 对于mutation数据:

    • 找到所有存在protein change的mutations的样本:V600E
    • 找到所有功能影响是'frame'或'nonsense'的样本:D:frame OR nonsense
    • 找到所有TP53带有突变的样本:TP53
    • 找到所有TP53不带突变的样本:!=TP53
  4. 缺失值:

    • 所有没有缺失值的样本:!=null
    • 只有一列(第二列)有缺失值的样本:B:!=null
  5. 样本ID:TCGA-DB-A4XH。

  6. A表示第一列、B表示第二列、...,A:YES表示第一列中值为YES的样本。

  7. 逻辑运算符(OR、AND),还可以配合括号来改变运算顺序:"Stage II"(B:Negative OR C:Negative),表示任何column中有"Stage II"并且第二列是Negative或第三列是Negative的样本。


FOXM1 RNAseq表达以10为分界进行分组,并绘制K-M plot:



文章作者: Luyiyun
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Luyiyun !
评论
评论
 上一篇
论文精读-deepNF预测蛋白质功能-2018 论文精读-deepNF预测蛋白质功能-2018
本研究提出了一种新的整合多种蛋白质网络、提取蛋白质特征的方法用于预测蛋白质功能。其特点在于使用深度自编码器来融合多个网络的信息并提取特征(相对于其领域之前的方法mashup),并在yeast和human的数据集上进行了验证,显示出良好的效果。
2020-06-03
下一篇 
论文精读-VAE-2013 论文精读-VAE-2013
对变分自编码器(VAE)原论文的阅读。本文提出了一种新的技术,可以非常有效率地建模带有连续隐变量的数据。即特定是使用了神经网络来参数化后验分布和似然函数,并提出了重参数化的技巧来配合Monte Carlo梯度估计,从而可以使用SGD对上述模型进行训练。从另一个角度,其将自编码器和概率模型结合在一起,探索了一种新的自编码器框架。
2020-05-27
  目录