UCSC Xena

Tools

发布日期: 2020-06-03

更新日期: 2020-12-03

文章字数: 434

阅读时长: 1 分

阅读次数:

依靠上方的搜索框，可以完成一系列数据筛选工作，甚至可以创建自己的分组。

我们可以在上面输入supported search terms，符合这些terms的样本将被高亮并使用black bar标记，然后就可以通过右侧的filter button下的不同的选择实现不同的功能：

Filter：将那些没有被高亮的样本移除。
Zoom：方法这些被高亮的样本。
New column：创建一个新的spreadsheet，其中被高亮的样本为True，不符合的样本为False，然后这个spreadsheet就可以用于接下来的分析（比如K-M plot等等）。

可以选择spreadsheet下拉菜单中的display，将true和false改成其他的名称。

支持的search terms

分类features：某个分类变量的level，比如Stage变量的'IIA'或'Stage IIA'。
连续features：必须使用"ABC..."来进行，"A:>2"来选择大于2的样本，还有=、>=、<=、<、>、!=等。
对于mutation数据：
- 找到所有存在protein change的mutations的样本：V600E
- 找到所有功能影响是'frame'或'nonsense'的样本：D:frame OR nonsense
- 找到所有TP53带有突变的样本：TP53
- 找到所有TP53不带突变的样本：!=TP53
缺失值：
- 所有没有缺失值的样本：!=null
- 只有一列（第二列）有缺失值的样本：B:!=null
样本ID：TCGA-DB-A4XH。
A表示第一列、B表示第二列、...，A:YES表示第一列中值为YES的样本。
逻辑运算符（OR、AND），还可以配合括号来改变运算顺序："Stage II"(B:Negative OR C:Negative)，表示任何column中有"Stage II"并且第二列是Negative或第三列是Negative的样本。

FOXM1 RNAseq表达以10为分界进行分组，并绘制K-M plot：

Luyiyun

https://luyiyun.online/2020/06/03/tools/ucsc/ucsc-shfs/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源 Luyiyun !

UCSC Xena

论文精读-deepNF预测蛋白质功能-2018

本研究提出了一种新的整合多种蛋白质网络、提取蛋白质特征的方法用于预测蛋白质功能。其特点在于使用深度自编码器来融合多个网络的信息并提取特征（相对于其领域之前的方法mashup），并在yeast和human的数据集上进行了验证，显示出良好的效果。

2020-06-03 Paper Method

Deep Learning Omics

论文精读-VAE-2013

对变分自编码器（VAE）原论文的阅读。本文提出了一种新的技术，可以非常有效率地建模带有连续隐变量的数据。即特定是使用了神经网络来参数化后验分布和似然函数，并提出了重参数化的技巧来配合Monte Carlo梯度估计，从而可以使用SGD对上述模型进行训练。从另一个角度，其将自编码器和概率模型结合在一起，探索了一种新的自编码器框架。

2020-05-27 Paper-Method

Unsupervised Learning Variational Inference Deep Leanring

UCSC Xena 搜索-高亮-过滤-分组

支持的search terms

你的赏识是我前进的动力