介绍Kaplan-Meier曲线的文章。
绘制K-M曲线是简单的,只需要在相应的spreadsheet的菜单中选择'Kaplan Meier Plot'即可。
绘制时,所有的缺失值被移除
分组
对于连续性变量,如果一个spreadsheet中存在多个变量,则首先求其平均值。然后会有以下3种分组方式可以选择:
- 2 groups,使用median划分;
- 3 groups,将数据按照值的大小排序后3等分;
- quartiles,只保留小于25%分位数和大于75%分位数的样本并作为两组。
对于分类变量,则至多只会展示其前10个类别。
对于mutation数据,将样本划分为有突变和没有突变两个组。
也可以定义自己的subgroups,详见。
注意事项
如果存在重复样本(比如同一个人的正常组织和肿瘤组织),则得到的p值会存在警告,需要使用filter将重复的数据滤除。
使用log-rank检验,等同于R中的
survdiff
。如果数据从存在不同的生存时间类型,则可以选择不同的生存类型可视化。
可以选择生存数据到底截止到1年还是5年。