我有5列5个不同的p值.当5列中的任何一列中的值存在时,我希望在新列中标记.
我的数据是这样的:
Gene pvalue_group1 pvalue_group2 pvalue_group3 pvalue_group4 pvalue_group5
Gene1 0.01 0.2 NA NA NA
Gene2 NA 0.001 NA NA NA
Gene3 0.05 0.7 0.09 0.2 0.001
我希望输出一个如下所示的专栏:
Gene pvalue_group1 pvalue_group2 pvalue_group3 pvalue_group4 pvalue_group5 Group
Gene1 0.01 0.2 NA NA NA Group1, Group2
Gene2 NA 0.001 NA NA NA Group2
Gene3 0.05 0.7 0.09 0.2 0.001 Group1, Group2, Group3, Group4, Group5
我曾try 根据类似的问题创建代码,try 使用dplyr和samate(),但我还没有取得很大进展,如果有任何关于我可以try 哪些其他函数的帮助,将不胜感激.
输入数据示例:
df <- structure(list(Gene = c("Gene1", "Gene2", "Gene3"), pvalue_group1 = c(0.01,
NA, 0.05), pvalue_group2 = c(0.2, 0.001, 0.7), pvalue_group3 = c(NA,
NA, 0.09), pvalue_group4 = c(NA, NA, 0.2), pvalue_group5 = c(NA,
NA, 0.001)), row.names = c(NA, -3L), class = c("data.table",
"data.frame"))