我有一个表达数据的数据框架,其中基因是行,列是样本.我还有一个DataFrame,其中包含表达式dataframe中每个样本的元数据.实际上,我的expr数据帧有30,000多行和100多列.然而,下面是一个包含较小数据的示例.
expr <- data.frame(sample1 = c(1,2,2,0,0),
sample2 = c(5,2,4,4,0),
sample3 = c(1,2,1,0,1),
sample4 = c(6,5,6,6,7),
sample5 = c(0,0,0,1,1))
rownames(expr) <- paste0("gene",1:5)
meta <- data.frame(sample = paste0("sample",1:5),
treatment = c("control","control",
"treatment1",
"treatment2", "treatment2"))
我想找出每个治疗过程中每个基因的平均值.在我使用Split()或GROUP_BY()的例子中,人们根据data.Frame中已经存在的列进行分组.但是,我有一个单独的数据帧(META),它对另一个数据帧(EXPR)中的列的分组进行分类.
我希望我的输出是一个以基因为行、以列为处理、以值为平均值的数据帧.
# control treatment1 treatment2
# gene1 mean mean mean
# gene2 mean mean mean