我有一个以下数据框:

df <- data.frame(Org_name = c("A", "B", "C", "D", "A", "D", "C", "B"),
                 Symbol = c("F", "P", "X", "F", "F", "O", "O", "P"))

它包含四个"ORG_NAME"(A,B,C,D)变量值,与四个"符号"变量(F,P,X,O)值之一相关联.

我想要计算一下,在所述数据框中,有多少"符号"列中的F、P、X或O与"orga_name"列中的A、B、C或D相关联.

结果应该如下所示:

df1 <- data.frame(Org_name = c("A", "B", "C", "D"),
                  F_freq = c("2", "0", "0", "1"),
                  P_freq = c("0", "2", "0", "0"),
                  O_freq = c("0", "0", "1", "1"),
                  X_freq = c("0", "0", "1", "0"))

我正在努力解决这个问题,但经过几个小时的努力,我离最终结果还差得很远.

欢迎任何建议.

推荐答案

基于R:

tab <- as.data.frame.matrix(table(df$Org_name, df$Symbol))
cbind(Org_name = rownames(tab), data.frame(tab, row.names=NULL))

另一个选项是janitor::tabyl:

df %>% 
  janitor::tabyl(Org_name, Symbol)

输出

 Org_name F O P X
        A 2 0 0 0
        B 0 0 2 0
        C 0 1 0 1
        D 1 1 0 0

R相关问答推荐

判断字符串中数字的连续性

从开始时间和结束时间导出时间

任意列的欧几里得距离

如何将旋转后的NetCDF转换回正常的纬度/经度网格,并使用R?

R根据条件进行累积更改

如何优化向量的以下条件赋值?

R函数‘paste`正在颠倒其参数的顺序

为什么当用osmdata映射R时会得到相邻状态?

如何编辑gMarginal背景以匹配绘图背景?

使用外部文件分配变量名及其值

如何在观测缺失的地方添加零

在使用bslb和bootstrap5时,有没有办法更改特定dt行的 colored颜色 ?

如何将R中数据帧中的任何Nas替换为最后4个值

线性模型斜率在减少原始数据时提供NA

如何从向量构造一系列双边公式

将多个列合并为一个列的有效方法是什么?

`-`是否也用于数据帧,有时使用引用调用?

多元正态分布的计算

是否可以将线性模型的p值添加到tbl_summary中

在生成打印的自定义函数中,可以通过变量将线型或 colored颜色 设置为NULL吗?