dplyr：通过迭代向量来根据某些条件填充列

发布于05月10日

我正在寻找一种tidyverse解决方案，通过迭代向量，根据某种条件填充列.

Column prev represents previous state of a system, new represents the new state. prev and new are always in sequence, but some of them may loop, like in the example below.
0 and 100 values are start and finish states, the states represented here as letters are the important ones.

对于prev和new的特定组合(即，同时满足prev_condition和new_condition)，我需要迭代一个更大的向量vec(它的元素比可能的状态组合多)，并将值按顺序放入第to_do列

我想补充一点，prev和new的组合不需要是唯一的，这就是为什么我添加了第change列来指示发生的每个状态更改.

这里是一个简单的例子和一个解决方案在基地R.我真的希望一个优雅的tidyverse解决方案.非常感谢.

# Minimal reproducible data
df <- data.frame(prev = c("0", rep(letters[1:3], 2), rep(letters[4:10], 3)),
                 new = c(rep(letters[1:3], 2), rep(letters[4:10], 3), "100"),
                 change = 1:28,
                 to_do = rep(NA, 28))

# Vector for iteration
vec <- 1:30

# Conditions
prev_condition <- c(letters[4:6])   # prev state must be any of: "d" "e" "f"
new_condition <- c(letters[5:7])    # new state must be any of: "e" "f" "g"

# base R solution
n_row <- length(df[df$prev %in% prev_condition & df$new %in% new_condition, "to_do"])
df[df$prev %in% prev_condition & df$new %in% new_condition, "to_do"] <- vec[1:n_row]

df
#>    prev new change to_do
#> 1     0   a      1  <NA>
#> 2     a   b      2  <NA>
#> 3     b   c      3  <NA>
#> 4     c   a      4  <NA>
#> 5     a   b      5  <NA>
#> 6     b   c      6  <NA>
#> 7     c   d      7  <NA>
#> 8     d   e      8     I
#> 9     e   f      9     Y
#> 10    f   g     10     N
#> 11    g   h     11  <NA>
#> 12    h   i     12  <NA>
#> 13    i   j     13  <NA>
#> 14    j   d     14  <NA>
#> 15    d   e     15     W
#> 16    e   f     16     Q
#> 17    f   g     17     Z
#> 18    g   h     18  <NA>
#> 19    h   i     19  <NA>
#> 20    i   j     20  <NA>
#> 21    j   d     21  <NA>
#> 22    d   e     22     V
#> 23    e   f     23     C
#> 24    f   g     24     C
#> 25    g   h     25  <NA>
#> 26    h   i     26  <NA>
#> 27    i   j     27  <NA>
#> 28    j 100     28  <NA>

^{由reprex package(v2.0.1)于2022-05-09创建}

library(dplyr) df %>% mutate(to_do = replace(rep(NA_real_, n()), prev %in% prev_condition & new %in% new_condition, seq_len(sum(prev %in% prev_condition & new %in% new_condition))))

prev new change to_do 1 0 a 1 NA 2 a b 2 NA 3 b c 3 NA 4 c a 4 NA 5 a b 5 NA 6 b c 6 NA 7 c d 7 NA 8 d e 8 1 9 e f 9 2 10 f g 10 3 11 g h 11 NA 12 h i 12 NA 13 i j 13 NA 14 j d 14 NA 15 d e 15 4 16 e f 16 5 17 f g 17 6 18 g h 18 NA 19 h i 19 NA 20 i j 20 NA 21 j d 21 NA 22 d e 22 7 23 e f 23 8 24 f g 24 9 25 g h 25 NA 26 h i 26 NA 27 i j 27 NA 28 j 100 28 NA

dplyr：通过迭代向量来根据某些条件填充列

推荐答案

R相关问答推荐

检测(并替换)字符串中的数学符号

从嵌套列表中智能提取线性模型系数

用黄土法确定区间

RStudio中相关数据的分组箱形图

如何直接从Fortran到R的数组大小？

将嵌套列表子集化为嵌套列表

如果可能，将数字列转换为整数，否则保留为数字

在嵌套列表中查找元素路径的最佳方法

识别连接的子网(R-igraph)

根据纬度和距离连接两个数据集

创建列并对大型数据集中的特定条件进行成对比较的更高效程序

在点图上绘制置信度或预测区间ggplot2

有没有办法通过str_Detect()或其他字符串匹配函数来连接两个长度不等的数据帧？

ArrangeGrob()和类似的替代方法不接受Grob列表.在Grid.Draw，返回：glist中的错误(...)：仅允许在glist"；中使用Grobs；

将美学添加到ggploy中的文本标签

按两个条件自动过滤数据

从两个数据帧中，有没有办法计算R中一列的唯一值？

将y轴格式更改为R中的百分比

创建由三个单独的shapefile组成的单个 map

在R中查找多列中的字符串