我试图创建一个新变量,仅当满足特定条件时,才打印一系列列的第一个值.
为了澄清,我的数据库如下所示:
var1 | var2 | var3 | var4 |
---|---|---|---|
C7931 | C3490 | R0781 | I10 |
R079 | R0600 | I10 | C3490 |
S270XXA | S225XXA | C3490 | C7931 |
我想创建一个变量(main),仅当值不以C00到C99开头时,才打印第一个var列中的值.如果该值确实以该条件开始,那么我想在下一列测试该条件,直到满足该条件,并打印该值.
因此,对于上表,新创建的变量(main)应该是这样的:
var1 | var2 | var3 | var4 | main |
---|---|---|---|---|
C7931 | C3490 | R0781 | I10 | R0781 |
R079 | R0600 | I10 | C3490 | R079 |
C0258 | S225XXA | C3490 | C7931 | S225XXA |
我不太确定从哪里开始,但我怀疑这可能涉及mutate()和ifelse()