我在数据帧中有一列字符串,我想替换这些值,只包括前" ("
个之前的子字符串,即第一个空格/开括号对之前的子字符串.并不是所有的字符串都包含括号,我希望它们保持原样.
示例数据:
col1 <- c(1, 2, 3, 4)
col2 <- c("a b (ABC DE)", "bcd", "cd ef (CE)", "bcd")
df <- data.frame(col1, col2)
df
输出:
col1 col2
1 1 a b (ABC DE)
2 2 bcd
3 3 cd ef (CE)
4 4 bcd
我想要的输出是这样的:
col1 <- c(1, 2, 3, 4)
col2 <- c("a b", "bcd", "cd ef", "bcd")
df <- data.frame(col1, col2)
df
输出:
col1 col2
1 1 a b
2 2 bcd
3 3 cd ef
4 4 bcd
实际的数据帧是40000多行,字符串包含许多可能的值,因此不能像示例中那样手动完成.我对使用regex/patterns一点也不自信,但我承认这可能是最简单的方法.