如果您能给我建议,我将不胜感激.我想拆分逗号后的字符串,但需要保留包含逗号的括号内的文本(即不拆分).在我的数据中,有4种关于空格和逗号的可能性.
1括号(c,d)内逗号后没有空格 2圆括号中逗号后的空格(x,y) 3括号url.d,url.e外的逗号后有一个空格 4括号url.d、url.e外的逗号后没有空格
在下面的示例中,url.b(c,d)和url.h(x,y)需要一起出现.在下面的代码中,第8行和第9行需要一起出现.11号线需要拆分.
my_df = data.frame(id=1:4, urls=c("url.a, url.b (c,d), url.c",
"url.d, url.e, url.f",
"url.g, url.h (x, y), url.i",
"url.d,url.e, url.f"))
tidytext::unnest_tokens(my_df, out, urls, token = 'regex', pattern=",\\s+")
id out
1 1 url.a
2 1 url.b (c,d)
3 1 url.c
4 2 url.d
5 2 url.e
6 2 url.f
7 3 url.g
8 3 url.h (x
9 3 y)
10 3 url.i
11 4 url.d,url.e
12 4 url.f
谢谢!