我有一个(相当长的)向量列表.向量由俄语单词组成,我通过对句子使用strsplit()函数得到.

以下是head()的回报:

[[1]]
[1] "модно"     "создавать" "резюме"    "в"         "виде"     

[[2]]
[1] "ты"        "начианешь" "работать"  "с"         "этими"    

[[3]]
[1] "модно"            "называть"         "блогер-рилейшенз" "―"                "начинается"       "задолго"         

[[4]]
[1] "видел" "по"    "сыну," "что"   "он"   

[[5]]
[1] "четырнадцать," "я"             "поселился"     "на"            "улице"        

[[6]]
[1] "широко"     "продолжали" "род."

注意向量的长度不同.

我想要的是能够阅读每个句子的第一个单词,第二个单词,第三个单词,等等.

预期结果如下:

    P1              P2           P3                 P4    P5           P6
[1] "модно"         "создавать"  "резюме"           "в"   "виде"       NA
[2] "ты"            "начианешь"  "работать"         "с"   "этими"      NA
[3] "модно"         "называть"   "блогер-рилейшенз" "―"   "начинается" "задолго"         
[4] "видел"         "по"         "сыну,"            "что" "он"         NA
[5] "четырнадцать," "я"          "поселился"        "на"  "улице"      NA
[6] "широко"        "продолжали" "род."             NA    NA           NA

我试着只用data.frame()行,但没有用,因为行的长度不同.我还try 了plyr包中的rbind.fill(),但该函数只能处理矩阵.

我在这里发现了一些其他问题(这就是我获得plyr个帮助的原因),但这些都是关于组合例如两个不同大小的数据帧.

谢谢你的帮助.

推荐答案

试试这个:

word.list <- list(letters[1:4], letters[1:5], letters[1:2], letters[1:6])
n.obs <- sapply(word.list, length)
seq.max <- seq_len(max(n.obs))
mat <- t(sapply(word.list, "[", i = seq.max))

诀窍是,

c(1:2)[1:4]

返回向量+两个NAs

R相关问答推荐

geom_raster不适用于x比例中超过2,15的值

如果行和列名以相同的开头,将矩阵值设置为0

从R中的另一个包扩展S3类的正确方法是什么

基于现有类创建类的打印方法(即,打印tibles更长时间)

根据R中两个变量的两个条件删除带有dspirr的行

如果第一个列表中的元素等于第二个列表的元素,则替换为第三个列表的元素

如何在geom_col中反转条

在ggplot2中更改小提琴情节的顺序

无法定义沿边轨迹的 colored颜色 渐变(与值无关)

R:用GGPLATE,如何在两个独立的变量中制作不同形状的散点图?

有没有办法一次粘贴所有列

使用ggplot2中的sec_axis()调整次轴

根据r中另一个文本列中给定的范围对各列求和

层次树图的数据树

判断函数未加载R中的库

根据向量对列表元素进行排序

将Geojson保存为R中的shapefile

R,将组ID分配给另一个观测ID变量中的值的组合

在子图内和子图之间对齐行数不均匀的表格罗布对

如何使用ggsurvfit包更改风险表中的标签名称?