我有一个超过20000行的数据集,因为它的总行上载限制为20000,所以无法导入到SharePoint中.共有17列,每列有6694行,总计113798行.

因此,我想将这xlsx个文件拆分成总行数少于20000行的更小的文件.

我怎么能这样做呢?

样本数据:

df2 <- data.frame(a = seq(1,6694), b = seq(1,6694), c = seq(1,6694),
                  d = seq(1,6694), e = seq(1,6694), f = seq(1,6694),
                  g = seq(1,6694), h = seq(1,6694), i = seq(1,6694),
                  k = seq(1,6694), l = seq(1,6694), m = seq(1,6694),
                  n = seq(1,6694), o = seq(1,6694), p = seq(1,6694),
                  q = seq(1,6694), replace = T) 

推荐答案

我们可以使用gl创建一个分组索引,将 Big Data 分为20000行的数据集,每个数据集有20000行(如果行数不是20000的倍数,则最后一个列表元素将具有剩余的行数)

n <- 20000
lst1 <- split(df2, as.integer(gl(nrow(df2), n, nrow(df2))))

R相关问答推荐

如何计算具有NA的行的更改百分比

如何在ggplot 2线性图的每个方面显示每个组的误差条?

如何删除gggvenn与gggplot绘制的空白?

如何从当前行上方找到符合特定条件的最接近值?

lightgbm发动机在tidymmodels中的L1正则化""

根据多个条件增加y轴高度以适应geom_text标签

在for循环中转换rabrame

如何使下一个按钮只出现在Rshiny 的一段时间后?""

提取第一个下划线和最后一个下划线之间的任何内容,例外情况除外

DEN扩展包中的RECT树形图出现异常行为

R-按最接近午夜的时间进行筛选

悬崖三角洲超大型群数计算导致整数溢出

在多页PDF中以特定布局排列的绘图列表不起作用

从多层嵌套列表构建Tibble?

R中时间间隔的大向量与参考时间间隔的相交

有没有办法将基于每个值中出现的两个关键字或短语的字符串向量重新编码为具有这两个值的新向量?

我需要使用ggplot2制作堆叠条形图

访问数据帧中未定义的列时出现R错误

R预测包如何处理ARIMA(Auto.arima函数)中的缺失值

GOGPLATE geom_boxploy色彩疯狂