你可以用 data.frame 做什么而不能用 data.table 做什么

发布于11月30日

我刚开始使用R，发现了一些数据.桌子我觉得它很棒.

一个非常天真的问题:我可以忽略数据吗.使用数据的框架.表以避免两个包之间的语法混淆？

常见问题解答1.8好的，我开始了解哪些数据.表是关于，但为什么不增强数据.在R里装帧？为什么它必须是一个新的包？

正如常见问题1.1所强调的，[.data.table中的j基本上是

此外，data.table人继承了data.frame人.这是一个

我们还建议尽可能增强R.什么之中的一个

unique()和match()现在在所有元素都在全局CHARSXP缓存中且未标记的字符向量上更快

第二个建议是在duplicate.c中使用memcpy，这非常重要

What are the smaller syntax differences between `data.frame` and data.table

DT[3]表示第三个row，但DF[3]表示第三个column

DT[3, ] == DT[3]，但DF[ , 3] == DF[3](在data.frame中有点令人困惑，而data.table是一致的)

因此，我们说逗号是optional/DT，但在DF中不是可选的

DT[[3]] == DF[, 3] == DF[[3]]

DT[i, ]，其中i是一个整数，返回一行，就像DF[i, ]一样，但不同于返回向量的矩阵单行子集.

DT[ , j]，其中j是单个整数，返回一列数据.表，与默认情况下返回向量的DF[, j]不同

DT[ , "colA"][[1]] == DF[ , "colA"]

DT[ , colA] == DF[ , "colA"](目前在data.table v1.9.8中，但即将更改，请参见发行说明)

DT[ , list(colA)] == DF[ , "colA", drop = FALSE]

DT[NA]返回NA的一行，但DF[NA]返回DF的整个副本，其中包含NA.符号NA是R中的logical型，因此由[.data.frame循环使用.用户的意图可能是DF[NA_integer_].为了方便起见，[.data.table自动转向这个可能的意图.

DT[c(TRUE, NA, FALSE)]将NA视为FALSE，但DF[c(TRUE, NA, FALSE)]返回

DT[ColA == ColB]比DF[!is.na(ColA) & !is.na(ColB) & ColA == ColB, ]简单

data.frame(list(1:2, "k", 1:4))创建3列数据.表创建一个list列.

check.names在data.frame中默认为TRUE，但在数据中为FALSE.桌子，为了方便.

stringsAsFactors在data.frame中默认为TRUE，但在数据中为FALSE.桌子，为了效率.由于在R中添加了全局字符串缓存，字符项是指向单个缓存字符串的指针，因此转换为factor不再具有性能优势.

当使用data.frame中的", "，但数据中的","打印时，list列中的原子向量被折叠.表的第6项后面带有逗号，以避免意外打印大型嵌入对象.

小警告

在某些情况下，某些软件包可能会使用在给定数据时失败的代码.然而，鉴于data.table一直在维护以避免此类问题，任何可能出现的问题都将被及时修复.

例如

一百
来自1.8.2版的新闻

根据plyr::melt()的需要，base::unname(DT)现在可以再次工作.幸亏

一个as.数据为ITime添加了frame方法，以便ITime可以传递给ggplot2

R相关问答推荐

你可以用 data.frame 做什么而不能用 data.table 做什么

推荐答案

常见问题解答1.8好的，我开始了解哪些数据.表是关于，但为什么不增强数据.在R里装帧？为什么它必须是一个新的包？

What are the smaller syntax differences between `data.frame` and data.table

小警告

R相关问答推荐

R根据名称的载体对收件箱列采取行动

在处理因素时，Base R grep家族比stringr变体快得多

ggplot geom_smooth()用于线性回归虚拟变量-没有回归线

如何按排序顺序打印一个框架中所有精确的唯一值？

格点中指数、双曲和反双曲模型曲线的正确绘制

如何在ggplot图中找到第二轴的比例

打印XTS对象

使用带有OR条件的grepl过滤字符串

根据1个变量绘制 colored颜色发散的 map ，由另一个变量绘制饱和度，ggplot2不工作

在R函数中使用加号

汇总数据的Sheffe检验的P值(平均值和标准差)

仅在R中的数据集开始和结束时删除所有 Select 列的具有NA的行

基于数据集属性将科分配给物种

调换行/列并将第一行(原始数据帧的第一列)提升为标题的Tidyr类似功能？

我们如何在R中透视数据并在之后添加计算

如何删除设置大小的曲线图并添加条形图顶部数字的百分比

如何提取R中其他字符串和数字之间的字符串？

主题(Legend.key=Element_RECT(Fill=&Quot；White&Quot；))不起作用

使用同一行中的前一个值填充R矩阵中的缺失值

将边列表转换为路径长度列表

推荐答案

常见问题解答1.8好的，我开始了解哪些数据.表是关于，但为什么不增强数据.在R里装帧？为什么它必须是一个新的包？

What are the smaller syntax differences between data.frame and data.table

小警告

R相关问答推荐

What are the smaller syntax differences between `data.frame` and data.table