我刚开始使用R,发现了一些数据.桌子我觉得它很棒.

一个非常天真的问题:我可以忽略数据吗.使用数据的框架.表以避免两个包之间的语法混淆?

推荐答案

data.table FAQ

常见问题解答1.8好的,我开始了解哪些数据.表是关于,但为什么不增强数据.在R里装帧?为什么它必须是一个新的包?

正如常见问题1.1所强调的,[.data.table中的j基本上是

此外,data.table人继承了data.frame人.这是一个

我们还建议尽可能增强R.什么之中的一个

unique()match()现在在所有元素都在全局CHARSXP缓存中且未标记的字符向量上更快

第二个建议是在duplicate.c中使用memcpy,这非常重要

What are the smaller syntax differences between data.frame and data.table

  • DT[3]表示第三个row,但DF[3]表示第三个column
  • DT[3, ] == DT[3],但DF[ , 3] == DF[3](在data.frame中有点令人困惑,而data.table是一致的)
  • 因此,我们说逗号是optional/DT,但在DF中不是可选的
  • DT[[3]] == DF[, 3] == DF[[3]]
  • DT[i, ],其中i是一个整数,返回一行,就像DF[i, ]一样,但不同于返回向量的矩阵单行子集.
  • DT[ , j],其中j是单个整数,返回一列数据.表,与默认情况下返回向量的DF[, j]不同
  • DT[ , "colA"][[1]] == DF[ , "colA"]
  • DT[ , colA] == DF[ , "colA"](目前在data.table v1.9.8中,但即将更改,请参见发行说明)
  • DT[ , list(colA)] == DF[ , "colA", drop = FALSE]
  • DT[NA]返回NA的一行,但DF[NA]返回DF的整个副本,其中包含NA.符号NA是R中的logical型,因此由[.data.frame循环使用.用户的意图可能是DF[NA_integer_].为了方便起见,[.data.table自动转向这个可能的意图.
  • DT[c(TRUE, NA, FALSE)]NA视为FALSE,但DF[c(TRUE, NA, FALSE)]返回
  • DT[ColA == ColB]DF[!is.na(ColA) & !is.na(ColB) & ColA == ColB, ]简单
  • data.frame(list(1:2, "k", 1:4))创建3列数据.表创建一个list列.
  • check.namesdata.frame中默认为TRUE,但在数据中为FALSE.桌子,为了方便.
  • stringsAsFactorsdata.frame中默认为TRUE,但在数据中为FALSE.桌子,为了效率.由于在R中添加了全局字符串缓存,字符项是指向单个缓存字符串的指针,因此转换为factor不再具有性能优势.
  • 当使用data.frame中的", ",但数据中的","打印时,list列中的原子向量被折叠.表的第6项后面带有逗号,以避免意外打印大型嵌入对象.

小警告

在某些情况下,某些软件包可能会使用在给定数据时失败的代码.然而,鉴于data.table一直在维护以避免此类问题,任何可能出现的问题都将被及时修复.

例如

  • 一百

  • 来自1.8.2版的新闻

  • 根据plyr::melt()的需要,base::unname(DT)现在可以再次工作.幸亏
  • 一个as.数据为ITime添加了frame方法,以便ITime可以传递给ggplot2

R相关问答推荐

R根据名称的载体对收件箱列采取行动

在处理因素时,Base R grep家族比stringr变体快得多

ggplot geom_smooth()用于线性回归虚拟变量-没有回归线

如何按排序顺序打印一个框架中所有精确的唯一值?

格点中指数、双曲和反双曲模型曲线的正确绘制

如何在ggplot图中找到第二轴的比例

打印XTS对象

使用带有OR条件的grepl过滤字符串

根据1个变量绘制 colored颜色 发散的 map ,由另一个变量绘制饱和度,ggplot2不工作

在R函数中使用加号

汇总数据的Sheffe检验的P值(平均值和标准差)

仅在R中的数据集开始和结束时删除所有 Select 列的具有NA的行

基于数据集属性将科分配给物种

调换行/列并将第一行(原始数据帧的第一列)提升为标题的Tidyr类似功能?

我们如何在R中透视数据并在之后添加计算

如何删除设置大小的曲线图并添加条形图顶部数字的百分比

如何提取R中其他字符串和数字之间的字符串?

主题(Legend.key=Element_RECT(Fill=&Quot;White&Quot;))不起作用

使用同一行中的前一个值填充R矩阵中的缺失值

将边列表转换为路径长度列表