数据结构对于理解非常重要。数据结构是我们将在R中日常处理的对象。我们可以说R中的所有东西都是对象。
R具有许多数据结构,其中包括:
向量是R中的基本数据结构,或者可以说向量是最基本的R数据对象。原子向量有六种类型,例如逻辑,整数,字符,双精度和原始。 "向量是元素的集合,最常见的是character,integer,logical或numeric" 向量可以是以下两种类型之一:
在R中,List列表是集合。与原子向量不同,列表不限于单一模式。列表包含多种数据类型。该列表也称为通用向量,因为列表的元素可以是任何类型的R对象。我们可以借助list()或as.list()创建一个列表。我们可以使用vector()创建所需长度的空列表。
还有另一种类型的数据对象,可以在两个以上的维度(称为数组)中存储数据。 "数组是连续内存分配的数据类型集合。" 假设,如果我们创建维度为(2,3,4)的数组,则它将创建两个两行的四个矩形矩阵,三列。
在R中,借助于 array()函数创建一个数组。此函数将向量作为输入,并使用dim参数中的值创建一个数组。
矩阵是R对象,其中元素以二维矩形布局排列。在矩阵中,包含相同原子类型的元素。为了进行数学计算,可以使用包含数字元素的矩阵。借助R中的matrix()函数创建一个矩阵。
创建矩阵的基本语法如下:
matrix(data, no_row, no_col, by_row, dim_name)
dataframe是一种二维的数组状结构,或者我们可以说它是一个表,其中每一列包含一个变量的值,而行包含每一列的值的集合。
数据帧具有以下特征:
Factors因子也是数据对象,用于对数据进行分类并将其存储。因子可以存储字符串和整数。列的唯一值数量有限,因此因子在列中非常有用。它在用于统计建模的数据分析中非常有用。
通过将向量作为输入参数,借助factor()函数创建因子。
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)