箱线图是衡量数据在整个数据集中的分布情况的一种度量。这将数据集分为三个四分位数。该图表示数据集中的最小,最大,平均值,第一四分位数和第三四分位数。在通过为每个数据集绘制一个箱形图来比较数据集中数据的分布时,箱形图也很有用。
R提供了一个boxplot()函数来创建一个boxplot。 boxplot()函数具有以下语法:
boxplot(x, data, notch, varwidth, names, main)
x - 它是向量或公式。
data - 这是数据框(data frame)。
notch - 绘制一个notch是设置为true的逻辑值。
varwidth - 这也是设置为true以绘制与样本大小相同的框的宽度的逻辑值。
names - 这是将在每个箱线图下打印的标签组。
main - 它用于为图形赋予标题。
让我们看一个示例,以了解如何在R中创建箱形图。在下面的示例中,我们将使用R环境中存在的" mtcars"数据集。我们将仅使用其两列,即" mpg"和" cyl"。以下示例将为mpg和cyl之间的关系创建箱形图,即分别为英里/加仑和汽缸数。
# 为图表文件命名。 png(file = "boxplot.png") # 绘制图表。 boxplot(mpg ~ cyl, data = mtcars, xlab = "Quantity of Cylinders", ylab = "Miles Per Gallon", main = "R Boxplot Example") # 保存文件。 dev.off()
输出:
在R中,我们可以使用一个Notch绘制箱形图。它有助于我们找出不同数据组的中位数如何相互匹配。让我们看一个示例,以了解如何使用Notch为每个组创建箱线图。
在下面的示例中,我们将使用相同的数据集" mtcars"。
# 为我们的图表命名。 png(file = "boxplot_using_notch.png") # 绘制图表。 boxplot(mpg ~ cyl, data = mtcars, xlab = "Quantity of Cylinders", ylab = "Miles Per Gallon", main = "Boxplot Example", notch = TRUE, varwidth = TRUE, col = c("green","yellow","red"), names = c("High","Medium","Low") ) # 保存文件。 dev.off()
输出:
R提供了一个附加的绘图方案,该方案是由 boxplot 和 kernel density 图组成的。Violin图是借助vioplot软件包中提供的vioplot()函数创建的。
让我们看一个例子,以了解Violin图的创建。
# 加载 vioplot 包 library(vioplot) # 为我们的图表命名。 png(file = "vioplot.png") #为 vioplot 函数创建数据 x1 <- mtcars$mpg[mtcars$cyl==4] x2 <- mtcars$mpg[mtcars$cyl==6] x3 <- mtcars$mpg[mtcars$cyl==8] #创建 vioplot 函数 vioplot(x1, x2, x3, names=c("4 cyl", "6 cyl", "8 cyl"), col="green") #设置标题 title("Violin plot example") #保存文件。 dev.off()
输出:
aplpack 软件包中的bagplot(x,y)函数提供了单变量箱线图的两年期版本。该袋子包含所有分数的50%。双变量中位数为近似值。栅栏将自己与外部点分开,并显示支出。
让我们看一个示例,以了解如何在R中创建二维箱线图扩展。
# 加载 aplpack 包 library(aplpack) # 为我们的图表命名。 png(file = "bagplot.png") #创建 bagplot 函数 attach(mtcars) bagplot(wt,mpg, xlab="Car Weight", ylab="Miles Per Gallon", main="2D Boxplot Extension") # 保存文件。 dev.off()
输出:
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)