实时研究中的数据集包含许多变量,在这种情况下,应分析每个变量之间的关系。绘制(n,2)组合的双变量分布将是非常复杂且耗时的过程。
在数据集中绘制多个成对的双变量分布,可以使用 pairplot()函数,显示了DataFrame中变量的(n,2)组合的关系作为图的矩阵,对角线图是单变量图。
在本节中,无涯教程将学习什么是轴。
seaborn.pairplot(data,…)
参数-
data - Dataframe
hue - 数据可变以将绘图方面映射为不同的颜色。
palette - 用于映射色调变量的颜色集
kind:non - identity关系的情节类型。 {‘scatter',‘reg'}
diag_kind - 对角子图的图样。 {" hist"," kde"}
除数据外,所有其他参数均为可选。 pairplot 可以接受的其他参数很少。上面提到的是经常使用的参数。
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.set_style("ticks") sb.pairplot(df,hue = 'species',diag_kind = "kde",kind = "scatter",palette = "husl") plt.show()
无涯教程可以观察每个图的变化。这些图采用矩阵格式,其中行名称表示x轴,列名称表示y轴。
对角线图是内核密度图,其中其他图是如上所述的散点图。
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)