我是EDA新手,我刚刚想出了一种方法来找到我的boxplot
个数字数据,然而,我很难获得相关的信息:
方框图图像:
有谁能告诉我:
- 当我看着
boxplot
的时候,我能期待什么 - 为什么除了年龄,他们看起来不像一个盒子?
- 我怎么知道它是否是异常值.
顺便说一句,下面是我使用的盒子图代码:
def plot_boxplots_grid(dataframe, n_cols=3, subplot_size=(5, 3)):
numerical_cols = [col for col in dataframe.columns if dataframe[col].dtype != 'object' and dataframe[col].nunique() > 2]
n_rows = (len(numerical_cols) + n_cols - 1) // n_cols
plt.figure(figsize=(subplot_size[0] * n_cols, subplot_size[1] * n_rows))
for i, col in enumerate(numerical_cols):
plt.subplot(n_rows, n_cols, i + 1)
sns.boxplot(y=dataframe[col])
plt.title(col)
plt.tight_layout()
plt.show()