Seaborn - 统计估计

Seaborn - 统计估计 首页 / Seaborn入门教程 / Seaborn - 统计估计

在大多数情况下,无涯教程处理数据整体分布的估计,但是,当涉及集中趋势估计时,需要一种特定的方式来汇总分布。均值和中位数是估计分布的集中趋势的常用技术。

在上一节中学习的所有图中,都对整个分布进行了可视化。现在,讨论关于可以用来估计分布的集中趋势的图。

Bar Plot

barplot()显示类别变量和连续变量之间的关系。数据用矩形条表示,其中条的长度表示该类别中数据的比例。

条形图表示集中趋势的估计。让无涯教程使用" titanic"数据集学习条形图。

链接:https://www.learnfk.comhttps://www.learnfk.com/seaborn/seaborn-statistical-estimation.html

来源:LearnFk无涯教程网

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset('titanic')
sb.barplot(x="sex", y="survived", hue="class", data=df)
plt.show()

运行上面代码输出

barplot

在上面的示例中,可以看到每个类别中男性和女性的平均存活数,从情节中可以了解到,存活下来的女性人数多于男性,在男性和女性中,更多的存活率来自头等舱。

无涯教程网

条形图中的一种特殊情况是显示每个类别中没有观测值,而不是计算第二个变量的统计量,为此,无涯教程使用 countplot()。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset('titanic')
sb.countplot(x=" class ", data=df, palette="Blues");
plt.show()

运行上面代码输出

Bargraph

如图所示,三等舱的乘客人数高于一等舱和二等舱。

Point Plots

点状图与条形图相同,但样式不同,估计值由另一轴上某个高度的点表示,而不是完整的条形。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset('titanic')
sb.pointplot(x="sex", y="survived", hue="class", data=df)
plt.show()

运行上面代码输出

zSymbol

祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)

技术教程推荐

透视HTTP协议 -〔罗剑锋(Chrono)〕

SQL必知必会 -〔陈旸〕

Node.js开发实战 -〔杨浩〕

Electron开发实战 -〔邓耀龙〕

NLP实战高手课 -〔王然〕

后端存储实战课 -〔李玥〕

如何成为学习高手 -〔高冷冷〕

手把手带你写一个MiniSpring -〔郭屹〕

AI 应用实战课 -〔黄佳〕

好记忆不如烂笔头。留下您的足迹吧 :)