Python - 测量方差

Python - 测量方差 首页 / 数据科学入门教程 / Python - 测量方差

在统计数据中,方差是数据集中某个值与平均值之间的距离的量度,换句话说,它指示值的分散程度,通过使用标准偏差进行测量,常用的另一种方法是偏度,这两个都是通过使用pandas库中可用的函数来计算的。

测量标准偏差

标准偏差是方差的平方根。方差是数据集中值与平均值的平方差的平均值。在python中,无涯教程通过使用pandas库中的函数std()计算此值。

import pandas as pd

#创建系列词典
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Learnfk','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#创建一个数据框
df = pd.DataFrame(d)

# 计算标准差
print df.std()

其输出如下-

无涯教程网

Age       7.265527
Rating    0.661628
dtype: float64

测量偏度

它用于确定数据是对称的还是偏斜的。如果索引在-1和1之间,则分布是对称的。如果索引不大于-1,则向左倾斜,如果索引至少为1,则向右倾斜

import pandas as pd

#创建系列词典
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Learnfk','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#创建一个数据框
df = pd.DataFrame(d)
print df.skew()

其输出如下-

无涯教程网

Age       1.443490
Rating   -0.153629
dtype: float64

因此,年龄等级的分布是对称的,而年龄分布则偏向右侧。

链接:https://www.learnfk.comhttps://www.learnfk.com/python-data-science/python-measuring-variance.html

来源:LearnFk无涯教程网

祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)

技术教程推荐

AI技术内参 -〔洪亮劼〕

React实战进阶45讲 -〔王沛〕

代码之丑 -〔郑晔〕

流程型组织15讲 -〔蒋伟良〕

手把手带你写一门编程语言 -〔宫文学〕

郭东白的架构课 -〔郭东白〕

快手 · 移动端音视频开发实战 -〔展晓凯〕

Go进阶 · 分布式爬虫实战 -〔郑建勋〕

Dubbo源码剖析与实战 -〔何辉〕

好记忆不如烂笔头。留下您的足迹吧 :)