关注我们

Pandas 教程

Python Pandas被定义为一个开源库，可在Python中提供高性能的数据处理。本教程适用于初学者和专业人士。

它用于Python中的数据分析，由 Wes McKinney 在2008年开发。无涯教程的教程提供了Python Pandas的所有基本和高级概念，例如Numpy，数据操作和时间序列。

Pandas简介

Pandas被定义为一个开源库，可在Python中提供高性能的数据处理。pandas的名称源自 Panel Data 一词，它用于Python中的数据分析，由 Wes McKinney 在 2008 中开发。

数据分析需要大量处理，例如重组(restructuring)，清理(cleaning)或合并(merging)等。有多种工具可用于快速数据处理，例如 Numpy，Scipy ，Cython 和 Panda 。但是无涯教程更喜欢Pandas，因为与Pandas一起工作比其他工具更快，更简单且更具表现力。

Pandas构建在 Numpy 软件包之上，这意味着操作Pandas需要 Numpy 。

在Pandas之前，Python能够进行数据准备，但是它仅提供了有限的数据分析支持。因此，Pandas崭露头角，并增强了数据分析的函数。无论数据的来源如何，它都可以执行处理和分析数据所需的五个重要步骤，即加载(load)，操作(manipulate)，准备(prepare)，建模(model)和分析(analyze)。

Pandas特点

它具有快速高效的DataFrame对象，具有默认的和自定义的索引。
用于重塑和旋转数据集。
按数据分组以进行汇总和转换。
它用于数据对齐和丢失数据的集成。
提供时间序列的函数。
处理各种格式不同的数据集，例如矩阵数据，表格异构数据，时间序列。
处理数据集的多种操作，例如子集(subsetting)，切片(slicing)，过滤(filtering)，groupBy，重新排序和重新整形(re-shaping)。
它与SciPy和scikit-learn等其他库集成。
提供快速的性能，如果您想提高性能，甚至可以提高速度，可以使用 Cython 。

Pandas优势

与使用其他语言相比，pandas的好处如下:

数据表示形式 - 它以适合于通过其DataFrame和Series进行数据分析的形式表示数据。
清除代码 - Pandas的清除API使您可以专注于代码的核心部分。因此，它为用户提供了清晰简洁的代码。

Pandas数据结构

pandas提供了两种用于处理数据的数据结构，即 Series 和 DataFrame ，下面将对此进行讨论:

1)Series

它被定义为能够存储各种数据类型的一维数组。系列的行标签称为索引(index)。无涯教程可以使用" series"方法轻松地将列表，元组和字典转换为series。Series不能包含多列。它具有一个参数:

数据(Data) - 它可以是任何列表，字典或标量值。

在创建系列之前，首先，无涯教程必须导入numpy模块，然后在程序中使用array()函数。

复制代码

import pandas as pd
import numpy as np
info = np.array(['P','a','n','d','a','s'])
a = pd.Series(info)
print(a)

输出

0   P
1   a
2   n
3   d
4   a
5   s
dtype: object

在此代码中，首先，无涯教程导入了 pandas 和 numpy 库以及 pd 和 np 别名。然后，无涯教程获取了一个名为" info"的变量，该变量由一些值的数组组成。无涯教程已经通过 Series 方法调用了 info 变量，并将其定义为" a "变量。该系列已通过调用 print(a)方法进行打印。

2) DataFrame

它是pandas的一种广泛使用的数据结构，可与带有标记轴(行和列)的二维数组一起使用。 DataFrame被定义为存储数据的标准方式，并具有两个不同的索引，即行索引和列索引。它包含以下属性:

链接：https://www.learnfk.comhttps://www.learnfk.com/pandas/python-pandas.html

来源：LearnFk无涯教程网

这些列可以是int，bool等。
可以看作是Series结构的字典，其中行和列都被索引了。如果是列，则表示为"columns"；如果是行，则表示为"index"。

无涯教程可以使用list在Pandas中轻松创建一个DataFrame。

复制代码

import pandas as pd
# 字符串列表
x = ['Python', 'Pandas']

# 在列表中调用 DataFrame 构造函数
df = pd.DataFrame(x)
print(df)

输出

      0
0   Python
1   Pandas

说明:在此代码中，无涯教程定义了一个名为" x"的变量，该变量由字符串值组成。在列表上调用DataFrame构造函数以打印值。

Pandas目录

入门教程

Pandas 教程

Pandas 函数列表

Pandas Numpy

Pandas 绘图(Plot)

Series教程

Pandas Series

Series.unique函数

Series.map函数

Series.std函数

Series.to_frame函数

Series.value_counts函数

DataFrame教程

Pandas DataFrame

DataFrame.hist函数

DataFrame.transpose函数

DataFrame.to_excel函数

DataFrame.sum函数

DataFrame.sort函数

DataFrame.shift函数

DataFrame.sample函数

DataFrame.query函数

DataFrame.pivot_table函数

DataFrame.merge函数

DataFrame.melt函数

DataFrame.mean函数

DataFrame.iterrows函数

DataFrame.head函数

DataFrame.aggregate函数

DataFrame.groupby函数

DataFrame.drop_duplicates函数

DataFrame.describe函数

DataFrame.count函数

DataFrame.astype函数

DataFrame.assign函数

DataFrame.apply函数

DataFrame.append函数

DataFrame.transform函数

DataFrame.rename函数

DataFrame.join函数

DataFrame.cut函数

DataFrame.where函数

Operation教程

Pandas DataFrame增加列

Pandas DataFrame转Numpy数组

Pandas DataFrame转CSV

Pandas 读取文件

Pandas 串联数据

Data Operations教程

Pandas 数据运算

Pandas 数据处理

DataFrame.corr函数

DataFrame.dropna函数

DataFrame.fillna函数

DataFrame.replace函数

DataFrame.iloc

DataFrame.isin函数

DataFrame.loc