Pandas 读取文件

Pandas 读取文件 首页 / Pandas入门教程 / Pandas 读取文件

从CSV文件读取

csv代表逗号分隔值,它定义为一种简单的文件格式,使用特定的结构来排列表格数据。它以纯文本格式存储表格数据,例如电子表格或数据库,并具有通用的数据交换格式。将csv文件打开到excel文件中,并且行和列数据定义标准格式。

将csv文件读入pandas DataFrame是快速而直接的。无涯教程不需要编写几行代码来打开,分析和读取Pandas中的csv文件。相反,可以在一行中执行这些操作,并将数据存储在DataFrame中。

为了读取Pandas文件,首先必须将数据从文件格式加载到DataFrame中。您只需要一行即可在代码中加载数据。

Name,Hire Date,Salary,Leaves Remaining
John Idle,08/15/14,50000.00,10
Learnfk Gilliam,04/07/15,65000.00,6
Parker Chapman,02/21/14,45000.00,7
Jones Palin,10/14/13,70000.00,3
Terry Gilliam,07/22/14,48000.00,9
Michael Palin,06/28/13,66000.00,8
df = pd.read_csv('a.csv')

代码

import pandas
df = pandas.read_csv('hrdata.csv')
print(df)

在上面的代码中,三行代码足以读取文件,而其中只有一行正在执行实际工作,即pandas.read_csv()。

输出

        Name                   Hire Date      Salary            Leaves Remaining
0     John Idle                08/15/14       50000.0                    10
1     Learnfk Gilliam            04/07/15       65000.0                     8
2     Parker Chapman           02/21/14       45000.0                    10
3     Jones Palin              10/14/13       70000.0                     3
4     Terry Gilliam            07/22/14       48000.0                     7
5     Michael Palin            06/28/13       66000.0                     8

从JSON读取

如果您有任何JSON文件,Pandas可以通过单行代码轻松读取它。

无涯教程网

df =pd.read_json('hrdata.json')

它允许索引通过嵌套工作。

Pandas将列表列表转换为DataFrame,还分别定义列名称。 JSON解析器负责将JSON文本转换为另一个表示形式,该表示形式必须根据JSON语法接受所有文本。它还可以接受非JSON形式或扩展名。

阅读之前,无涯教程必须导入 JSON 文件。

import pandas as pd
data = pd.read_json('hrdata.json') 
print(data) 

输出 strong>:

        Name                   Hire Date        Salary            Leaves Remaining
0     John Idle                08/15/14         50000.0                     10
1     Learnfk Gilliam            06/01/15         65000.0                     6
2     Parker Chapman           05/12/14         45000.0                     7
3     Jones Palin              11/01/13         70000.0                     3	
4     Terry Gilliam            08/12/14         48000.0                     9
5     Michael Palin            05/23/13         66000.0                     8

从SQL数据库读取

为了从SQL读取文件,首先,需要使用Python库建立连接,然后将查询传递给pandas。在这里,使用SQLite进行演示。

首先,必须安装 pysqlite3并在终端中运行此命令:

pip install pysqlite3

sqlite3 用于建立与数据库的连接,然后无涯教程可以使用它通过 SELECT 查询生成一个DataFrame。

建立与SQLite数据库文件的连接:

import sqlite3
con = sqlite3.connect("database.db")

SQLite数据库中存在一个名为 information 的表,该列的索引为" index"。通过传递 SELECT 查询和 con,无涯教程可以从信息表中读取数据。

df = pd.read_sql_query("SELECT * FROM information", con)

输出

Index         E_id         Designation              
0              46              M.Com
1              47              B.Com
2              48              B.Com

祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)

技术教程推荐

从0开始学架构 -〔李运华〕

趣谈Linux操作系统 -〔刘超〕

研发效率破局之道 -〔葛俊〕

人人都能学会的编程入门课 -〔胡光〕

软件设计之美 -〔郑晔〕

分布式系统案例课 -〔杨波〕

爱上跑步 -〔钱亮〕

大厂晋升指南 -〔李运华〕

零基础实战机器学习 -〔黄佳〕

好记忆不如烂笔头。留下您的足迹吧 :)