Pandas sample()用于从DataFrame中随机选择行和列。如果要从大量数据集构建模型,则必须随机选择通过函数 sample 完成的较小数据样本。
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
它返回与调用者相同类型的新对象,其中包含从调用者对象中随机采样的n个项目。
import pandas as pd info = pd.DataFrame({'data1': [2, 4, 8, 0], 'data2': [2, 0, 0, 0], 'data3': [10, 2, 1, 8]}, index=['John', 'Parker', 'Learnfk', 'William']) info info['data1'].sample(n=3, random_state=1) info.sample(frac=0.5, replace=True, random_state=1) info.sample(n=2, weights='data3', random_state=1)
输出
data1 data2 data3 John 2 2 10 William 0 0 8
在此示例中,获取一个csv文件,并使用示例从DataFrame中提取随机行。
链接:https://www.learnfk.comhttps://www.learnfk.com/pandas/pandas-dataframe-sample.html
来源:LearnFk无涯教程网
名为 aa 的csv文件,其中包含以下数据集:
让无涯教程编写一个代码,从上述数据集中提取随机行:
# importing pandas package import pandas as pd # 从 csv 文件定义数据框 data = pd.read_csv("aa.csv") # 随机选择一行 row1 = data.sample(n = 1) # 显示行 row1 # 随机选择另一行 row2 = data.sample(n = 2) # 显示行 row2
输出
Name Hire Date Salary Leaves Remaining 2 Parker Chapman 02/21/14 45000.0 10 5 Michael Palin 06/28/13 66000.0 8
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)