我有这个数据框,我想要一个新的,对于每个国家,我都有年数集的‘计数’平均值

    country Alpha-3 code    Year    Count
    0   Australia   AUS 2005    2.000000
    1   Austria AUT 2005    1.000000
    2   Belgium BEL 2005    0.000000
    3   Canada  CAN 2005    4.000000
    4   China   CHN 2005    0.000000
    5   Australia   AUS 2006    4.000000
    6   Austria AUT 2006    1.000000
    7   Belgium BEL 2006    1.000000
    8   Canada  CAN 2006    6.000000
    9   China   CHN 2006    2.000000
    10  Australia   AUS 2007    5.000000
    11  Austria AUT 2007    0.000000
    12  Belgium BEL 2007    2.000000
    13  Canada  CAN 2007    5.000000
    14  China   CHN 2007    3.000000
    15  Australia   AUS 2008    7.000000
    16  Austria AUT 2008    0.000000
    17  Belgium BEL 2008    1.000000
    18  Canada  CAN 2008    5.000000
    19  China   CHN 2008    3.000000

我想要一个这样的东西:

country   Count
Australia 4.5
Austria 0.5
ecc.

提前谢谢你

推荐答案

你可以用pandas.DataFrame.groupby来做这个.

out1 = df.groupby("country", as_index=False)["Count"].mean() #to return a dataframe
out2 = df.groupby("country")["Count"].mean() #to return a serie

Output :

print(out1)

     country  Count
0  Australia    4.5
1    Austria    0.5
2    Belgium    1.0
3     Canada    5.0
4      China    2.0

Python相关问答推荐

' osmnx.shortest_track '返回有效源 node 和目标 node 的'无'

Python库:可选地支持numpy类型,而不依赖于numpy

PMMLPipeline._ fit()需要2到3个位置参数,但给出了4个位置参数

从groupby执行计算后创建新的子框架

如何使用scipy的curve_fit与约束,其中拟合的曲线总是在观测值之下?

调用decorator返回原始函数的输出

合并帧,但不按合并键排序

Python全局变量递归得到不同的结果

Flash只从html表单中获取一个值

Python—压缩叶 map html作为邮箱附件并通过sendgrid发送

当条件满足时停止ODE集成?

BeautifulSoup:超过24个字符(从a到z)的迭代失败:降低了首次深入了解数据集的复杂性:

递归函数修饰器

504未连接IB API TWS错误—即使API连接显示已接受''

为什么后跟inplace方法的`.rename(Columns={';b';:';b';},Copy=False)`没有更新原始数据帧?

以极轴表示的行数表达式?

如何在PYTHON中向单元测试S Side_Effect发送额外参数?

#将多条一维曲线计算成其二维数组(图像)表示

如何将参数名作为参数传入到函数中?

as_index=False groupBy不支持count