我有以下火星火数据帧
Car | Time | Val1 |
---|---|---|
1 | 1 | 3 |
2 | 1 | 6 |
3 | 1 | 8 |
1 | 2 | 10 |
2 | 2 | 21 |
3 | 2 | 33 |
我想要得到每个时刻所有汽车的几何平均值,结果df应该如下所示:
time | geo_mean |
---|---|
1 | 5.2414827884178 |
2 | 19.065333718304 |
我知道如何用以下代码计算算术平均值:
from pyspark.sql import functions as F
df = df.withColumn(
"aritmethic_average",
F.avg(F.col("Val1")).over(W.partitionBy("time"))
)
但我不确定如何用几何方法来完成同样的事情.
提前谢谢!