我有Yelp数据集,我想统计所有超过三星的 comments .我通过这样做获得 comments 数:
reviews.groupby('business_id')['stars'].count()
现在我想得到超过3颗星的 comments 数,所以我从here条中获得灵感:
reviews.groupby('business_id')['stars'].agg({'greater':lambda val: (val > 3).count()})
但这只是给了我以前所有星星的计数.我不确定这样做是否正确?我在这里做错了什么.lambda表达式没有遍历stars列的每个值吗?
编辑:
reviews.groupby('business_id')['stars'].agg({'greater':lambda val: (val > 3).sum()})