我有一个图形,它在x轴上有百分比,在y轴上有位置.数据帧很大(超过200万行),所以我将点分组到10k个箱中,并绘制出箱的平均百分比.我使用的代码如下:
ggplot(data, aes(norm_location, percentage, colour = class)) +
stat_summary_bin(fun = "mean",
geom="point",
bins = 10000) +
由于数据的大小,每次我需要更改与图形相关的某些内容(标题、轴名称、 colored颜色 等)时,运行此代码需要很长时间.有没有方法将箱的值存储在一个有10k行的较小数据框中,并使用它来代替 Big Data ?怎样才能更有效地生成这个图呢?
谢谢!