我正在使用http请求使用Elasticearch,我想看看是否有一种方法可以在将文档发送到客户端之前对文档进行分组.
作为背景,Elasticseach每天大约有3000万个文档,而且同一文档会连续被垃圾邮件发送数百次.我想要一种方法将这数百条消息分组到一个唯一的日志(log)中,这样我就不必在http请求中发送数百个相同的文档.
此外,如果您能在ElasticSearch方面标记垃圾邮件,另一件事将会有所帮助.如果文档立即出现数百次,有没有办法在ElasticSearch中将值设置为垃圾邮件,或者在客户端设置该值.
我目前正在通过聚合研究唯一文档,这可能是一个开始,但我也可能有一个问题,即它只返回唯一文档的计数.