我需要查询弹性索引中某个字段的所有值.

GET index/_search
{
    "aggs" : {
        "All_IDs" : {
            "terms" : { "field" : "ID", "size":10000 }
        }
    },
    "size" : 0
}

答复:

"aggregations" : {
    "All_IDs" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "XX05215",
          "doc_count" : 4560
        },
        {
          "key" : "XX05216",
          "doc_count" : 3364
        },
        {
          "key" : "E1004903",
          "doc_count" : 2369
        }....

太好了!

es = Elasticsearch(
    hosts = [{'host': host, 'port': 443},],
    http_auth = awsauth,
    use_ssl = True,
    verify_certs = True,
    connection_class = RequestsHttpConnection
)


query = {
    
        "aggs" : {
            "All_IDs" : {
                "terms" : { "field" : "ID", "size":10000 }
            }
        },
        "size" : 0
    }

response = es.search( index='index', body=query, size=9999 )

我怎样才能以与控制台中相同的方式在python中进行查询,并仅检索所需的ID?

推荐答案

问题在于查询请求中传递的size个参数,如下面的请求所示.

es.search( index='index', body=query, size=9999 )

删除后,它使用在查询体中传递的size参数.

Python相关问答推荐

通过交换 node 对链接列表进行 Select 排序

将HLS纳入媒体包

如何使用SubProcess/Shell从Python脚本中调用具有几个带有html标签的参数的Perl脚本?

比较两个数据帧并并排附加结果(获取性能警告)

为什么符号没有按顺序添加?

将图像拖到另一个图像

如何在python polars中停止otherate(),当使用when()表达式时?

如何设置视频语言时上传到YouTube与Python API客户端

如何使用Pandas DataFrame按日期和项目汇总计数作为列标题

无法连接到Keycloat服务器

Django—cte给出:QuerySet对象没有属性with_cte''''

如何在FastAPI中为我上传的json文件提供索引ID?

如何从列表框中 Select 而不出错?

* 动态地 * 修饰Python中的递归函数

人口全部乱序 - Python—Matplotlib—映射

pysnmp—lextudio使用next()和getCmd()生成器导致TypeError:tuple对象不是迭代器''

如何删除重复的文字翻拍?

如果有2个或3个,则从pandas列中删除空格

将数字数组添加到Pandas DataFrame的单元格依赖于初始化

将像素信息写入文件并读取该文件