利用PostgreSQL查询中表的顺序来计算包含每次时间的时间范围

发布于04月18日

我有一张表logs_bl_sj，由startdate订购:

bundesland	startdate	enddate
'Hessen'	2015-02-26 16:22:21	2015-02-26 16:31:31
'Hessen'	2015-10-20 22:34:54	2015-10-20 22:35:03
'Bremen'	2015-10-20 22:35:50	2015-10-20 22:37:03
...

我想为每一行r查找该表中存在多少行x，其中:

x.startdate <= r.startdate、r.startdate < x.enddate和r.bundesland = x.bundesland

换句话说，对于每个startdate s，我想找到包含s的时间范围[a, b)的数量，与bundesland的值相同(始终至少为1:s始终包含在[s, b)中).

请注意表的顺序是多么有用:对于每一行，该行后面的行将不计数，因此甚至不应该判断.

如何通过PostgreSQL利用这一事实？即，如何让服务器在计算该行时忽略每一行后的所有行？

我即将获得正确数据的查询，但它没有上述优化.这是我拥有的:

SELECT bundesland, startdate, COUNT(time_range) FILTER (WHERE time_range @> startdate::timestamp) OVER (PARTITION BY bundesland)
FROM logs_bl_sj_timerange

其中logs_bl_sj_timerange从上算logs_bl_sj，但添加了列time_range，该列仅为tsrange和[startdate, enddate).

COUNT只是返回bundesland中time_ranges的数量.我预计bundesland中包含startdate的时间范围数.

额外的问题:通过程序方式完成这件事(例如在Python中)会更好吗？迭代排序的开始日期，可以保留运行计数，该计数根据存储的结束日期数组而变化..而PostgreSQL必须为每一行开始新的计数.

select *,(select count(*) from logs_bl_sj_timerange s2 where s1.bundesland = s2.bundesland and s1.startdate >= s2.startdate and s1.startdate < s2.enddate) from logs_bl_sj_timerange s1

利用PostgreSQL查询中表的顺序来计算包含每次时间的时间范围

推荐答案

Postgresql相关问答推荐

当通过PostgreSQL FDW中的视图使用时，年龄函数的计算方式不同

如何在查询空字段时设置pgtype.comb为默认值？

包含JSONB属性的过滤器的索引策略

在Docker容器内的Postgres，如何通过Promail将JSON登录到Loki？

将列类型从文本[]更改为jsonb[]

Postgres：创建分区需要很长时间

Gorm 中的更新将created_at、updated_at 作为默认时间

Postgres数据库系统已准备好接受连接和docker compose

是否可以短时间运行 VACUUM FULL 并获得一些好处？

将 postgres 从属提升为主 node

如何将两条线几何连接成一条记录？

如何将 grafana 与 Google Cloud SQL 集成

我可以使用 Rails 将数组存储在 hstore 中吗

Postgres 表中列的顺序会影响性能吗？

Postgresql - 更新规则 - 可能有一个最后修改日期，自动更新该行的on update？

使用 RPostgreSQL 写入特定模式

PG：：ConnectionBad FATAL：role "Myname" does not exist

错误：prepared statement "S_1" already exists

Postgresql：备份所有表 struct ，但只备份少数数据表

pg_restore 目录错误