优化解析 5000 万行 MySQL 表的请求

发布于01月02日

我有一个请求需要在特定时间范围内多次处理，我的实现正在工作，但我的用户群每天都在增长，数据库的CPU负载和执行查询所用的时间每天都在增加

以下是请求:

SELECT bill.* FROM billing bill
            INNER JOIN subscriber s ON (s.subscriber_id = bill.subscriber_id) 
            INNER JOIN subscription sub ON(s.subscriber_id = sub.subscriber_id)
            WHERE s.status = 'C' 
            AND bill.subscription_id = sub.subscription_id                      
            AND sub.renewable = 1
            AND (hour(sub.created_at) > 1 AND hour(sub.created_at) < 5 )
            AND sub.store = 'BizaoStore'
            AND (sub.purchase_token = 'myservice' or sub.purchase_token = 'myservice_wait' ) 
            AND bill.billing_date > '2022-12-31 07:00:00' AND bill.billing_date < '2023-01-01 10:00:00'
            AND (bill.billing_value = 'not_ok bizao_tobe' or bill.billing_value =  'not_ok BILL010 2' or bill.billing_value =  'not_ok BILL010' or bill.billing_value = 'not_ok BILL010 3')
            AND (SELECT MAX(bill2.billing_date)
                FROM billing bill2
                WHERE bill2.subscriber_id = bill.subscriber_id
                AND bill2.subscription_id = bill.subscription_id 
                AND bill2.billing_value = 'not_ok bizao_tobe') 
            = bill.billing_date order by sub.created_at DESC LIMIT 300;

该请求在两个不同的服务器上执行，每个服务器处理一个特定的服务. 在每台服务器中，请求每分钟运行8次(持续约3小时) 8次中的每一次都有这样一条不同的时间线:

AND (hour(sub.created_at) >  1 AND hour(sub.created_at) < 5 )

我这样做是为了可以将我的用户群分成8个，并更有效地处理请求. 此外，我一次只需要处理300个用户，因为我必须 for each 用户呼叫的第三方服务器不是很稳定，有时可能需要很长时间才能做出响应

计费表统计了大约50.000.000个条目，以下是列和索引的模式:

Subscriber table is around 2.000.000, columns scheme and indexes:

And finally subscription table, 2.500.000 rows, scheme and indexes:

作为更多的信息，我在优化测试期间注意到，如果我在请求中添加了这样一个事实，即我想要的数据在特定ID上带有"BILLING_ID"，它将运行得非常快.基本上，我认为最耗时的是解析50.000.000行表.

我确实(或者至少我试着)用时间来优化我的请求，以提高效率，但到目前为止，我有点坚持这样做.

MySQL版本为5.7.38

谢谢你的帮忙

SELECT MAX(billing_date) billing_date, subscriber_id, subscription_id FROM billing WHERE billing_value = 'not_ok bizao_tobe' GROUP BY subscriber_id, subscription_id

SELECT bill.* FROM billing bill JOIN subscriber s ON s.subscriber_id = bill.subscriber_id JOIN subscription sub ON s.subscriber_id = sub.subscriber_id AND bill.subscription_id = sub.subscription_id JOIN ( SELECT MAX(billing_date) billing_date, subscriber_id, subscription_id FROM billing WHERE billing_value = 'not_ok bizao_tobe' GROUP BY subscriber_id, subscription_id ) latest ON bill.subscriber_id = latest.subscriber_id AND bill.subscription_id = latest.subscription_id AND bill.billing_date = latest.billing_date WHERE s.status = 'C' AND (hour(sub.created_at) > 1 AND hour(sub.created_at) < 5 ) AND sub.renewable = 1 AND sub.store = 'BizaoStore' AND sub.purchase_token IN ('myservice', 'myservice_wait' ) AND bill.billing_value IN ( 'not_ok bizao_tobe', 'not_ok BILL010 2', 'not_ok BILL010', 'not_ok BILL010 3') AND bill.billing_date > '2022-12-31 07:00:00' AND bill.billing_date < '2023-01-01 10:00:00' ORDER BY sub.created_at DESC LIMIT 300;

优化解析 5000 万行 MySQL 表的请求

推荐答案

Mysql相关问答推荐

左联接重复问题

根据当前表列的值，从SQL中的另一个表中获取数据

MySQL RDS ALTER TABLE ENUM短暂中断了我的数据库连接

运行简单查询时Prisma预准备语句错误

MySQL滑动窗口动态间隔？

对匹配两个或多个表的表结果进行排序

如果其中一个表为空，则 mysql 中的查询会给出 0 个结果

在 MySQL 中跨日期和位置计算和排序实体的共现

为什么order by子句可以利用索引？

Mysql，显示谁已经和没有 Select 退出巴士服务

Golang Gorm：相同的查询构造不同，抛出不同的结果

如何查看打开了多少 MySQL 连接？

字符ي和ی以及波斯语的区别 - Mysql

哪个更好 - 许多小桌子或一张大桌子？

将 mySQL 查询作为 cron 作业(job)运行？

用户 'User'@'%' 和 'User'@'localhost' 不一样吗？

使用 PHP 和 MySQL 存储和显示 unicode 字符串 (हिन्दी)

Mysql中int(10)的最大大小是多少

MySQL DAYOFWEEK() - 我的一周从星期一开始

从另一个表中 Select 具有 id 的行